基于oracle組件的數(shù)據(jù)采集與全文檢索系統(tǒng)設(shè)計與優(yōu)化

基于oracle組件的數(shù)據(jù)采集與全文檢索系統(tǒng)設(shè)計與優(yōu)化

ID:30788963

大?。?1.11 KB

頁數(shù):11頁

時間:2019-01-03

基于oracle組件的數(shù)據(jù)采集與全文檢索系統(tǒng)設(shè)計與優(yōu)化_第1頁
基于oracle組件的數(shù)據(jù)采集與全文檢索系統(tǒng)設(shè)計與優(yōu)化_第2頁
基于oracle組件的數(shù)據(jù)采集與全文檢索系統(tǒng)設(shè)計與優(yōu)化_第3頁
基于oracle組件的數(shù)據(jù)采集與全文檢索系統(tǒng)設(shè)計與優(yōu)化_第4頁
基于oracle組件的數(shù)據(jù)采集與全文檢索系統(tǒng)設(shè)計與優(yōu)化_第5頁
資源描述:

《基于oracle組件的數(shù)據(jù)采集與全文檢索系統(tǒng)設(shè)計與優(yōu)化》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫

1、基于Oracle組件的數(shù)據(jù)采集與全文檢索系統(tǒng)設(shè)計與優(yōu)化摘要:從應(yīng)用系統(tǒng)數(shù)據(jù)采集與全文檢索的需求出發(fā),結(jié)合權(quán)限控制,提出基于0racleTransparentGateway,OracleText的數(shù)據(jù)采集與全文檢索的設(shè)計和實現(xiàn)方案?;诖朔桨福剡M(jìn)行系統(tǒng)框架設(shè)計、采集存儲及數(shù)據(jù)庫設(shè)計,實現(xiàn)創(chuàng)建索引及檢索流程,最后給岀系統(tǒng)性能優(yōu)化方法,并對檢索速度和查準(zhǔn)率進(jìn)行測試分析。目前系統(tǒng)已上線運行,取得高效簡捷、運行穩(wěn)定的使用效果。關(guān)鍵詞:數(shù)據(jù)采集;OracleTransparentGateway;全文檢索;OracleText;性能優(yōu)化中圖分類號:TN911734;TP392文獻(xiàn)標(biāo)識碼:A

2、文章編號:1004?373X(2016)08?0037?04DesignandoptimizationofdataacquisitionandfuIRtextretrievalsystembasedonOraclecomponentYUANQinqinl,LIZhixun2,L?Lintaol(1.DepartmentofElectronicandInformationEngineeringsXijingUniversity,Xi'an710123,China;2.Xi'anAerospacePropulsionTestTechniqueInstitute,Xi"an710100

3、,China)Abstract:Proceedingfromtherequirementsofdataacquisitionandfull?textretrievalfortheapplicationsystem,andincombinationwiththeaccesscontrol,thedesignandimplementationschemeofdataacquisitionandfull?textretrievalbasedonOracleTransparentGatewayandOracleTextisproposed.Basedonthisscheme,thesys

4、temstructuredesign,collectionstorageanddatabasedesignareconductedemphatically.Theindexcreationandsearchprocedurewererealized?Attheendofthispaper,theoptimizationmethodofsystemperformanceisgiven,andtheretrievalspeedandprecisionratioofthesystemareanalyzed?Nowthesystemhasbeenrunonline,andachieved

5、theusingeffectwithhighefficiencyandstablerunning?Keywords:dataacquisition;OracleTransparentGateway;full?textretrieval;OracleText;performanceoptimizationo引言隨著信息化建設(shè)的不斷推進(jìn)以及信息技術(shù)的快速發(fā)展,為適應(yīng)多元化業(yè)務(wù)發(fā)展需要,多個業(yè)務(wù)系統(tǒng)隨之建設(shè),產(chǎn)生了大量的以不同方式存儲、依賴于不同數(shù)據(jù)庫管理系統(tǒng)的數(shù)據(jù)。例如業(yè)務(wù)數(shù)據(jù)分別存儲在SQLServer,Oracle數(shù)據(jù)庫中[1],在這些異構(gòu)數(shù)據(jù)庫[2]平臺上運行著業(yè)務(wù)相關(guān)的多種應(yīng)

6、用系統(tǒng)。如何在不影響現(xiàn)有系統(tǒng)運行的前提下,最大限度地利用信息資源,避免重復(fù)開發(fā),必須解決異構(gòu)數(shù)據(jù)庫的統(tǒng)一操作問題。如何快速有效地采集異構(gòu)數(shù)據(jù)庫中的信息,建立綜合信息資源庫,實現(xiàn)數(shù)據(jù)共享,是本文需要解決的問題之一。另外,面對綜合信息資源庫中的大量數(shù)據(jù),怎樣在業(yè)務(wù)應(yīng)用中實現(xiàn)快速、有效、全面的檢索效果,提高數(shù)據(jù)的利用性,也是本文需要解決的另一問題。本文圍繞基于J2EE技術(shù)架構(gòu)的多個業(yè)務(wù)應(yīng)用系統(tǒng)開展研究,其信息來源十分廣泛,包括現(xiàn)有的業(yè)務(wù)管理系統(tǒng)、文件系統(tǒng)、文檔資料等。而各個系統(tǒng)的數(shù)據(jù)存儲方式、存儲結(jié)構(gòu)、數(shù)據(jù)庫類型均不相同,如何在異構(gòu)的存儲環(huán)境下實現(xiàn)穩(wěn)定可靠的數(shù)據(jù)共享和數(shù)據(jù)采集是本文設(shè)計

7、的要點之一。同時,業(yè)務(wù)數(shù)據(jù)涵蓋日常應(yīng)用中的所有資料、文檔等信息,信息類型復(fù)雜多樣,包括結(jié)構(gòu)化信息、非結(jié)構(gòu)化信息、文件(DOC,PDF,txt,Excel,HTML)等多種格式。系統(tǒng)數(shù)據(jù)量隨著日積月累會越來越大,要在這樣大量復(fù)雜的數(shù)據(jù)中實現(xiàn)對多種類型信息的高效準(zhǔn)確檢索也是本文設(shè)計的另一要點?;谏鲜龇治觯疚牟捎昧薕racle數(shù)據(jù)庫的OracleTransparentGateway[3?4],OracleText[5?6]等技術(shù)。在設(shè)計采集檢索功能時,不僅要滿足異構(gòu)數(shù)據(jù)庫環(huán)境下數(shù)據(jù)

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。