資源描述:
《基于solr的海量數(shù)據(jù)并行索引及搜索緩存研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、巧一?r.>分類號(hào)密級(jí)UDC編號(hào).穎i學(xué)位論文基子Solr的緣量教is拜巧殺引義披條緩存研義學(xué)位申請(qǐng)人姓名;?;瘽桑墸墸崳娚暾?qǐng)學(xué)位學(xué)生類別:全巧網(wǎng)碩壬申請(qǐng)學(xué)位學(xué)科專業(yè):計(jì)鼻機(jī)軟件與理冷指導(dǎo)教師姓名:王抹平到教援碩去學(xué)位論文fMASTERSTHKSISj碩±學(xué)位論文基于Solr的海量數(shù)據(jù)并行索引及搜索緩存研究論文作者:巧江澤指測(cè)巧:王林平副搬學(xué)科專業(yè):計(jì)巧凡軟件與理論研究方向:移動(dòng)Web應(yīng)用華中師范大學(xué)計(jì)觀學(xué)院201
2、6年5月碩去學(xué)位拖文’HE?MAST械《TSISResearchonParallelIndexingandCacheofSearchinwithMassivegDatabasedonSolrAThesisSubmitedinPartialFulfillmentoftheRequirementFor化eM.SDegreeinComputerSoftwareandTheoryByMeiJiangzePostgraduatePr
3、ogramSchoolofComputerCentralChinaNormalUniversitySuervisor:WanLininpgpg八^n^AcademicTitle:AssociateProfessorSinature^/gyArovedppMa.2016y碩去學(xué)位論文TER’STS:MASHEW*華中師滄大學(xué)學(xué)佐^^丈為準(zhǔn)1性若巧和使用狡權(quán)化明廣準(zhǔn)1牲京巧,本人鄭重聲明:所呈交的學(xué)位論文,是本人在導(dǎo)師指導(dǎo)下獨(dú)立進(jìn)行研究工作
4、所取得的硏究成果。除文中己經(jīng)標(biāo)明引用的內(nèi)容外,本論文不包含任何其他個(gè)人或集體己經(jīng)發(fā)表或撰寫過的研究成果。對(duì)本文的研巧做出貢獻(xiàn)的個(gè)人和集體,均已在文中W明確方式標(biāo)明。本聲明的法律結(jié)果由本人承擔(dān)。//作者簽名:^化日期:以年文月3/日學(xué)侄冷文狀權(quán)使用換權(quán)書本學(xué)位論文作者完全了解學(xué)輔關(guān)保留、使用學(xué)位論文的規(guī)定,即:學(xué)腕權(quán)保留并向國家有關(guān)部口或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)華中師范大學(xué)可從格本學(xué)位論文的全部或部分內(nèi)容編入有庫進(jìn)行檢索,可W采用影印、縮印或掃描等復(fù)制手段
5、保存和匯編本學(xué)位論文。同意華中師范大學(xué)可W用不同方式在不同媒體上發(fā)表、傳播學(xué)位論文的全部或部分內(nèi)容。來扛作者簽名:如叫導(dǎo)師簽名:方碑又/日期:i:年j月日日期:《年i月i;本""人已經(jīng)認(rèn)真閱讀CALIS高校學(xué)位論文全文數(shù)據(jù)庫發(fā)布章程,同意將本人""""的學(xué)位論文提交CALIS髙校學(xué)位論文全文數(shù)據(jù)庫中全文發(fā)布,并可按章程一年中的規(guī)定享受相關(guān)權(quán)益。同意論義播々后滯后=□半巧:□=□二年發(fā)布。作者簽名:撕i導(dǎo)師簽名:節(jié)妹爭日期:w/年女月V日日期:)<?<年^:月日碩去學(xué)位論文
6、’MASTERSTHESIS巧要隨著互聯(lián)網(wǎng)信息技術(shù)的快速發(fā)展,企業(yè)信息化程度不斷提高,各個(gè)行業(yè)內(nèi)的數(shù)據(jù)信息急劇増長,而且信息的存在形式也越來越多樣。這也使得如何使用戶能夠快速、精確的從企業(yè)的海量數(shù)據(jù)中找出所需要的關(guān)鍵信息變得越來越重要,而解決這一個(gè)問題的關(guān)鍵就是搜索引擎技術(shù)。隨著開源企業(yè)級(jí)搜索應(yīng)用服務(wù)器Solr的出現(xiàn),越來越多的企業(yè)開始構(gòu)建W此為基礎(chǔ)的海量數(shù)據(jù)搜索服務(wù)系統(tǒng)。傳統(tǒng)的捜索方式是使用文本數(shù)據(jù)庫,雖然文本數(shù)據(jù)庫和捜索引擎的技術(shù)基礎(chǔ)都是全文檢索技術(shù),但是文本數(shù)據(jù)庫在處理海量數(shù)據(jù)方面
7、的能力無法跟搜索引擎相媳美。搜索引擎采用服務(wù)器集群和分布式計(jì)算的策略,能夠處理較大的數(shù)據(jù)量。在海量數(shù)據(jù)的背景下,如何更好地利用開源Solr捜索引擎服務(wù)器搭建起快速高效一的捜索引擎也成為重要的研究課題之。本文針對(duì)這種需求,在基于Solr捜索引擎服務(wù)器的基礎(chǔ)上,進(jìn)行海量數(shù)據(jù)捜索服務(wù)的研巧。本文首先分析搜索引擎服務(wù)器集群的運(yùn)行特點(diǎn),運(yùn)用隨機(jī)過程中的排隊(duì)模型對(duì)集群系統(tǒng)的可用性進(jìn)行分析。接著在可用性的基礎(chǔ)上深入研究搜索引擎的索引構(gòu)建和捜索索引兩個(gè)關(guān)鍵過程。索引構(gòu)建的過程是將文本轉(zhuǎn)化為能夠被搜索引擎捜
8、索的索引文件。本文在分析的基礎(chǔ)上提出并行索引的方式,將文檔構(gòu)建索引過程中的部分串行操作并行化,并通過性能負(fù)載均衡的策略提高各節(jié)點(diǎn),應(yīng)對(duì)海量數(shù)據(jù)構(gòu)建索引的場(chǎng)景的資源利用率,加速索引的構(gòu)建。對(duì)于搜索的l。,r的捜索過程模型將頻繁捜索的熱過程本文首先分析So,提出分級(jí)緩存模型點(diǎn)數(shù)據(jù)放置在緩存中,,并對(duì)緩存數(shù)