游戲搜索引擎 --搜索引擎DEMO系統(tǒng)中Lucene索引的實(shí)現(xiàn)---畢業(yè)論文.doc

游戲搜索引擎 --搜索引擎DEMO系統(tǒng)中Lucene索引的實(shí)現(xiàn)---畢業(yè)論文.doc

ID:11175588

大?。?.25 MB

頁數(shù):46頁

時(shí)間:2018-07-10

游戲搜索引擎 --搜索引擎DEMO系統(tǒng)中Lucene索引的實(shí)現(xiàn)---畢業(yè)論文.doc_第1頁
游戲搜索引擎 --搜索引擎DEMO系統(tǒng)中Lucene索引的實(shí)現(xiàn)---畢業(yè)論文.doc_第2頁
游戲搜索引擎 --搜索引擎DEMO系統(tǒng)中Lucene索引的實(shí)現(xiàn)---畢業(yè)論文.doc_第3頁
游戲搜索引擎 --搜索引擎DEMO系統(tǒng)中Lucene索引的實(shí)現(xiàn)---畢業(yè)論文.doc_第4頁
游戲搜索引擎 --搜索引擎DEMO系統(tǒng)中Lucene索引的實(shí)現(xiàn)---畢業(yè)論文.doc_第5頁
資源描述:

《游戲搜索引擎 --搜索引擎DEMO系統(tǒng)中Lucene索引的實(shí)現(xiàn)---畢業(yè)論文.doc》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫

1、本科畢業(yè)論文題目:游戲搜索引擎--搜索引擎DEMO系統(tǒng)中Lucene索引的實(shí)現(xiàn)Theme:GameSearchEngine--ExploreandResearchSearchEnginebasedongame姓名:學(xué)號(hào):學(xué)  院:軟件學(xué)院系:軟件工程專業(yè):軟件工程年級(jí):指導(dǎo)教師:年月摘 要網(wǎng)絡(luò)中的資源非常豐富,但是如何有效的搜索信息是一件很困難的事情。建立搜索引擎是解決問題的最好方法。本文通過講解如何使用Heritrix和Lucene,Web開發(fā),逐步地帶領(lǐng)讀者親手構(gòu)建搜索引擎網(wǎng)站。為了深刻的理解這些技術(shù),

2、本人還實(shí)現(xiàn)了一個(gè)自己的搜索引擎—游戲搜索引擎。游戲搜索引擎是一個(gè)基于游戲產(chǎn)業(yè)的搜索引擎。游戲搜索引擎由三大部分組成:抓取系統(tǒng),索引系統(tǒng)和搜索系統(tǒng)。抓取系統(tǒng),其實(shí)也就是網(wǎng)絡(luò)爬蟲,負(fù)責(zé)從指定的WEB頁面按照超連接進(jìn)行解析、抓取數(shù)據(jù),為后續(xù)階段提供數(shù)據(jù);索引系統(tǒng),把抓來的信息建立類似書目的數(shù)據(jù)文件,以便于實(shí)現(xiàn)高速檢索;搜索系統(tǒng),就是以WEB的形式為用戶提供檢索的功能。本設(shè)計(jì)使用MyEclipse開發(fā)工具在網(wǎng)絡(luò)上搭建一個(gè)為用戶提供查詢游戲信息的web網(wǎng)站。論文首先介紹了搜索引擎的相關(guān)知識(shí),以及系統(tǒng)設(shè)計(jì)所使用到的技術(shù)

3、原理和工具。在系統(tǒng)的總體設(shè)計(jì)中描述了系統(tǒng)的主要功能模塊,以及各個(gè)模塊的一些相關(guān)的知識(shí),如如何使用Heritrix來抓取網(wǎng)頁等。在詳細(xì)設(shè)計(jì)中具體描述了各個(gè)子模塊的功能,以及這些模塊的構(gòu)建,基本上包含了一個(gè)搜索引擎的開發(fā)流程。之后,給出了系統(tǒng)的運(yùn)行結(jié)果—系統(tǒng)的歡迎界面、關(guān)鍵字提示信息和系統(tǒng)的檢索結(jié)果。論文在最后做出了設(shè)計(jì)的總結(jié),并列出了參考資料。關(guān)鍵詞:搜索引擎;HeritrixAbstractResourcesisveryrichinnetwork,buthowtoeffectivelysearchinfor

4、mationisaverydifficulttask.Theestablishmentofasearchengineisthebestwaytosolvetheproblem.Inthispaper,ontheuseofHeritrixandLucene,Webdevelopment,leadingthereaderstepbysteptobuildingasearchenginesitepersonally.Inordertodeeplyunderstandthetechnology,Ialsoreali

5、zeditsownsearchengine-gamesearchengine.Gamesearchengineisasearchenginebasedonthegameindustry.Gamesearchenginehasthreemajorcomponents:systemcrawling,indexingandsearchsystem.Thecrawlingsystemis,infact,isthenetworkofreptiles,isresponsiblefortheWEBpagefromthes

6、pecifiedconnectioninaccordancewiththesuper-resolution,crawldata,providedataforfollow-upphase;indexsystemtobibliographicinformationoftheestablishmentofsimilardatafilesinordertoachievehigh-speedretrieval;searchsystem,theformofWEBistoprovideuserswithsearchfun

7、ction.TheMyEclipsedevelopmenttoolsdesignedforuseonthenetworkbuilttoprovideuserswithaqueryofthewebsitethegameinformation.Paperfirstintroducedtherelevanceofsearchengineknowledge,andsystemdesigntechnologyusedintheprinciplesandtools.Inthesystemdescribedintheov

8、eralldesignofthemainfunctionsofthesystemmodules,eachmoduleaswellassomerelevantknowledge,suchashowtouseHeritrixtocrawlwebpages.Inthedetaileddescriptionofthedesignofthespecificfunctionsofthevarioussub-modules,a

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。