信息檢索結(jié)課論文

信息檢索結(jié)課論文

ID:28049541

大?。?4.00 KB

頁數(shù):10頁

時(shí)間:2018-12-07

信息檢索結(jié)課論文_第1頁
信息檢索結(jié)課論文_第2頁
信息檢索結(jié)課論文_第3頁
信息檢索結(jié)課論文_第4頁
信息檢索結(jié)課論文_第5頁
資源描述:

《信息檢索結(jié)課論文》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、.信息檢索結(jié)課論文題目:基于網(wǎng)絡(luò)的信息檢索應(yīng)用研究學(xué)  院:計(jì)算機(jī)科學(xué)與工程學(xué)院專業(yè):軟件工程學(xué)生姓名:學(xué)號(hào):授課教師:-..基于網(wǎng)絡(luò)的信息檢索應(yīng)用研究XX(XX大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,XXXXX)摘要:網(wǎng)絡(luò)信息檢索一般指因特網(wǎng)檢索,是通過網(wǎng)絡(luò)接口軟件,用戶可以在一終端查詢各地上網(wǎng)的信息資源。這一類檢索系統(tǒng)都是基于互聯(lián)網(wǎng)的分布式特點(diǎn)開發(fā)和應(yīng)用的,即:數(shù)據(jù)分布式存儲(chǔ),大量的數(shù)據(jù)可以分散存儲(chǔ)在不同的服務(wù)器上;用戶分布式檢索,任何地方的終端用戶都可以訪問存儲(chǔ)數(shù)據(jù);數(shù)據(jù)分布式處理,任何數(shù)據(jù)都可以在網(wǎng)上的任何地方進(jìn)行處理。本文對(duì)基于網(wǎng)絡(luò)的信息檢索應(yīng)用進(jìn)行研究,并分析了其局限。關(guān)鍵詞:信

2、息檢索;網(wǎng)絡(luò);分布式;中圖分類號(hào):G354文獻(xiàn)標(biāo)識(shí)碼.AResearchontheapplicationofinformationbasedonNetworkXX(xx)Abstract:networkinformationretrievalgenerallyreferstotheInternetsearch,isthroughthenetworkinterfacesoftware,userscanquerytheinformationresourcesintheInternetinaterminal.ThiskindofretrievalsystemisbasedontheI

3、nternet.Thatis,thedatacanbedistributedandstoredindifferentservers.Userscanaccessthestoragedata.DatacanbeprocessedinanypartoftheInternet.Inthispaper,westudytheapplicationofinformationretrievalbasedonnetwork,andanalyzethedevelopmenttrend.Keywords:informationretrieval;network;distributed;?1??網(wǎng)絡(luò)

4、信息檢索簡介?隨著信息技術(shù)的飛速發(fā)展,信息已成為全社會(huì)的重要資源,對(duì)信息的占有程度及信息處理水平的先進(jìn)程度已成為衡量一個(gè)國家或地區(qū)現(xiàn)代化程度的重要標(biāo)志,而網(wǎng)絡(luò)上豐富的信息在更大程度上改變了人們的工作和生活的方式。Internet是當(dāng)今世界上規(guī)模最大、覆蓋面最廣、信息資源最豐富、發(fā)展最為迅速的信息網(wǎng)絡(luò),基于Internet的網(wǎng)絡(luò)信息檢索的研究,無論對(duì)研究人員還是一般用戶來說,都有著很強(qiáng)的現(xiàn)實(shí)性和實(shí)用性。???-..1.1??信息檢索概念?信息檢索是指將信息按一定的方式組織和存儲(chǔ)起來,并根據(jù)信息用戶的信息需求查找所需信息的過程和技術(shù)。人們獲取信息源的方式主要有:①傳統(tǒng)的信息檢索方法

5、,通過人工查詢在圖書館等提供文獻(xiàn)的機(jī)構(gòu)進(jìn)行文獻(xiàn)的查詢和獲取活動(dòng);②聯(lián)機(jī)信息檢索相對(duì)于前者來說具有實(shí)時(shí)性、完整性、共享性、廣泛性等優(yōu)點(diǎn);③網(wǎng)絡(luò)信息檢索是指通過網(wǎng)絡(luò)信息檢索工具檢索存在于Internet信息空間中各種類型的網(wǎng)絡(luò)信息資源。???1.2??網(wǎng)絡(luò)信息檢索的原理?網(wǎng)絡(luò)信息檢索工具是網(wǎng)絡(luò)信息檢索技術(shù)的實(shí)物體現(xiàn)。目前,常用的網(wǎng)絡(luò)信息檢索模型有布爾邏輯模型、模糊邏輯模型和概率模型等幾種方式。?①?布爾邏輯模型??這是一種簡單而常用的嚴(yán)格匹配模型。用戶可以根據(jù)檢索項(xiàng)在文檔中的布爾邏輯關(guān)系提交查詢,搜索工具根據(jù)事先建立的倒排文檔結(jié)構(gòu)確定查詢結(jié)果。標(biāo)準(zhǔn)的布爾邏輯模型為二元邏輯,所搜索的

6、文檔要么與查詢相關(guān),要么與查詢無關(guān)。利用這種模型進(jìn)行查詢,其查詢結(jié)果一般沒有按照內(nèi)容的相關(guān)特性排序。?②?模糊邏輯模型??它在查詢結(jié)果處理中引進(jìn)了模糊邏輯比較,并且按照相關(guān)的優(yōu)先次序排列查詢結(jié)果,這樣就可以克服布爾邏輯模型信息查詢結(jié)果的無序性。?③?概率模型??它是基于貝葉斯概率原理而提出的,根據(jù)詞條、文檔間的內(nèi)在聯(lián)系,利用詞條間和詞條與文檔間的概率相依性來進(jìn)行信息檢索。2??搜索引擎?搜索引擎是目前使用最為頻繁的一種網(wǎng)絡(luò)信息檢索工具。與其他工具相比,它的檢全率和檢準(zhǔn)率都比較高,具有很強(qiáng)的使用價(jià)值和廣泛的應(yīng)用前景。???2.1??搜索引擎的工作原理?作為一種www站點(diǎn)資源和其它

7、網(wǎng)絡(luò)資源進(jìn)行組織和檢索的檢索工具,搜索引擎的檢索機(jī)制一般包括數(shù)據(jù)采集和標(biāo)引機(jī)制、數(shù)據(jù)組織機(jī)制和用戶檢索機(jī)制。????①?數(shù)據(jù)采集標(biāo)引機(jī)制按照一定規(guī)律和方式對(duì)網(wǎng)絡(luò)上www站點(diǎn)進(jìn)行搜索,并將搜索到的www頁面信息存入搜索引擎的臨時(shí)數(shù)據(jù)庫中。?②?數(shù)據(jù)組織據(jù)組織機(jī)制的主要功能是對(duì)www頁面信息進(jìn)行整理以形成規(guī)范的頁面索引,并建立相應(yīng)的索引數(shù)據(jù)庫。?③?索引數(shù)據(jù)庫是用戶進(jìn)行檢索的基礎(chǔ),它的數(shù)據(jù)質(zhì)量直接影響到檢索效果,而搜索引擎的數(shù)據(jù)采集標(biāo)和標(biāo)引機(jī)制又是決定數(shù)據(jù)庫質(zhì)量的關(guān)鍵技術(shù)。?-..④?用戶檢索機(jī)

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。