信息檢索結(jié)課論文1

信息檢索結(jié)課論文1

ID:41942211

大小:62.50 KB

頁(yè)數(shù):10頁(yè)

時(shí)間:2019-09-04

信息檢索結(jié)課論文1_第1頁(yè)
信息檢索結(jié)課論文1_第2頁(yè)
信息檢索結(jié)課論文1_第3頁(yè)
信息檢索結(jié)課論文1_第4頁(yè)
信息檢索結(jié)課論文1_第5頁(yè)
資源描述:

《信息檢索結(jié)課論文1》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。

1、信息檢索結(jié)課論文題目:基丁?網(wǎng)絡(luò)的信息檢索應(yīng)用研究學(xué)院:計(jì)算機(jī)科學(xué)與工程學(xué)院專(zhuān)業(yè):軟件工程學(xué)生姓名:學(xué)號(hào):授課教師:基于網(wǎng)絡(luò)的信息檢索應(yīng)用研究王揚(yáng)波(武漢大學(xué)計(jì)算機(jī)學(xué)院電子與通信工程)摘要:網(wǎng)絡(luò)信息檢索一般指因特網(wǎng)檢索,是通過(guò)網(wǎng)絡(luò)接口軟件,用戶(hù)可以在一終端杏詢(xún)各地上網(wǎng)的信息資源。這一類(lèi)檢索系統(tǒng)都是基于互聯(lián)網(wǎng)的分布式特點(diǎn)開(kāi)發(fā)和應(yīng)用的,即:數(shù)據(jù)分布式存儲(chǔ),大量的數(shù)據(jù)可以分散存儲(chǔ)在不同的服務(wù)器上;用戶(hù)分布式檢索,任何地方的終端用戶(hù)都可以訪(fǎng)問(wèn)存儲(chǔ)數(shù)據(jù);數(shù)據(jù)分布式處理,任何數(shù)據(jù)都可以在網(wǎng)上的任何地方進(jìn)行處理。本文對(duì)基丁?網(wǎng)絡(luò)的信息檢索應(yīng)川進(jìn)行研究,并分析了其局

2、限。關(guān)鍵詞:信息檢索;網(wǎng)絡(luò);分布式;ResearchontheapplicationofinformationbasedonNetworkxx(XX)Abstract:networkinformationretrievalgenerallyrefersiotheInternetsearch,isthroughthenetworkinterfacesoftware,userscanquerytheinformationresourcesintheInternetinaterminal.Thiskindofretrievalsystemisbasedon

3、theInternet.Thatis,thedatacanbedistributedandstoredindifferentservers.Userscanaccessthestoragedata.DatacanbeprocessedinanypartoftheInternet?Inthispaper,vvestudytheapplicationofinformationretrievalbasedonnetwork,andanalyzethedevelopmenttrend?Keywords:informationretrieval;network

4、;distributed;1網(wǎng)絡(luò)信息檢索簡(jiǎn)介隨著信息技術(shù)的飛速發(fā)展,信息已成為全社會(huì)的重要資源,對(duì)信息的占有程度及信息處理水平的先進(jìn)程度已成為衡量一個(gè)國(guó)家或地區(qū)現(xiàn)代化程度的重要標(biāo)志,而網(wǎng)絡(luò)上豐富的信息在更大程度上改變了人們的工作和生活的方式。巾ternet是當(dāng)今世界上規(guī)模最大、覆蓋面最廣、信息資源最豐富、發(fā)展最為迅速的信息網(wǎng)絡(luò),基TInternet的網(wǎng)絡(luò)信息檢索的研究,無(wú)論對(duì)研究人員還是一般用戶(hù)來(lái)說(shuō),都冇著很強(qiáng)的現(xiàn)實(shí)性和實(shí)用性。1.1信息檢索概念信息檢索是指將信息按一定的方式組織和存儲(chǔ)起來(lái),并根據(jù)信息用八的信息需求查找所需信息的過(guò)程和技術(shù)。人們獲取信

5、息源的方式主要有:①傳統(tǒng)的信息檢索方法,通過(guò)人工查詢(xún)?cè)趫D書(shū)館等提供文獻(xiàn)的機(jī)構(gòu)進(jìn)行文獻(xiàn)的查詢(xún)和獲取活動(dòng);②聯(lián)機(jī)信息檢索相對(duì)于前者來(lái)說(shuō)具有實(shí)時(shí)性、完整性、共享性、廣泛性等優(yōu)點(diǎn);③網(wǎng)絡(luò)信息檢索是指通過(guò)網(wǎng)絡(luò)信息檢索工具檢索存在于Internet信息空間屮各種類(lèi)型的網(wǎng)絡(luò)信息資源。1.1網(wǎng)絡(luò)信息檢索的原理網(wǎng)絡(luò)信息檢索工具是網(wǎng)絡(luò)信息檢索技術(shù)的實(shí)物體現(xiàn)。H前,常用的網(wǎng)絡(luò)信息檢索模型有布爾邏輯模型、模糊邏輯模型和概率模型等幾種方式。①布爾邏輯模型這是一?種簡(jiǎn)單而常用的嚴(yán)格I兀配模型。用戶(hù)可以根據(jù)檢索項(xiàng)在文檔中的布爾邏輯關(guān)系提交查詢(xún),搜索工具根據(jù)事先建立的倒排文檔結(jié)構(gòu)確

6、定查詢(xún)結(jié)果。標(biāo)準(zhǔn)的布爾邏輯模型為二元邏輯,所搜索的文檔要么與査詢(xún)相關(guān),要么與查詢(xún)無(wú)關(guān)。利用這種模型進(jìn)行查詢(xún),其查詢(xún)結(jié)果一般沒(méi)有按照內(nèi)容的相關(guān)特性排序。②模糊邏輯模型它在查詢(xún)結(jié)果處理中引進(jìn)了模糊邏輯比較,并R按照相關(guān)的優(yōu)先次序排列杳詢(xún)結(jié)果,這樣就可以克服布爾邏輯模型信息杏詢(xún)結(jié)果的無(wú)序性。③概率模型它是基于貝葉斯概率原理而提出的,根據(jù)詞條、文檔間的內(nèi)在聯(lián)系,利用詞條間和詞條與文檔間的概率相依性來(lái)進(jìn)行信息檢索。2搜索引擎搜索引擎是目前使用最為頻繁的--種網(wǎng)絡(luò)信息檢索工具。與其他工具相比,它的檢全率和檢準(zhǔn)率祁比較髙,具有很強(qiáng)的使用價(jià)值和廣泛的應(yīng)用麗景。2.1

7、搜索引擎的工作原理作為一種WWW站點(diǎn)資源和艾它網(wǎng)絡(luò)資源進(jìn)行組織和檢索的檢索工具,搜索引擎的檢索機(jī)制一般包括數(shù)據(jù)采集和標(biāo)引機(jī)制、數(shù)據(jù)組織機(jī)制和用戶(hù)檢索機(jī)制。①數(shù)據(jù)采集標(biāo)引機(jī)制按照一定規(guī)律和方式對(duì)網(wǎng)絡(luò)上WWW站點(diǎn)進(jìn)行搜索,并將搜索到的WWW頁(yè)而信息存入搜索引擎的臨時(shí)數(shù)據(jù)庫(kù)中。②數(shù)據(jù)組織據(jù)組織機(jī)制的主耍功能是對(duì)WWW頁(yè)面信息進(jìn)行整理以形成規(guī)范的頁(yè)面索引,并建立相應(yīng)的索引數(shù)據(jù)庫(kù)。③索引數(shù)據(jù)庫(kù)是用戶(hù)進(jìn)行檢索的基礎(chǔ),它的數(shù)據(jù)質(zhì)最肓接影響到檢索效果,而搜索引擎的數(shù)據(jù)采集標(biāo)和標(biāo)引機(jī)制乂是決定數(shù)據(jù)庫(kù)質(zhì)量的關(guān)鍵技術(shù)。④用八檢索機(jī)制幫助用八以一?定方式檢索引擎的索引數(shù)據(jù)庫(kù)

8、,以獲得符合用八需要的WWW站點(diǎn)或頁(yè)而。2.2搜索引擎的分類(lèi)按照用戶(hù)杳找的途徑劃分,可將搜索引擎分為如下幾種

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶(hù)上傳,版權(quán)歸屬用戶(hù),天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶(hù)請(qǐng)聯(lián)系客服處理。