信息檢索結(jié)課論文1

信息檢索結(jié)課論文1

ID:41942211

大?。?2.50 KB

頁數(shù):10頁

時間:2019-09-04

信息檢索結(jié)課論文1_第1頁
信息檢索結(jié)課論文1_第2頁
信息檢索結(jié)課論文1_第3頁
信息檢索結(jié)課論文1_第4頁
信息檢索結(jié)課論文1_第5頁
資源描述:

《信息檢索結(jié)課論文1》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。

1、信息檢索結(jié)課論文題目:基丁?網(wǎng)絡(luò)的信息檢索應(yīng)用研究學院:計算機科學與工程學院專業(yè):軟件工程學生姓名:學號:授課教師:基于網(wǎng)絡(luò)的信息檢索應(yīng)用研究王揚波(武漢大學計算機學院電子與通信工程)摘要:網(wǎng)絡(luò)信息檢索一般指因特網(wǎng)檢索,是通過網(wǎng)絡(luò)接口軟件,用戶可以在一終端杏詢各地上網(wǎng)的信息資源。這一類檢索系統(tǒng)都是基于互聯(lián)網(wǎng)的分布式特點開發(fā)和應(yīng)用的,即:數(shù)據(jù)分布式存儲,大量的數(shù)據(jù)可以分散存儲在不同的服務(wù)器上;用戶分布式檢索,任何地方的終端用戶都可以訪問存儲數(shù)據(jù);數(shù)據(jù)分布式處理,任何數(shù)據(jù)都可以在網(wǎng)上的任何地方進行處理。本文對基丁?網(wǎng)絡(luò)的信息檢索應(yīng)川進行研究,并分析了其局

2、限。關(guān)鍵詞:信息檢索;網(wǎng)絡(luò);分布式;ResearchontheapplicationofinformationbasedonNetworkxx(XX)Abstract:networkinformationretrievalgenerallyrefersiotheInternetsearch,isthroughthenetworkinterfacesoftware,userscanquerytheinformationresourcesintheInternetinaterminal.Thiskindofretrievalsystemisbasedon

3、theInternet.Thatis,thedatacanbedistributedandstoredindifferentservers.Userscanaccessthestoragedata.DatacanbeprocessedinanypartoftheInternet?Inthispaper,vvestudytheapplicationofinformationretrievalbasedonnetwork,andanalyzethedevelopmenttrend?Keywords:informationretrieval;network

4、;distributed;1網(wǎng)絡(luò)信息檢索簡介隨著信息技術(shù)的飛速發(fā)展,信息已成為全社會的重要資源,對信息的占有程度及信息處理水平的先進程度已成為衡量一個國家或地區(qū)現(xiàn)代化程度的重要標志,而網(wǎng)絡(luò)上豐富的信息在更大程度上改變了人們的工作和生活的方式。巾ternet是當今世界上規(guī)模最大、覆蓋面最廣、信息資源最豐富、發(fā)展最為迅速的信息網(wǎng)絡(luò),基TInternet的網(wǎng)絡(luò)信息檢索的研究,無論對研究人員還是一般用戶來說,都冇著很強的現(xiàn)實性和實用性。1.1信息檢索概念信息檢索是指將信息按一定的方式組織和存儲起來,并根據(jù)信息用八的信息需求查找所需信息的過程和技術(shù)。人們獲取信

5、息源的方式主要有:①傳統(tǒng)的信息檢索方法,通過人工查詢在圖書館等提供文獻的機構(gòu)進行文獻的查詢和獲取活動;②聯(lián)機信息檢索相對于前者來說具有實時性、完整性、共享性、廣泛性等優(yōu)點;③網(wǎng)絡(luò)信息檢索是指通過網(wǎng)絡(luò)信息檢索工具檢索存在于Internet信息空間屮各種類型的網(wǎng)絡(luò)信息資源。1.1網(wǎng)絡(luò)信息檢索的原理網(wǎng)絡(luò)信息檢索工具是網(wǎng)絡(luò)信息檢索技術(shù)的實物體現(xiàn)。H前,常用的網(wǎng)絡(luò)信息檢索模型有布爾邏輯模型、模糊邏輯模型和概率模型等幾種方式。①布爾邏輯模型這是一?種簡單而常用的嚴格I兀配模型。用戶可以根據(jù)檢索項在文檔中的布爾邏輯關(guān)系提交查詢,搜索工具根據(jù)事先建立的倒排文檔結(jié)構(gòu)確

6、定查詢結(jié)果。標準的布爾邏輯模型為二元邏輯,所搜索的文檔要么與査詢相關(guān),要么與查詢無關(guān)。利用這種模型進行查詢,其查詢結(jié)果一般沒有按照內(nèi)容的相關(guān)特性排序。②模糊邏輯模型它在查詢結(jié)果處理中引進了模糊邏輯比較,并R按照相關(guān)的優(yōu)先次序排列杳詢結(jié)果,這樣就可以克服布爾邏輯模型信息杏詢結(jié)果的無序性。③概率模型它是基于貝葉斯概率原理而提出的,根據(jù)詞條、文檔間的內(nèi)在聯(lián)系,利用詞條間和詞條與文檔間的概率相依性來進行信息檢索。2搜索引擎搜索引擎是目前使用最為頻繁的--種網(wǎng)絡(luò)信息檢索工具。與其他工具相比,它的檢全率和檢準率祁比較髙,具有很強的使用價值和廣泛的應(yīng)用麗景。2.1

7、搜索引擎的工作原理作為一種WWW站點資源和艾它網(wǎng)絡(luò)資源進行組織和檢索的檢索工具,搜索引擎的檢索機制一般包括數(shù)據(jù)采集和標引機制、數(shù)據(jù)組織機制和用戶檢索機制。①數(shù)據(jù)采集標引機制按照一定規(guī)律和方式對網(wǎng)絡(luò)上WWW站點進行搜索,并將搜索到的WWW頁而信息存入搜索引擎的臨時數(shù)據(jù)庫中。②數(shù)據(jù)組織據(jù)組織機制的主耍功能是對WWW頁面信息進行整理以形成規(guī)范的頁面索引,并建立相應(yīng)的索引數(shù)據(jù)庫。③索引數(shù)據(jù)庫是用戶進行檢索的基礎(chǔ),它的數(shù)據(jù)質(zhì)最肓接影響到檢索效果,而搜索引擎的數(shù)據(jù)采集標和標引機制乂是決定數(shù)據(jù)庫質(zhì)量的關(guān)鍵技術(shù)。④用八檢索機制幫助用八以一?定方式檢索引擎的索引數(shù)據(jù)庫

8、,以獲得符合用八需要的WWW站點或頁而。2.2搜索引擎的分類按照用戶杳找的途徑劃分,可將搜索引擎分為如下幾種

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。