互聯(lián)網(wǎng)信息資源檢索概論課件.ppt

互聯(lián)網(wǎng)信息資源檢索概論課件.ppt

ID:57012266

大?。?72.50 KB

頁數(shù):50頁

時間:2020-07-26

互聯(lián)網(wǎng)信息資源檢索概論課件.ppt_第1頁
互聯(lián)網(wǎng)信息資源檢索概論課件.ppt_第2頁
互聯(lián)網(wǎng)信息資源檢索概論課件.ppt_第3頁
互聯(lián)網(wǎng)信息資源檢索概論課件.ppt_第4頁
互聯(lián)網(wǎng)信息資源檢索概論課件.ppt_第5頁
資源描述:

《互聯(lián)網(wǎng)信息資源檢索概論課件.ppt》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫

1、第2章第2章互聯(lián)網(wǎng)信息檢索概論2.1互聯(lián)網(wǎng)信息檢索類型和特點(diǎn)2.2互聯(lián)網(wǎng)信息檢索原理之一——信息組織2.3互聯(lián)網(wǎng)信息檢索原理之二——信息查詢2.4互聯(lián)網(wǎng)檢索工具的性能評價2.1互聯(lián)網(wǎng)信息檢索的類型和特點(diǎn)2.1.1互聯(lián)網(wǎng)信息檢索的類型2.1.2互聯(lián)網(wǎng)信息檢索的特點(diǎn)2.1.1互聯(lián)網(wǎng)信息檢索的類型1、“順鏈而行”的瀏覽基于互聯(lián)網(wǎng)“超鏈接”的技術(shù)特點(diǎn),用戶在瀏覽網(wǎng)頁時,可以非常方便地利用超文本文件中的鏈接從一個網(wǎng)頁跳轉(zhuǎn)到另一個相關(guān)網(wǎng)頁。這些類似于傳統(tǒng)文獻(xiàn)檢索中的“追溯檢索”,但是檢索效率已大大提升。追蹤網(wǎng)頁的超鏈接,用戶可以一

2、輪一輪不斷地擴(kuò)大檢索范圍,在很短的時間內(nèi)獲得大量相關(guān)信息。在互聯(lián)網(wǎng)發(fā)展初期,“順鏈瀏覽”的人工瀏覽方式是互聯(lián)網(wǎng)信息檢索最主要的手段,而瀏覽器的“書簽”(收藏夾)功能是成為該階段被使用得最多的功能之一。馬云與黃頁1995年4月,馬云和妻子再加上一個朋友,湊了兩萬塊錢,專門給企業(yè)做主頁的杭州海博網(wǎng)絡(luò)公司就這樣開張了,網(wǎng)站取名“中國黃頁”,成為中國最早的互聯(lián)網(wǎng)公司之一。其后不到三年時間,他們利用該網(wǎng)站賺到了500萬元。中國黃頁2009年6月1日,網(wǎng)站正式上線,完全公益性網(wǎng)站,不收任何費(fèi)用!人們對互聯(lián)網(wǎng)信息的尋找,從最原始的“

3、順鏈瀏覽”到黃頁等早期檢索工具,實(shí)現(xiàn)了第一個飛躍?;ヂ?lián)網(wǎng)黃頁本質(zhì)上就是一種目錄型檢索工具。2、基于目錄型檢索工具的互聯(lián)網(wǎng)信息檢索目錄型檢索工具,也被稱為網(wǎng)絡(luò)資源目錄或網(wǎng)絡(luò)主題指南,它是一種基于人工的檢索工具,由人工發(fā)現(xiàn)、抓取、辨別互聯(lián)網(wǎng)信息,依靠編目、標(biāo)引人員的知識,按照圖書分類、學(xué)科分類或其他分類依據(jù)的體系,建立主題樹分層目錄,將采集、篩選后的信息分門別類地放入各大類或子類下面,用戶通過逐級瀏覽這些目錄來查詢自己所需要的內(nèi)容。最具代表的互聯(lián)網(wǎng)目錄型檢索工具當(dāng)屬“yahoo”(雅虎),是由斯坦福大學(xué)的研究生楊致遠(yuǎn)(Je

4、rryYang)和DavidFilo與1993年創(chuàng)立的?;ヂ?lián)網(wǎng)剛開始發(fā)展時,他們在網(wǎng)上沖浪時,逐漸把自己喜愛的站點(diǎn)編成一個名單以便尋找,并將這一名單在網(wǎng)上公布,供網(wǎng)友使用,這就是雅虎的前身,也是目錄型檢索工具的工作原理。張朝陽在中國創(chuàng)辦“搜狐”,也是比較成功典型的互聯(lián)網(wǎng)目錄型檢索工具。優(yōu)點(diǎn):人工參與度高,網(wǎng)絡(luò)資源目錄的組織編排符合人們所熟悉的知識分類體系,檢索目標(biāo)性相對較強(qiáng),提供的檢索結(jié)果準(zhǔn)確性也較高。缺點(diǎn):信息涵蓋量不大,更新能力有限,相對成本較高。面臨挑戰(zhàn):在互聯(lián)網(wǎng)發(fā)展早期,為人們檢索互聯(lián)網(wǎng)站點(diǎn)提供了極大的方便,但

5、隨著互聯(lián)網(wǎng)的持續(xù)發(fā)展,它的缺點(diǎn)也越來越明顯,其地位收到了以Google為代表的搜索引擎的挑戰(zhàn)。時過境遷,雅虎和搜狐都已經(jīng)發(fā)展成了門戶網(wǎng)站。補(bǔ)充:門戶網(wǎng)站中國四大門戶網(wǎng)站:新浪、網(wǎng)易、搜狐、騰訊門戶網(wǎng)站:又被稱為鏈接頁面,是通向某類綜合性互聯(lián)網(wǎng)信息資源并提供相關(guān)信息服務(wù)的應(yīng)用系統(tǒng)。發(fā)展前景:雖然目錄型檢索工具在當(dāng)今互聯(lián)網(wǎng)信息檢索界的地位已不如從前,但仍是一支不可忽視的力量。比如在2004年,百度公司收購hao123,hao123是一個個人維護(hù)的目錄型檢索工具,它成為了相當(dāng)一部分上網(wǎng)用戶的“入口”,許多對上網(wǎng)無從下手的人,

6、最需要的就是這樣的導(dǎo)航網(wǎng)站,如今360也開發(fā)了360網(wǎng)址。3、基于索引型檢索工具的互聯(lián)網(wǎng)信息檢索隨著互聯(lián)網(wǎng)信息量的急劇增加,僅以“網(wǎng)站”為信息基本單元的檢索方式已經(jīng)不能滿足更精細(xì)的檢索需求,于是基于“頁面”為信息基本單元的檢索方式成為主流。最具代表性的索引型網(wǎng)絡(luò)檢索工具就是搜索引擎搜索引擎原理利用一個成為Robot的程序自動訪問Web站點(diǎn),提取站點(diǎn)上的網(wǎng)頁,并根據(jù)網(wǎng)頁中的鏈接進(jìn)一步提取其他網(wǎng)頁,并將搜集到的網(wǎng)頁加入到搜索引擎的數(shù)據(jù)庫中,并建立索引,供用戶檢索使用。然后用戶輸入關(guān)鍵字之后進(jìn)行檢索。優(yōu)點(diǎn)充分利用了計算機(jī)的處

7、理能力,對于規(guī)模巨大的互聯(lián)網(wǎng)信息資源的索引和檢索具有強(qiáng)大的優(yōu)勢,使得人們可以用更少的時間檢索到更廣闊的互聯(lián)網(wǎng)信息。缺點(diǎn)1.檢索噪音問題。使用搜索引擎檢索某個關(guān)鍵詞或關(guān)鍵詞組合,通常會返回大量檢索結(jié)果,逐一瀏覽這些結(jié)果對用戶來說是不現(xiàn)實(shí)的。搜索引擎不斷改進(jìn)算法,使得最滿足檢索需求的結(jié)果排序靠前,取得了一定的效果,但是仍不能完全令人滿意。2、索引非文件形式的互聯(lián)網(wǎng)信息資源的能力有限,為了保證Robot抓取網(wǎng)頁的效率,讓其不至于迷失在無盡的鏈接中無法返回,通常Robot在漫游各個網(wǎng)站時會受到目錄深度的限制,較大搜索引擎的ro

8、bot一般也就能順鏈到一個網(wǎng)站的4-5層頁面而已。4、其他互聯(lián)網(wǎng)檢索工具①元搜索引擎。它彌補(bǔ)了搜索引擎的不足,他不存在Robot,也不存在存放網(wǎng)頁的數(shù)據(jù)庫,當(dāng)用戶檢索一個關(guān)鍵詞時,它把用戶的檢索請求轉(zhuǎn)換成其他搜索引擎所能接受的命令格式,并發(fā)送訪問數(shù)個搜索引擎來檢索這個關(guān)鍵詞,這些搜索引擎的結(jié)果經(jīng)過處理后再返回給用戶。優(yōu)點(diǎn):擴(kuò)大檢索

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。