資源描述:
《淺議網絡信息檢索現(xiàn)狀和其發(fā)展趨勢》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、淺議網絡信息檢索現(xiàn)狀和其發(fā)展趨勢 【摘要】隨著計算機技術及網絡技術的發(fā)展,網絡信息檢索顯得越發(fā)重要。本文主要綜述了網絡信息檢索的全文數(shù)據庫、搜索引擎、互聯(lián)網“超鏈接”等現(xiàn)行檢索模式及它的智能化、一站式化、可視化等發(fā)展趨勢?!娟P鍵詞】網絡信息檢索;現(xiàn)狀;發(fā)展趨勢1.信息檢索概述信息檢索(InformationRetrieval)是指將信息按照一定的方式組織和存儲起來,并能根據信息用戶的需要指出其中相關信息的過程,因此它的全稱叫“信息存儲與檢索”。隨著互聯(lián)網的發(fā)展,人類社會的信息化、網絡化進程大大加快。當今出現(xiàn)的一系列新型檢索模式,包括網絡信息規(guī)范控制標準等為網絡檢索技術的未來展現(xiàn)了新希望,
2、與之相適應的信息檢索的交流平臺也迅速轉移到以WWW為核心的網絡應用環(huán)境中,信息檢索步入網絡化時代,網絡信息檢索已基本取代了手工檢索。2.網絡信息檢索的現(xiàn)狀7對大多數(shù)讀者而言,檢索并不意味著發(fā)現(xiàn),而是獲得。人們希望不僅僅是提供寬泛的檢索結果,而應該是計算機能試圖理解用戶提問的意圖,并對檢索結果進行適當?shù)姆诸惡团判?。但是,現(xiàn)有的搜索引擎大多是基于簡單的關鍵詞匹配,不能真正理解用戶的檢索意圖;各個搜索引擎的信息搜集和索引建立有很大的不同,每個搜索引擎平均只能涉及到整個網上資源的30%~50%,而其中真正有用的信息也只占很小的比例,這就意味著使用任何一個搜索引擎都只能檢索到網絡中的部分資源。目前網
3、絡檢索面臨一系列的挑戰(zhàn),網絡信息量迅猛增加,人工已經無法對它們進行有效的分類、索引和利用;簡單的關鍵詞搜索,返回的信息量過大,已經讓用戶無法承擔;網絡信息組織的無序性;信息有用性評價困難;網絡信息日新月異的更變;信息媒體的多樣化;帶寬等其它因素的制約,這些都給因特網信息的獲取造成了極大的阻礙。這樣就造成了要求智能化、專業(yè)化、多元化、多媒體化的網絡信息檢索工具出現(xiàn)的呼聲越來越高,并且有更多的人參與到其中來。如此種種,給當今的網絡信息檢索研究帶來了發(fā)展機遇,也給了它無限的發(fā)展空間。3.網絡信息檢索的現(xiàn)行模式3.1網絡全文數(shù)據庫檢索7網絡全文數(shù)據庫是以全文數(shù)據為數(shù)據庫對象,并在網上提供全文檢索服
4、務的數(shù)據庫。按數(shù)據庫的生產機構分類,可分為出版商全文期刊數(shù)據庫和生產商全文期刊數(shù)據庫。前者主要是那些期刊出版單位在其出版的印刷期刊基礎上建立的網絡電子期刊全文數(shù)據庫。而后者則是由數(shù)據庫生產商根據一定的主題或一定的收錄范圍整合一定數(shù)量的期刊出版物而產生的全文數(shù)據庫。國內全文數(shù)據庫主要有中國學術期刊全文數(shù)據庫。3.2網絡搜索引擎檢索搜索引擎是一個專門的系統(tǒng),它可以對互聯(lián)網信息資源進行搜索整理和分類,并將其儲存在網絡數(shù)據庫中供用戶查詢。搜索引擎包括搜集信息、分類和用戶查詢等三大部分。目前流行的搜索引擎有兩大類:關鍵詞全文檢索式搜索引擎和分類目錄式搜索引擎。關鍵詞全文檢索式搜索引擎主要利用其內部的
5、搜索機器人和蜘蛛程序,自動搜索來自互聯(lián)網上的各種內容,在每一個關鍵詞和所有相關的網頁之間按照網頁相關性原理建立一個對應關系,儲存在其網絡服務器的數(shù)據庫中。用戶只要輸入關鍵詞就可以找到符合該關鍵詞特征的所有被索引的網頁,搜索結果以超鏈接的方式列表,搜索結果有簡單介紹,用戶點擊相應的鏈接就可以進入相應的網絡資源網站,從而找到所需信息。用這種方式搜索到的結果通常數(shù)以百萬計,但是相關性越高的信息,在搜索結果列表中的位置越靠前。分類目錄式搜索引擎將互聯(lián)網信息按照一定的標準進行收集和分類,并編入相應目錄,以層級和逐次分項的方式管理目錄,查找信息可以按照分類目錄一層層進入,最終找到所要的信息。3.3互聯(lián)
6、網“超鏈接”搜索7Web信息以超文本鏈接方式組織,基本組織單元是信息節(jié)點而不是字符串,信息節(jié)點之間通過鏈接進行聯(lián)系。超鏈接是網頁必不可少的一個元素,同一主題或相關的信息因超鏈接構成了信息網。超文本信息檢索技術,以超文本信息節(jié)點之間的多種鏈接關系為基礎,根據思維聯(lián)想或查找信息的需要,通過鏈接從一個信息節(jié)點轉到另一個信息節(jié)點。4.網絡信息檢索的未來發(fā)展趨勢網絡技術的發(fā)展,給網絡信息檢索及信息的網絡化帶來的極大的便利,進一步推動了網絡信息檢索理論和技術的快速發(fā)展。怎樣為網絡用戶提供高質量、高效率的檢索方式是網絡信息檢索研究者的努力方向。信息檢索的對象已從傳統(tǒng)的文本信息擴展到如今開放、動態(tài)、分布廣
7、泛的多媒體信息。那么,網絡信息檢索的發(fā)展趨勢如何呢?4.1智能化信息檢索智能化信息檢索是基于自然語言處理的檢索形式。檢索工具是對用戶提供的以自然語言表達的檢索要求進行分析,從而形成檢索策略進行檢索。檢索工具智能化的內涵在于檢索工具具有學習、分析、辨別和推理的能力。近年來,因特網上不斷涌現(xiàn)的人工智能產品,如智能搜索引擎、智能瀏覽器、智能代理等,它們將提高網絡信息檢索的智能化程度,促進智能信息檢索的發(fā)展。7網絡中的智能代理通