資源描述:
《淺談信息檢索工具》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、淺談信息檢索工具摘要文章由信息檢索的分析和發(fā)展狀況出發(fā),闡述了一些常用的信息檢索工具和相關(guān)技術(shù)。然后對常用的信息檢索工具做了一個簡要的評價,并由此討論了信息檢索工具的現(xiàn)狀和發(fā)展趨勢。關(guān)鍵詞:信息檢索工具、技術(shù)、評價標準、發(fā)展趨勢AbstractPostbyinformationretrievalandanalysisofdevelopment,andexpoundsanumberofcommonlyusedinformationretrievaltoolsandrelatedtechnologi
2、es.Thenusedtheinformationretrievaltoolstodoabriefevaluation,andthendiscussthestatusofinformationretrievaltoolsandtrends.Keywords:informationretrievaltools,techniques,evaluationcriteria,trends淺談信息檢索工具第一章信息檢索分析及發(fā)展狀況步入21世紀,人們對信息檢索的完備、準確、快捷會有更加嚴格的要求和期盼,與
3、時俱進、不斷完善的信息檢索技術(shù)將得到越來越廣泛的應(yīng)用,信息的檢索與訪問方式無疑將發(fā)生深刻的變化。然而網(wǎng)上的信息浩如煙海,一個搜索引擎很難收集全所有主題的網(wǎng)絡(luò)信息,即使信息主題收集得比較全面,由于主題范圍太寬,很難將各個主題都做得精確又專業(yè),使得檢索結(jié)果中出現(xiàn)太多無用的信息。如何在浩瀚的信息海洋中準確、方便、快速地找到自己所需的信息,成了一個迫切需要解決的問題。信息檢索主要是指信息的表示、存儲、組織和訪問,即根據(jù)用戶的查詢要求,從信息數(shù)據(jù)庫中檢索與之有關(guān)的信息資料。信息檢索的目的是獲取所需信息,而
4、這要基于比較完善的檢索工具和技術(shù)。1.1 從傳統(tǒng)檢索到信息分析目前,隨著信息檢索技術(shù)的發(fā)展,信息檢索已經(jīng)由手工檢索、計算機檢索發(fā)展到了網(wǎng)絡(luò)化、智能化、認知化階段,這一階段的信息檢索平臺具備了初步的信息分析功能,從而使傳統(tǒng)檢索信息向信息分析層次發(fā)展。例如,在ISIWebofScience檢索平臺上,當某一主題的檢索結(jié)果出來后,檢索者還可以利用該平臺提供的信息分析功能,對檢索結(jié)果從以下幾個方面進行深入分析:①按照論文發(fā)表時間進行分析,了解不同時間階段課題研究的狀態(tài);②按照國家分析,了解該領(lǐng)域的主要研
5、究國家以及國內(nèi)該領(lǐng)域研究情況;③按照機構(gòu)分析,了解領(lǐng)域的主要研究機構(gòu);④按照作者分析,了解該領(lǐng)域的核心研究人員;⑤按照來源期刊分析,了解該領(lǐng)域研究論文發(fā)表的重點期刊以及對某刊物收錄論文情況進一步了解;⑥按照學科進行分析,了解該課題涉及哪些學科領(lǐng)域以及對感興趣學科進行更深入的分析。很顯然,通過對檢索結(jié)果從6個方面進行深入分析,將使讀者對檢索結(jié)果作進一步的深入了解。1.2 信息檢索的發(fā)展狀況信息檢索經(jīng)過先組式索引檢索、穿孔卡片檢索、縮微膠卷檢索發(fā)展到計算機信息檢索。計算機信息檢索大致可分為脫機檢索、
6、聯(lián)機檢索、國際聯(lián)機檢索、光盤檢索、超文本的網(wǎng)絡(luò)檢索幾個階段。目前,以文獻單元描述體結(jié)構(gòu)為基礎(chǔ)、手工檢索方式為主導的傳統(tǒng)文獻檢索已發(fā)展到以信息單元組織結(jié)構(gòu)為基礎(chǔ)、網(wǎng)上瀏覽式信息查詢方式的信息檢索,計算機信息檢索呈現(xiàn)聯(lián)機檢索、光盤檢索以及網(wǎng)絡(luò)檢索多元并存的格局,面對用戶群體、互相競爭、互相融合,謀求個性化基礎(chǔ)上的共同發(fā)展。如下表所示,傳統(tǒng)檢索技術(shù)和網(wǎng)上檢索技術(shù)無論是在檢索策略還是在檢索手段上都發(fā)生了本質(zhì)的變化。傳統(tǒng)檢索技術(shù)與網(wǎng)上檢索技術(shù)的比較傳統(tǒng)檢索技術(shù)網(wǎng)上檢索技術(shù)概念模型布爾邏輯概率推理、空間向量
7、前期處理賦詞、自動抽詞超文本標記語言、標準通用標記語言文檔結(jié)構(gòu)順/倒排文檔超文本鏈接淺談信息檢索工具訪問方式單向檢索雙向交互式檢索后期處理文字編輯用輸出方式輸出結(jié)果第二章信息檢索工具及相關(guān)技術(shù)2.1 網(wǎng)上檢索工具及相關(guān)技術(shù)為了快速、有效地獲得信息,人們非常注重信息檢索工具及相關(guān)技術(shù)的研究?,F(xiàn)在,因特網(wǎng)上著名的搜索引擎有Yahoo、Altovista、Infoseek和Lycos等;中文搜索引擎有Sohoo(搜狐)、Robot(若比鄰)等。搜索引擎是Internet上提供公共檢索服務(wù)的Web網(wǎng)站,
8、它是新一代信息檢索工具。搜索引擎的關(guān)鍵技術(shù)主要是“自動跟蹤技術(shù)”和“指引庫”。目前,網(wǎng)上檢索工具正向多語種化、綜合化、專業(yè)化方向發(fā)展,已出現(xiàn)元檢索工具(即檢索工具的檢索工具),對選擇和評估更新檢索工具有著不可替代的作用,多元搜索引擎(集成式的搜索引擎)具有去重功能,對檢索結(jié)果進行統(tǒng)一的相關(guān)評估,能實現(xiàn)搜索引擎間的優(yōu)化組合,通過電子郵件向用戶隨時提供網(wǎng)上信息。檢索界面簡潔、易學易用,檢索結(jié)果格式清晰、內(nèi)容充實、數(shù)據(jù)更新及時,檢索所提供的網(wǎng)頁鏈接可靠。2.1 文本檢索與多媒體檢索按照檢索的信息形式,