資源描述:
《web信息檢索工具的檢索功能述略》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在工程資料-天天文庫。
1、Web信息檢索工具的檢索功能述略 (鄭州大學信息管理系,河南鄭州450052)
摘要:在闡述Web信息檢索發(fā)展背景的基礎上,詳細介紹了當前應用廣泛的Web信息檢索功能,并對其作了簡單的評價。
關鍵詞:Web信息檢索工具;檢索工具;檢索功能
中圖分類號:G252.7文獻標識碼:A文章編號:1007—6921(XX)18—0046—03
Internet的誕生與發(fā)展一直是眾所矚目的焦點,網(wǎng)絡技術的日新月異為人們共享和交流信息提供了越來越便捷的途徑,網(wǎng)絡已經(jīng)成為人們獲取信息的重要渠道,根據(jù)CNNIC〔1〕調(diào)查報告顯示,我國上網(wǎng)用戶中有46.1%的用戶上網(wǎng)最主要的目的
2、是獲取信息,搜索引擎占用戶常用網(wǎng)絡服務的62.7%,信息檢索和信息獲取服務充分利用網(wǎng)絡跨越時空傳遞信息的優(yōu)勢,是web服務的一個至關重要的部分?,F(xiàn)在,Web發(fā)展為一個動態(tài)交互的多媒體資源融合的平臺,促使Web信息檢索發(fā)展為Internet上主流的檢索方式,雖然它的發(fā)展時間并不長,但是已由功能單一、種類稀少進入到了功能多元化、種類多樣的發(fā)展階段。
1Web信息檢索的兩類檢索功能
1.1分類瀏覽檢索功能
分類搜索引擎的分類方法是一種以主體對象為中心的實用分類體系,在類目體系縱向展開上,使用了多維劃分和多元展開的形式,利用超文本鏈接,往往有針對性地同時用多個引用次序,使用類似多表列類的方
3、法,同時設置多個類目體系,建立多維的系統(tǒng),使得用戶可以從不同的角度進行檢索。在橫向關系的揭示上,通過重復反映的方式充分揭示相關主題,包括多屬性主題和相關主題。
分類搜索引擎可以清晰方便地查找到某一大類信息比較符合傳統(tǒng)的信息查找方式尤其適合那些希望了解某一方面或范圍信息,并不嚴格限于查詢關鍵字的用戶,但分類搜索引擎的搜索范圍較全文搜索引擎要小許多,尤其是當用戶選擇類型不當時,有可能遺漏某些重要的信息源。
1.2關鍵詞檢索功能
檢索時直接在搜索引擎提供的檢索對話框中輸入要檢索的關鍵詞進行的檢索,輸入的關鍵詞可以是單個詞匯,也可以是多個詞匯,通過組配的方法進行比較復雜的檢索。
4、 關鍵詞檢索技術實質(zhì)是人工或計算機對數(shù)據(jù)庫信息內(nèi)容預先進行加工,即對文獻內(nèi)容全面地分析,將那些出現(xiàn)在文獻的標題、文摘、正文中能反映文獻主題概念具有實質(zhì)意義的詞語抽取出來進行標引,通過文獻標引來揭示文獻內(nèi)容,進行信息資源定位。用戶根據(jù)自己的信息需求,利用系統(tǒng)提供的關鍵詞檢索入口,輸入自己選定的關鍵詞,系統(tǒng)按照用戶的查詢指令查找符合條件的對應內(nèi)容,并把檢索結果組織起來提供給用戶的一種檢索方式。
2目前比較常用的兩類檢索功能
2.1布爾檢索
布爾檢索是指通過標準的布爾邏輯關系詞來表達檢索詞與檢索詞的邏輯關系的檢索方法,主要關系詞有And、Or、Not。①And關系,稱為邏輯與,用關系詞
5、And表示,表示它所連接的檢索詞必須同時出現(xiàn)在結果中才能滿足檢索條件。②Or關系,稱為邏輯或,用關系詞Or表示,表示它所連接的兩個檢索詞中任意一個出現(xiàn)在結果中就能滿足檢索條件。③Not關系,稱為邏輯非,用關系詞Not表示,表示它所連接的兩個檢索詞中應從第一個概念中排除第二個概念。如果說,使用多個關鍵詞進行檢索可改善關鍵詞的檢索性能,那么,布爾檢索是保證多關鍵詞檢索正確操作的基本規(guī)則。布爾檢索對關鍵詞檢索效率的改進是多功能的,即它既可用于提高檢準率的目的,也可用于提高檢全率的目的。不過,兩者之間存在著互逆相關性,即使用And何Not運算符會影響檢全率,使用Or運算符會影響檢準率。
2.2限定桂
6、索
這是在網(wǎng)絡信息檢索工具中使用得相當廣泛的檢索方法,一般可縮小檢索范圍,從而減少不需要信息的輸出。限定檢索均屬選項,限定條件多種多樣,包括:①限定字段,也稱字段檢索,即限定關鍵詞必須是處于頁面中的某個位置的。如限定在標題、統(tǒng)一資源定位器(url)、鏈接文字、網(wǎng)頁文字、特定站點等部分;②限定網(wǎng)頁深度(即網(wǎng)頁層次);③限定在某一專題內(nèi)檢索。如果網(wǎng)絡信息檢索工具設有某些檢索專題,則關鍵詞可限定必須出現(xiàn)在某個專題內(nèi),如新聞組、黃頁、白頁、電子郵件地址、廣告、道路地圖、股票行情,熱點商業(yè)新聞等等;④限定檢索對象(站點類型)。如新聞站點、個人同頁、商業(yè)站點、非盈利站點、教育站點、軍事站點、政府站
7、點等等(根據(jù)域名后輕);⑤限定網(wǎng)絡資源類型。公司信息、指南和名錄、活動公告信息、拍賣信息、學習信息、新聞發(fā)布信息等等;⑥限定數(shù)據(jù)類型。如文件、聲音、圖像、音像、HTML的成分、內(nèi)含編程語句等等;⑦限定日期。如特定日期之前或之后的網(wǎng)頁,最近某段時問內(nèi)建立或修改的網(wǎng)頁等等;⑧限定地區(qū)或域名??梢钥闯?,某些限定條件檢索對減少不需要信息的輸出具有重要意義。
2.3截詞檢索
截詞檢索,是使用截詞符