資源描述:
《web信息檢索工具的檢索功能述略.》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、eb信息檢索工具的檢索功能述略(鄭州大學(xué)信息管理系,河南鄭州4002)摘要:在闡述eb信息檢索發(fā)展背景的基礎(chǔ)上,詳細(xì)介紹了當(dāng)前應(yīng)用廣泛的eb信息檢索功能,并對(duì)其作了簡(jiǎn)單的評(píng)價(jià)。關(guān)鍵詞:eb信息檢索工具;檢索工具;檢索功能中圖分類號(hào):G22.7文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):10076921(XX)18—0046—03Internet的誕生與發(fā)展一直是眾所矚目的焦點(diǎn),網(wǎng)絡(luò)技術(shù)的日新月異為人們共享和交流信息提供了越來(lái)越便捷的途徑,網(wǎng)絡(luò)已經(jīng)成為人們獲取信息的重要渠道,根據(jù)NNI〔1〕調(diào)查報(bào)告顯示,我國(guó)上網(wǎng)用戶中有46.1%的用戶上網(wǎng)最主要的目的是獲取信息,搜索引擎占用戶常用網(wǎng)絡(luò)服務(wù)的62.7%,信息檢索和
2、信息獲取服務(wù)充分利用網(wǎng)絡(luò)跨越時(shí)空傳遞信息的優(yōu)勢(shì),是eb服務(wù)的一個(gè)至關(guān)重要的部分?,F(xiàn)在,eb發(fā)展為一個(gè)動(dòng)態(tài)交互的多媒體資源融合的平臺(tái),促使eb信息檢索發(fā)展為Internet上主流的檢索方式,雖然它的發(fā)展時(shí)間并不長(zhǎng),但是已由功能單一、種類稀少進(jìn)入到了功能多元化、種類多樣的發(fā)展階段。1eb信息檢索的兩類檢索功能1.1分類瀏覽檢索功能分類搜索引擎的分類方法是一種以主體對(duì)象為中心的實(shí)用分類體系,在類目體系縱向展開(kāi)上,使用了多維劃分和多元展開(kāi)的形式,利用超文本鏈接,往往有針對(duì)性地同時(shí)用多個(gè)引用次序,使用類似多表列類的方法,同時(shí)設(shè)置多個(gè)類目體系,建立多維的系統(tǒng),使得用戶可以從不同的角度進(jìn)行檢索。在橫向關(guān)系
3、的揭示上,通過(guò)重復(fù)反映的方式充分揭示相關(guān)主題,包括多屬性主題和相關(guān)主題。分類搜索引擎可以清晰方便地查找到某一大類信息比較符合傳統(tǒng)的信息查找方式尤其適合那些希望了解某一方面或范圍信息,并不嚴(yán)格限于查詢關(guān)鍵字的用戶,但分類搜索引擎的搜索范圍較全文搜索引擎要小許多,尤其是當(dāng)用戶選擇類型不當(dāng)時(shí),有可能遺漏某些重要的信息源。1.2關(guān)鍵詞檢索功能檢索時(shí)直接在搜索引擎提供的檢索對(duì)話框中輸入要檢索的關(guān)鍵詞進(jìn)行的檢索,輸入的關(guān)鍵詞可以是單個(gè)詞匯,也可以是多個(gè)詞匯,通過(guò)組配的方法進(jìn)行比較復(fù)雜的檢索。關(guān)鍵詞檢索技術(shù)實(shí)質(zhì)是人工或計(jì)算機(jī)對(duì)數(shù)據(jù)庫(kù)信息內(nèi)容預(yù)先進(jìn)行加工,即對(duì)文獻(xiàn)內(nèi)容全面地分析,將那些出現(xiàn)在文獻(xiàn)的標(biāo)題、文摘
4、、正文中能反映文獻(xiàn)主題概念具有實(shí)質(zhì)意義的詞語(yǔ)抽取出來(lái)進(jìn)行標(biāo)引,通過(guò)文獻(xiàn)標(biāo)引來(lái)揭示文獻(xiàn)內(nèi)容,進(jìn)行信息資源定位。用戶根據(jù)自己的信息需求,利用系統(tǒng)提供的關(guān)鍵詞檢索入口,輸入自己選定的關(guān)鍵詞,系統(tǒng)按照用戶的查詢指令查找符合條的對(duì)應(yīng)內(nèi)容,并把檢索結(jié)果組織起來(lái)提供給用戶的一種檢索方式。2目前比較常用的兩類檢索功能2.1布爾檢索布爾檢索是指通過(guò)標(biāo)準(zhǔn)的布爾邏輯關(guān)系詞來(lái)表達(dá)檢索詞與檢索詞的邏輯關(guān)系的檢索方法,主要關(guān)系詞有And、r、Nt。①And關(guān)系,稱為邏輯與,用關(guān)系詞And表示,表示它所連接的檢索詞必須同時(shí)出現(xiàn)在結(jié)果中才能滿足檢索條。②r關(guān)系,稱為邏輯或,用關(guān)系詞r?表示,表示它所連接的兩個(gè)檢索詞中任意一
5、個(gè)出現(xiàn)在結(jié)果中就能滿足檢索條。③Nt關(guān)系,稱為邏輯非,用關(guān)系詞Nt表示,表示它所連接的兩個(gè)檢索詞中應(yīng)從第一個(gè)概念中排除第二個(gè)概念。如果說(shuō),使用多個(gè)關(guān)鍵詞進(jìn)行檢索可改善關(guān)鍵詞的檢索性能,那么,布爾檢索是保證多關(guān)鍵詞檢索正確操作的基本規(guī)則。布爾檢索對(duì)關(guān)鍵詞檢索效率的改進(jìn)是多功能的,即它既可用于提高檢準(zhǔn)率的目的,也可用于提高檢全率的目的。不過(guò),兩者之間存在著互逆相關(guān)性,即使用And何Nt運(yùn)算符會(huì)影響檢全率,使用r運(yùn)算符會(huì)影響檢準(zhǔn)率。2.2限定桂索這是在網(wǎng)絡(luò)信息檢索工具中使用得相當(dāng)廣泛的檢索方法,一般可縮小檢索范圍,從而減少不需要信息的輸出。限定檢索均屬選項(xiàng),限定條多種多樣,包括:①限定字段,也稱字
6、段檢索,即限定關(guān)鍵詞必須是處于頁(yè)面中的某個(gè)位置的。如限定在標(biāo)題、統(tǒng)一資源定位器(url)、鏈接文字、網(wǎng)頁(yè)文字、特定站點(diǎn)等部分;②限定網(wǎng)頁(yè)深度(即網(wǎng)頁(yè)層次);③限定在某一專題內(nèi)檢索。如果網(wǎng)絡(luò)信息檢索工具設(shè)有某些檢索專題,則關(guān)鍵詞可限定必須出現(xiàn)在某個(gè)專題內(nèi),如新聞組、黃頁(yè)、白頁(yè)、電子郵地址、廣告、道路地圖、股票行情,熱點(diǎn)商業(yè)新聞等等;④限定檢索對(duì)象(站點(diǎn)類型)。如新聞?wù)军c(diǎn)、個(gè)人同頁(yè)、商業(yè)站點(diǎn)、非盈利站點(diǎn)、教育站點(diǎn)、軍事站點(diǎn)、政府站點(diǎn)等等(根據(jù)域名后輕);⑤限定網(wǎng)絡(luò)資源類型。公司信息、指南和名錄、活動(dòng)公告信息、拍賣信息、學(xué)習(xí)信息、新聞發(fā)布信息等等;⑥限定數(shù)據(jù)類型。如文、聲音、圖像、音像、HTL的成
7、分、內(nèi)含編程語(yǔ)句等等;⑦限定日期。如特定日期之前或之后的網(wǎng)頁(yè),最近某段時(shí)問(wèn)內(nèi)建立或修改的網(wǎng)頁(yè)等等;⑧限定地區(qū)或域名??梢钥闯觯承┫薅l檢索對(duì)減少不需要信息的輸出具有重要意義2.3截詞檢索截詞檢索,是使用截詞符,表示作為檢索用詞的關(guān)鍵詞的某部分允許有詞形變化。截詞檢索包括右截詞、左截詞(前端截詞、后方一致)、中間截詞和左右截詞。截詞檢索有字面成族的作用,而字面成族的詞中有一部分或大部分甚至全部又是概念成族的,