資源描述:
《信息檢索技巧課件.ppt》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、信息檢索技巧檢索技術(shù)布爾邏輯檢索邏輯非布爾檢索邏輯與邏輯或邏輯與概念:邏輯與是一種具有概念交叉或概念限定關(guān)系的組配。特點(diǎn):增強(qiáng)了專指度,提高了查準(zhǔn)率。算符:數(shù)據(jù)庫(kù)中使用符號(hào)“*”或“AND”搜索引擎中使用“空格”表示AB兩詞同事出現(xiàn)同時(shí)包含兩個(gè)詞匯邏輯或概念:邏輯或是一種具有概念并列關(guān)系的組配。特點(diǎn):擴(kuò)大檢索范圍,提高了查全率。算符:數(shù)據(jù)庫(kù)中使用符號(hào)“+”或“OR”搜索引擎中可在關(guān)鍵詞之間使用“OR”連接符,對(duì)于百度是用的“
2、”連接符,注意連接符與搜索詞之間必須要有空格。AB兩者之和邏輯非邏輯非是一種具有概念排除關(guān)系的組配。特點(diǎn):提高查準(zhǔn)率,
3、影響查全率。算符:數(shù)據(jù)庫(kù)中使用“-”或“NOT”搜索引擎中使用“-”,注意前一個(gè)關(guān)鍵詞和減號(hào)之間必須有空格,減號(hào)和后一個(gè)關(guān)鍵詞之間,有無(wú)空格均可。AB去除掉一部分內(nèi)容詞位檢索詞位檢索具有限定檢索詞的詞與詞之間位置關(guān)系的功能??蓮浹a(bǔ)布爾邏輯算符只是定性規(guī)定檢索詞的范圍,以提高檢準(zhǔn)率。常用的詞位檢索有:鄰位檢索和字段檢索。截詞檢索是防止漏檢,提高查全率的一種常用檢索技術(shù),主要用于英文電子資源的檢索。用*或?表示。不同檢索系統(tǒng)使用的截詞符種類和功能不同。截詞是在檢索詞的適當(dāng)位置進(jìn)行截?cái)?,?jié)省輸入的字符,達(dá)到較高的查全率。根據(jù)截詞符在檢索詞中的位置,
4、可分為前截詞、中截詞和后截詞。截詞檢索技術(shù)前截詞前截詞算符在檢索詞的詞首,如輸入“*physics”,可檢出physics,astrophysics,biophysics,chemophysics等所有以physics結(jié)尾的單詞。中截詞主要用于英、美拼寫(xiě)不同的詞和單復(fù)數(shù)拼寫(xiě)不同的詞。如“organi?ation”可檢出organisation和organization的記錄后截詞是一種滿足前方一致的檢索。用于詞的單、復(fù)數(shù)和動(dòng)詞詞尾變化。例如:book*可檢出book和books兩個(gè)詞。treat*可檢出treat、treatment。為了確定
5、檢索詞在數(shù)據(jù)庫(kù)記錄中出現(xiàn)的字段位置,可采用字段(或叫檢索項(xiàng)、檢索入口)來(lái)限制查找的范圍。其作用是提高檢全率或檢準(zhǔn)率。字段(field):如在數(shù)據(jù)庫(kù)中題名、作者、作者單位、期刊名、摘要、全文等等均是字段;一條記錄由多個(gè)字段值組成;對(duì)計(jì)算機(jī)檢索來(lái)說(shuō)字段相當(dāng)于檢索入口。限制檢索技術(shù)檢索點(diǎn)與檢索字段檢索點(diǎn):檢索的出發(fā)點(diǎn),也稱途徑。在數(shù)據(jù)庫(kù)中每個(gè)可檢索的字段即為一個(gè)檢索點(diǎn)。例已知作者的姓名,查找著作,即可選擇作者字段進(jìn)行檢索;已知文獻(xiàn)名稱,則可選擇題名字段進(jìn)行檢索。檢索點(diǎn)檢索字段(又稱檢索入口或檢索項(xiàng))可分為基本檢索字段和輔助檢索字段?;緳z索字段是指
6、反應(yīng)文獻(xiàn)內(nèi)容特征的字段。如題名、文摘、主題詞等。輔助字段是指反應(yīng)文獻(xiàn)外部特征的字段,如作者機(jī)構(gòu)、來(lái)源出版物、出版年等?;緳z索字段輔助檢索字段通常的字段限制范圍的大小順序是:題名<關(guān)鍵詞≈摘要<(主題)<全文精確短語(yǔ)檢索為了使含有或不含有禁用詞(and、or、not、near)的短語(yǔ)或詞組作為一個(gè)整體,可用引號(hào)″″,實(shí)現(xiàn)精確短語(yǔ)檢索。例如:″powerlocomotives″(電力機(jī)車)、″airpollutionandcontrol″(大氣污染和控制)檢索選詞切分切分是對(duì)課題的語(yǔ)句以詞為單位進(jìn)行拆分,轉(zhuǎn)換為檢索的最小單元。例1:檢索“婦女吸
7、煙與肺癌的關(guān)系研究”相關(guān)文獻(xiàn)直接切分:婦女
8、吸煙
9、與
10、肺癌
11、的
12、關(guān)系
13、研究注意:當(dāng)詞切分后將失去原來(lái)的意思時(shí),不應(yīng)再切分,即必須注意保持意義的完整。刪除刪除是對(duì)課題中不具有實(shí)質(zhì)性檢索意義的:虛詞(如介詞、連詞、副詞等)選擇性刪除:使用頻率較低的詞、專指性太高、過(guò)分寬泛的詞、過(guò)分具體的限定詞例:檢索課題“中國(guó)非常規(guī)天然氣工業(yè)的發(fā)展前景研究”進(jìn)行拆分以后,工業(yè)、發(fā)展、前景、研究這四個(gè)具有一定的檢索意義,但是由于或者是意義過(guò)于寬泛、或者是不能表達(dá)課題實(shí)質(zhì),沒(méi)有必要全部作為檢索詞,根據(jù)需要可以保留1-2個(gè)作為檢索詞。擴(kuò)展找到意思相同或相近的詞匯立足規(guī)
14、范詞,兼顧自由詞膠粘劑2611黏合劑125粘合劑1021粘固劑74粘結(jié)劑668粘附劑44膠黏劑275膠合劑21粘接劑225粘膠劑19注意詞的全稱、簡(jiǎn)稱及縮寫(xiě)字母乙型病毒性肝炎脫氧核糖核酸乙型肝炎DNA乙肝必要時(shí)應(yīng)向上下位類詞擴(kuò)檢上位詞:無(wú)線通信1737下位詞:微波通信80?衛(wèi)星通信785?紅外通信30?移動(dòng)通信2871外來(lái)詞的譯寫(xiě)變化波爾茲曼20歐幾里德30玻耳茲曼31歐幾里得59玻爾茲曼34歐基里德5波耳茲曼3歐幾理德1波爾茨曼0歐氏幾何17Boltzmann374Euclid75擴(kuò)展詞匯方法利用同義詞表利用搜索引擎