資源描述:
《基于ontology的信息檢索系統(tǒng)的研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、~坦j!三些盔堂堡主蘭絲迨苧的參數(shù)‘2。查全率是檢索出的相關(guān)文檔數(shù)與文檔集中所有的相關(guān)文檔數(shù)的比率。對于Web信息檢索系統(tǒng)來講,因為對于一個查洵總能返回很多信息,查全率一般不成問題。沒有一個Web信息檢索系統(tǒng)能夠搜集到所有的Web網(wǎng)頁?!?,查全率很難比較,因此衡量Web信息檢索的性能時,查全率很少使用。查準率是檢索出的相關(guān)文檔數(shù)與檢索出的文檔總數(shù)的比率。一般來說,查準率很少能夠達到100%。對于一個信息檢索系統(tǒng)來講,查全率和查準率不可能兩全其美。查全率高時,查準率低。為了達到很高的查全率,需要使用限制較弱的檢索條件,這樣查準率不高,反之亦
2、然。較好的做法是對查全率與查準率兩種罵求采取中庸態(tài)度,即采用中間程度的檢索條件,這樣可以得到一種中間最優(yōu)效果。3.信息檢索技術(shù)的分類(1)全文檢索(TextRetrieval)全文檢索就是把用戶的查詢請求和全文中的每一個詞進行比較,不考慮查詢請求和文件語義上的匹配。缺點是雖然可以保證查全率,但是查準率大大降低。(2)數(shù)據(jù)檢索(DataRetrieval)數(shù)據(jù)檢索是查詢要求和信息系統(tǒng)中的數(shù)據(jù)都遵循一定的格式,具有一定的結(jié)構(gòu),允許對特定字段檢索。需要有標識字段的方法。其缺點是性能取決于所使用的字段標識方法和用戶對方法的理解,具有很大的局限性,
3、支持語義匹配的能力較著。(3)知識檢索(KnowledgeRetrieval)知識檢索是基于知識的、語義上的匹配,在查準率和查全率上有更好的保證。是信息檢索的重點,特別是面向web信息的知識檢索的重點。卜1—2Ontology的定義Ontology是一個哲學(xué)上的概念,用于描述事物的本質(zhì),在近一、二十年,Ontology已被計算機領(lǐng)域所采用,用于知識表達、知識共享及重用,許多學(xué)科和研究領(lǐng)域都在使用“本體”這個術(shù)語,但存在不同的定義。1.哲學(xué)中Ontology的含義Ontology是西方哲學(xué)特有的一種形態(tài),人們把它當作從帕拉圖到黑格爾的西方傳
4、統(tǒng)哲學(xué)的主干或“第一哲學(xué)”,這就意味著它是各個哲學(xué)分支的理論基礎(chǔ),是理論中的理論,哲學(xué)中的哲學(xué)。從Ontology的發(fā)展形態(tài)看,它是把系詞“是”以及分有“是”的種種“所是”(即存在)作為范疇,通過邏輯的方法構(gòu)造出來的先驗原理體系?!笆恰笔俏鞣秸軐W(xué)中最抽象,最普遍的范疇,存在和本質(zhì)是“是”是有區(qū)別的,Ontology中的“是”的意義就是它的邏輯規(guī)定性,這是Omology語言與日常語言的一個根本區(qū)別。日常語言中的詞或概念歸根結(jié)蒂是經(jīng)驗的:它或是指示一個經(jīng)驗中的對象或者是主觀心態(tài)的描述,而Ontology的語言則是通過其范疇的邏輯規(guī)定性而使“語
5、言”變成了某種獨立的特殊王國,這就是Ontology哲學(xué)的語言秘密,Ontology“通過詞的形式具有自身的內(nèi)容”,Ontology語言的這一特性,同Ontology的特殊思想方式是一致的,它是一種純粹的思想哲學(xué)。第一位為Ontology下定義的是德國哲學(xué)家沃爾夫,他認為:“Ontology論述各種抽象的,完全普遍的哲學(xué)范疇,在這個抽象的形而上學(xué)中產(chǎn)生偶性、實體、因果現(xiàn)象等范疇。”所以,Ontology是靠從概3的參數(shù)[21o查塵率是檢索出的相關(guān)文擋數(shù)與文檔集中所有的相關(guān)文檔數(shù)的比率。對于Web信息檢索系統(tǒng)來講,因為對于一個查陶總能返回很
6、多信息,查全率一般不成問題。沒有一個Web信息檢索系統(tǒng)能夠搜集到所有的Web阿頁”1,查全率根難比較,因此衡量web信息檢索的性能時,備,壘=率很少使用。音準率是檢索山的相關(guān)文檔數(shù)與檢索出的文檔總數(shù)的比率?!銇碚f,查準率很少能夠達到log%。對于一個信息檢索系統(tǒng)來講,查全率和查準率不可能兩全其美。查全率高時,查準率低。為了達到很高的查壘率,需要使用限制較弱的檢索條fl:,這樣查準率不高,反之亦然。較好的做法是對查全率與齏準率兩種要求采取中庸態(tài)度,即采用中間程度的檢索條件,這樣可以得到一種中間最優(yōu)效糶。3.信息檢索技術(shù)的分類(1)全文檢索
7、(TextRetrleval)全文檢索就是把用戶的查詢請求和仝文中的每~個詞進行比較,不考慮查詢請求和文件語義上的匹配。缺點是雖然可以保證杏全率,但是查準率大大降低。(2)數(shù)據(jù)檢索(DataRetrieval)數(shù)據(jù)榆索是查詢要求和信息系統(tǒng)中的數(shù)據(jù)都遵循一定的格式,具有一定的結(jié)構(gòu),允許對特定字段檢索。需要有標識字段的方法。其缺點是性能取決于所使用的字段標識方法和用戶對方法的理解,具自很大的局限性.支持語義匹配的能力較差。(3)知識檢索(KnowledgeRetrieval)知識檢索是基于知識的、語義上的匹配,在查準率和查全率上有更好的保證。
8、是信息檢索的重點,特別是面向web信息的知識檢索的重點。卜1—2Ont0109y的定義Ontology是一個哲學(xué)上的概念,用下描述事物的本質(zhì),在近一、二十年,Onlo
9、oBy己被計算機領(lǐng)域所采