資源描述:
《中醫(yī)藥領域本體研究概述 》由會員上傳分享,免費在線閱讀,更多相關內容在工程資料-天天文庫。
1、中醫(yī)藥領域本體研究概述【關鍵詞】本體構建;中醫(yī)藥;綜述本體(Ontology)自20世紀90年代引入計算機人工智能領域后,在計算機及相關領域迅速形成一個研究熱點。作為一種能在語義和知識層次上描述信息系統(tǒng)的概念模型建模工具,將在人工智能、知識工程、圖書情報等領域具有重要的作用和廣闊的應用前景。筆者從中醫(yī)藥領域本體構建、基于本體的中醫(yī)藥語言系統(tǒng)和應用系統(tǒng)三方面對中醫(yī)藥本體研究進行概述,并結合發(fā)展現(xiàn)狀對其進行展望?! ?本體與本體構建 1.1本體的概念 本體是源于哲學的一個概念,原指對世界上客觀存在物的系統(tǒng)描述,即存在論,后
2、衍生到語言、信息、知識系統(tǒng)等領域,被定義為“概念化的明確的規(guī)范說明”。目前,關于本體的定義有很多種說法,但不外有兩層含義:一是哲學領域的存在,是本體論的研究對象;二是延伸到特定領域之中,指某套概念及其相互之間關系的形式化表達,包括概念化、規(guī)范化、形式化和共享4個特征[1]?! 谋倔w的內涵上看,綜合不同學者的認識,本體大都被認為是信息、知識的底層構架工具,用于組織較高層次的知識抽象,是領域知識概念化、形式化的說明,也可以是特定領域內“人機交流”的語義基礎,即提供概念與概念之間關系的共識。按照領域依賴程度,本體可以分為頂層、
3、領域、任務和應用本體4類;按照主題可分為知識表示本體、通用本體、領域本體、術語本體和任務本體。中醫(yī)藥本體主要用于描述中醫(yī)領域知識的專門本體,是專業(yè)性本體,一般屬于領域本體和知識表示本體?! ?.2本體構建工具與描述語言 在本體構建方面,一是利用已有的敘詞表或術語詞典進行改造;二是利用現(xiàn)有信息和領域專家從頭做起,而以后者較常用。目前已經得到公認的方法包括Bemeras法(KACTUS法)、SENSUS法、“骨架”法、企業(yè)建模法(TOVE法)、Methontology法等。Gruber[2]于1995年提出了本體構建的五條規(guī)
4、則(明確性和客觀性、完全性、一致性、最大單調可擴展性、最小承諾),但本體工程構建方法尚處于相對不成熟階段。本體的構建工具也有很多,包括protégé、Ontology ManagementSystem等,其中,protégé是斯坦福大學開發(fā)的使用較為廣泛的構建工具之一,目前已有4.0版本?! ”倔w要對概念進行清晰的、形式化的描述,須有相應的描述語言和建模元語(本體描述方法)。本體描述語言一般應具有良好定義的語法、語義,有效推理和良好的表達能力。本體描述語言有很多,包括RDF和RDF-S、OIL、DAML、OL、Ontoli
5、ngua、Cycl、Loom等。2004年,W3C發(fā)布了支持語義網的2個技術標準——RDF和OWL。OWL建立在RDF基礎之上,能夠確切地表達詞表中術語的含義和這些術語的關系,相對于RDF,OWL能夠更好地表達語義[3]。Perez等[4]歸納出5個基本的建模元語,即一個完整的本體應該具有類、關系、函數(shù)、公理和實例5個部分?! ?中醫(yī)藥本體研究 2.1中醫(yī)藥領域本體構建 中醫(yī)本體的構建是通過對中醫(yī)概念的提取、關系的分析,將中醫(yī)知識明確、規(guī)范地表達,以便于知識的共享和傳承。中醫(yī)藥知識體系的復雜性決定了其本體構建的復雜。在
6、分類上,國家知識基礎設施(NKI)課題中的中醫(yī)本體的劃分中就有中醫(yī)診斷方法、中醫(yī)術語、中醫(yī)證、中醫(yī)脈象、中醫(yī)病機等30多個中醫(yī)本體類。在NKI基礎上還構建了中醫(yī)舌診本體和中醫(yī)肝病本體[5];此外,中醫(yī)概念的不規(guī)范和多重性使得其本體構建更加復雜。因此,中醫(yī)領域的本體構建多是從其子領域進行探索性研究?! ≡诶碚撗芯可?高氏等[6]認為,構建中醫(yī)本體是在語義層次發(fā)掘中醫(yī)知識的基礎,并就中醫(yī)頂層本體的概念及其與領域本體之間的關系、本體的構建原則及其在中醫(yī)頂層本體構建過程中的應用做了初步的探索。 在構建過程中,一般采用protég
7、é工具加OLS)屬于術語本體方面的研究。語義本體可以解決“人機”交流障礙,從而利于知識共享,中醫(yī)知識在交流與傳承上的障礙更加明顯,因此中醫(yī)藥語義本體意義重大。自2001年開始,中國中醫(yī)科學院聯(lián)合全國30多家中醫(yī)院校和多家科研單位,開始建立“中醫(yī)藥學一體化語言系統(tǒng)”。該系統(tǒng)以本體論為指導,按照本體論原理進行設計,旨在建立一個計算機化的、可持續(xù)發(fā)展的、包含中醫(yī)藥學及其相關學科的中國醫(yī)藥學檢索語言集成系統(tǒng)和機讀信息資源指南系統(tǒng),形成中醫(yī)藥學及其相關學科的語言系統(tǒng)平臺。目前,該系統(tǒng)已經成為世界上最大的傳統(tǒng)醫(yī)藥本體,有16個一級類目
8、,共編錄12862個類[14]?! ×质系萚15]對中醫(yī)藥領域概念表達的特點和中醫(yī)藥檢索的現(xiàn)狀進行分析,以中醫(yī)方劑學領域本體的構建過程為例,說明本體在中醫(yī)藥自然語言語義化和信息表示上的優(yōu)勢,提出對中醫(yī)藥概念的表達不必單純地強求標準化和一致性,認為本體可以完整、忠實、準確地表達中醫(yī)藥傳統(tǒng)理論的語義,并做到