資源描述:
《基于xml的漢語(yǔ)框架網(wǎng)的語(yǔ)義表示與實(shí)現(xiàn)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、基于XML的漢語(yǔ)框架網(wǎng)的語(yǔ)義表示與實(shí)現(xiàn)第一章引言1.1研究背景及意義漢語(yǔ)框架語(yǔ)義知識(shí)庫(kù)Fillmore的框架語(yǔ)義學(xué)作為理論基礎(chǔ),FrameNetm為參照,以漢語(yǔ)語(yǔ)料事實(shí)為依據(jù)的供計(jì)算機(jī)使用的漢語(yǔ)詞匯語(yǔ)義數(shù)據(jù)庫(kù)。CFN主要是由框架庫(kù)、句子庫(kù)和詞元庫(kù)所構(gòu)成的。目前構(gòu)建了323個(gè)漢語(yǔ)框架,渉及3947個(gè)詞元,標(biāo)注了20000條句子,為計(jì)算機(jī)進(jìn)行漢語(yǔ)框架語(yǔ)義分析及其應(yīng)用研巧提供了寶貴的漢語(yǔ)語(yǔ)義資源[2]。如何有效的對(duì)漢語(yǔ)框架網(wǎng)[M]的資源進(jìn)行知識(shí)表示,是實(shí)現(xiàn)其應(yīng)用價(jià)值的關(guān)鍵所在。本文使用可擴(kuò)展標(biāo)記語(yǔ)言(XML)來(lái)表示CFN資源數(shù)據(jù),提供統(tǒng)一的
2、描述方法,實(shí)現(xiàn)機(jī)器自動(dòng)高效讀取,同時(shí)XML語(yǔ)言又方便展示為適合人類閱讀和理解的網(wǎng)頁(yè),送些都為后續(xù)研究及相關(guān)語(yǔ)義輔助工具的應(yīng)用提供幫助。.........1.2國(guó)內(nèi)外研究現(xiàn)狀目前自動(dòng)問(wèn)答系統(tǒng)是自然語(yǔ)言處理的一個(gè)熱點(diǎn),它需要依賴大量的語(yǔ)義知識(shí)來(lái)進(jìn)行語(yǔ)言的語(yǔ)義表示,因此上世紀(jì)80年,人們開始致力于構(gòu)架語(yǔ)義資源知識(shí)工程,國(guó)內(nèi)外較著名的有FrameNet、以ordNet、知網(wǎng)、語(yǔ)言技術(shù)平臺(tái)(LanguageTenologyat 基于XML的漢語(yǔ)框架網(wǎng)的語(yǔ)義表示與實(shí)現(xiàn)第一章引言1.1研究背景及意義漢語(yǔ)框架語(yǔ)義知識(shí)庫(kù)Fillmore的框架語(yǔ)義學(xué)作
3、為理論基礎(chǔ),FrameNetm為參照,以漢語(yǔ)語(yǔ)料事實(shí)為依據(jù)的供計(jì)算機(jī)使用的漢語(yǔ)詞匯語(yǔ)義數(shù)據(jù)庫(kù)。CFN主要是由框架庫(kù)、句子庫(kù)和詞元庫(kù)所構(gòu)成的。目前構(gòu)建了323個(gè)漢語(yǔ)框架,渉及3947個(gè)詞元,標(biāo)注了20000條句子,為計(jì)算機(jī)進(jìn)行漢語(yǔ)框架語(yǔ)義分析及其應(yīng)用研巧提供了寶貴的漢語(yǔ)語(yǔ)義資源[2]。如何有效的對(duì)漢語(yǔ)框架網(wǎng)[M]的資源進(jìn)行知識(shí)表示,是實(shí)現(xiàn)其應(yīng)用價(jià)值的關(guān)鍵所在。本文使用可擴(kuò)展標(biāo)記語(yǔ)言(XML)來(lái)表示CFN資源數(shù)據(jù),提供統(tǒng)一的描述方法,實(shí)現(xiàn)機(jī)器自動(dòng)高效讀取,同時(shí)XML語(yǔ)言又方便展示為適合人類閱讀和理解的網(wǎng)頁(yè),送些都為后續(xù)研究及相關(guān)語(yǔ)義輔助工
4、具的應(yīng)用提供幫助。.........1.2國(guó)內(nèi)外研究現(xiàn)狀目前自動(dòng)問(wèn)答系統(tǒng)是自然語(yǔ)言處理的一個(gè)熱點(diǎn),它需要依賴大量的語(yǔ)義知識(shí)來(lái)進(jìn)行語(yǔ)言的語(yǔ)義表示,因此上世紀(jì)80年,人們開始致力于構(gòu)架語(yǔ)義資源知識(shí)工程,國(guó)內(nèi)外較著名的有FrameNet、以ordNet、知網(wǎng)、語(yǔ)言技術(shù)平臺(tái)(LanguageTenologyat 基于XML的漢語(yǔ)框架網(wǎng)的語(yǔ)義表示與實(shí)現(xiàn)第一章引言1.1研究背景及意義漢語(yǔ)框架語(yǔ)義知識(shí)庫(kù)Fillmore的框架語(yǔ)義學(xué)作為理論基礎(chǔ),FrameNetm為參照,以漢語(yǔ)語(yǔ)料事實(shí)為依據(jù)的供計(jì)算機(jī)使用的漢語(yǔ)詞匯語(yǔ)義數(shù)據(jù)庫(kù)。CFN主要是由框架庫(kù)、
5、句子庫(kù)和詞元庫(kù)所構(gòu)成的。目前構(gòu)建了323個(gè)漢語(yǔ)框架,渉及3947個(gè)詞元,標(biāo)注了20000條句子,為計(jì)算機(jī)進(jìn)行漢語(yǔ)框架語(yǔ)義分析及其應(yīng)用研巧提供了寶貴的漢語(yǔ)語(yǔ)義資源[2]。如何有效的對(duì)漢語(yǔ)框架網(wǎng)[M]的資源進(jìn)行知識(shí)表示,是實(shí)現(xiàn)其應(yīng)用價(jià)值的關(guān)鍵所在。本文使用可擴(kuò)展標(biāo)記語(yǔ)言(XML)來(lái)表示CFN資源數(shù)據(jù),提供統(tǒng)一的描述方法,實(shí)現(xiàn)機(jī)器自動(dòng)高效讀取,同時(shí)XML語(yǔ)言又方便展示為適合人類閱讀和理解的網(wǎng)頁(yè),送些都為后續(xù)研究及相關(guān)語(yǔ)義輔助工具的應(yīng)用提供幫助。.........1.2國(guó)內(nèi)外研究現(xiàn)狀目前自動(dòng)問(wèn)答系統(tǒng)是自然語(yǔ)言處理的一個(gè)熱點(diǎn),它需要依賴大量的語(yǔ)
6、義知識(shí)來(lái)進(jìn)行語(yǔ)言的語(yǔ)義表示,因此上世紀(jì)80年,人們開始致力于構(gòu)架語(yǔ)義資源知識(shí)工程,國(guó)內(nèi)外較著名的有FrameNet、以ordNet、知網(wǎng)、語(yǔ)言技術(shù)平臺(tái)(LanguageTenologyatform,LTP等。其中FrameNet和語(yǔ)言技術(shù)平臺(tái)都選擇使用XML作為底層數(shù)據(jù)表示。FrameNet是一個(gè)以框架語(yǔ)義學(xué)為理論,以框架為基礎(chǔ)的基于英語(yǔ)詞匯的真實(shí)文本的人機(jī)可讀的詞匯數(shù)據(jù)庫(kù)[11。FmmeNet目前收集詞條超過(guò)10000余條,針對(duì)每個(gè)詞匯都有詳盡的解釋,用于指導(dǎo)詞匯的正確學(xué)習(xí)。針對(duì)每個(gè)詞元進(jìn)行實(shí)例標(biāo)注,達(dá)17萬(wàn)條,為精確定文語(yǔ)義角色提
7、供獨(dú)有的數(shù)據(jù)集。目前FrameNet作為一個(gè)開源的數(shù)據(jù)集岡,己被世界各地自然語(yǔ)言處理的研究人員下載使用。此外,中國(guó)、日本、葡萄牙、德國(guó)和西班牙等國(guó)的自然語(yǔ)言處理領(lǐng)域的學(xué)者也將研究的重點(diǎn)投向以框架語(yǔ)義學(xué)為基礎(chǔ)的資源庫(kù)建設(shè),同時(shí)建設(shè)具有各國(guó)語(yǔ)言特色的框架語(yǔ)義知識(shí)資源庫(kù)。在平臺(tái)展示資源方面,FrameNet使用XML標(biāo)記語(yǔ)言,將句子庫(kù)、詞兀、框架和框架關(guān)系生成機(jī)器可讀的XML文件,在文件添加屬性ID將10000多條資源聯(lián)系在一起。為了方便查詢,FrameNet構(gòu)建索引,通過(guò)Framelndex.xsl文件進(jìn)行控制。問(wèn)時(shí)建立fodatal.5
8、把所有資源統(tǒng)一的營(yíng)理。為了讓資源展現(xiàn)出來(lái)美觀,讓研究人員更容易發(fā)現(xiàn)框架語(yǔ)叉特點(diǎn)進(jìn)而進(jìn)行研究和應(yīng)用,FrameNet將框架元素和口標(biāo)詞等,都做了不同程度的修飾,通過(guò)調(diào)用Frame.xsl文件對(duì)其字體的顏色、樣式進(jìn)行控制。國(guó)