資源描述:
《基于語(yǔ)義類(lèi)詞法信息的詞義消歧》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、工學(xué)碩±學(xué)位論文基于語(yǔ)義類(lèi)詞法信息的詞義消歧孫瓣榮哈爾濱理王大學(xué)2016年3月國(guó)內(nèi)圖書(shū)分類(lèi)號(hào).2:TP391工學(xué)碩i學(xué)位論文基于語(yǔ)義類(lèi)詞法信息的詞義消歧碩±研究生:孫雜榮導(dǎo)師:張春祥申請(qǐng)學(xué)位級(jí)別:工學(xué)碩擊學(xué)科、專(zhuān)業(yè):計(jì)算機(jī)科學(xué)與技術(shù)所在單位:計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院答辯日期:2016年3月授予學(xué)位單位:哈爾濱理工大學(xué)ClassifiedIndex:TP391.2DissertationfortheMasterDegreeinEngineeringWordSenseDisambiguationBas
2、edonSemanticandLexicalInformationCandidate:SunLurongSupervisor:ZhangChunxiangAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerScienceandTechnologyDateofOralExamination:March,2016University:HarbinUniversityofScienceandTechnology哈爾演理工大學(xué)碩±學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:此處巧提交的碩古學(xué)位論文《
3、基于語(yǔ)義類(lèi)詞法信息的詞義消歧》,是本人在導(dǎo)師指導(dǎo)下,在哈爾濱理工大學(xué)攻讀碩±學(xué)位期間獨(dú)立進(jìn)行研巧工作所取得的成果。據(jù)本人所知,論文中除已注明部分外不包含他人已發(fā)表或撰寫(xiě)過(guò)的研巧成果。對(duì)本文研究工作做出貢獻(xiàn)的個(gè)人和集體,均已在文中臥明確方式注明。本聲明的法律結(jié)果將完全由本人承擔(dān)。'作者簽名、巧菱賽-日期;從八年*月如日:或哈爾濱理工大學(xué)碩±學(xué)位論文使用授權(quán)書(shū)《基于語(yǔ)義類(lèi)詞法信息的漢語(yǔ)詞義消歧》系本人在哈爾濱理工大學(xué)攻讀碩±學(xué)位期間在導(dǎo)師指導(dǎo)下完成的碩壬學(xué)位訟文。本論文的研究成果歸哈爾濱理工Jt其他單位的名義發(fā)表大學(xué)所有
4、,本論文的研巧內(nèi)容不得t^。本人完全了解哈爾濱理工大學(xué)關(guān)于保存、使用學(xué)位論文的規(guī)定*同意學(xué)校保留并向有關(guān)部口提交論文和電子版本。本人授權(quán)哈爾濱理工大學(xué)可抖采用,允許論文被查閱和借閱影印、縮印或其他復(fù)制手段保存論文,可公布論文的全部或部分內(nèi)容。本學(xué)位論文屬于保密,在年解密后適用授權(quán)書(shū)。I□不保密0。(請(qǐng)?jiān)谂P上相應(yīng)方框內(nèi)打V)日期A。//年;作者簽名:菊、聰秦:月日導(dǎo)師籍名:多月炭曰;曰期如U年哈爾濱理工大學(xué)工學(xué)碩士學(xué)位論文基于語(yǔ)義類(lèi)詞法信息的詞義消歧摘要漢語(yǔ)的詞匯組合搭配的靈活性和變通性,導(dǎo)致中文詞匯歧義現(xiàn)
5、象的產(chǎn)生。語(yǔ)言的不確定性直接影響著自然語(yǔ)言處理領(lǐng)域的相關(guān)應(yīng)用的實(shí)現(xiàn),這說(shuō)明詞義消歧研究是解決自然語(yǔ)言處理的關(guān)鍵。讓計(jì)算機(jī)依據(jù)從語(yǔ)料中提取出的語(yǔ)言學(xué)知識(shí),自動(dòng)地為歧義詞匹配符合語(yǔ)境的詞義是詞義消歧的目的。本文針對(duì)本課題的研究的起源、意義和已有研究現(xiàn)狀以及詞義消歧未來(lái)將面臨的挑戰(zhàn)進(jìn)行了介紹,并對(duì)比分析了主流詞義消歧方法的優(yōu)缺點(diǎn)。參考已有的相關(guān)知識(shí)和研究成果,提出一種結(jié)合統(tǒng)計(jì)學(xué)習(xí)理論的有監(jiān)督的混合特征消歧方法。該方法結(jié)合語(yǔ)言學(xué)中常用的詞法信息和語(yǔ)義類(lèi)信息作為消歧特征。最后利用提取到的特征來(lái)訓(xùn)練分類(lèi)模型,并測(cè)試該模型的消歧準(zhǔn)確率。本文的研究?jī)?nèi)容主要體現(xiàn)為以下三個(gè)
6、方面:其一,本文闡述了詞義消歧領(lǐng)域中較為主流的消歧方法,并針對(duì)這些方法做出示例和比較。簡(jiǎn)述了詞義消歧的評(píng)測(cè)體系和準(zhǔn)確率的計(jì)算方式,以及詞義消歧研究亟待解決的問(wèn)題。其二,分析了詞義消歧的語(yǔ)言學(xué)工程資源,包括語(yǔ)料的來(lái)源、語(yǔ)料格式、解析工具、語(yǔ)料標(biāo)注體系、特征篩選和特征的提取。深入研究語(yǔ)料可提供的語(yǔ)言學(xué)知識(shí)有助于篩選出有益于消歧的特征。利用《同義詞詞林》獲得詞匯的語(yǔ)義類(lèi)信息即語(yǔ)義代碼,結(jié)合語(yǔ)義類(lèi)和詞法信息的特征提取方法,可以獲取包括語(yǔ)義代碼、詞形和詞性等語(yǔ)言學(xué)知識(shí)。其中,語(yǔ)義代碼的多層知識(shí)結(jié)構(gòu)可以提供不同層次的指導(dǎo)。其三,通過(guò)提取單一特征或不同特征信息的組合,
7、構(gòu)建有差異的特征向量集。分別利用這些差異化的特征向量集訓(xùn)練支持向量機(jī)分類(lèi)器,然后對(duì)比多組不同特征向量集的實(shí)驗(yàn)結(jié)果,證明新方法及消歧分類(lèi)器的性能。關(guān)鍵詞詞義消歧;語(yǔ)義類(lèi);詞法信息;特征提取;支持向量機(jī)-I-哈爾濱理工大學(xué)工學(xué)碩士學(xué)位論文WordSenseDisambiguationBasedonSemanticandLexicalInformationAbstractVocabularycollocationofChineselanguagehasstrongflexibilityandversatility,thesefeaturesleadtotheg
8、enerationofChineselexicalambiguity.Theun