資源描述:
《基于隱馬爾可夫模型的中文詞義消歧方法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、工學(xué)碩士學(xué)位論文基于隱馬爾可夫模型的中文詞義消歧方法研究孫彥晨哈爾濱理工大學(xué)2016年3月國(guó)內(nèi)圖書(shū)分類號(hào):TP391.2工學(xué)碩士學(xué)位論文基于隱馬爾可夫模型的中文詞義消歧方法研究碩士研究生:孫彥晨導(dǎo)師:張春祥申請(qǐng)學(xué)位級(jí)別:工學(xué)碩士學(xué)科、專業(yè):計(jì)算機(jī)科學(xué)與技術(shù)所在單位:計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院答辯日期:2016年3月授予學(xué)位單位:哈爾濱理工大學(xué)ClassifiedIndex:TP391.2DissertationfortheMasterDegreeinEngineeringChineseWordSenseDisambiguationBasedonHiddenMarkovModelC
2、andidate:SunYanchenSupervisor:ZhangChunxiangAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerScienceandTechnologyDateofOralExamination:March,2016University:HarbinUniversityofScienceandTechnology哈爾濱理工大學(xué)碩±學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:此處所提交的碩±學(xué)位論文《基于隱馬爾可夫模型的中文詞義消歧技術(shù)研巧》,是本人在導(dǎo)師指導(dǎo)下,在哈爾濱理工大學(xué)攻
3、讀碩±學(xué)位期間獨(dú)立進(jìn)行研巧工作所取得的成果。據(jù)本人所知,論文中除已注明部分外不包含他人已發(fā)表或撰寫(xiě)過(guò)的研究成果。對(duì)本文研巧工作做出貢獻(xiàn)的個(gè)人和集體,均己在文中明確方式注明。本聲明的法律結(jié)果將完全由本人承擔(dān)。。乂作者簽名日期:2年W月?巧哈爾濱理工大學(xué)碩±學(xué)位論文使用授權(quán)書(shū)《基于隱馬爾可夫模型的中文詞義消歧技術(shù)研究》系本人在哈爾濱理工大學(xué)攻讀碩±學(xué)位期間在導(dǎo)師指導(dǎo)下完成的碩±學(xué)位論文。本論文的研巧成果歸哈。爾濱理工大學(xué)所有,本論文的研究?jī)?nèi)容不得其他單位的名義發(fā)表本人完全了解哈爾濱理工大學(xué)關(guān)于保存、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向有關(guān)
4、部口提交論文和電子版本。,允許論文被查閱和借閱本人授權(quán)哈爾濱理工大學(xué)可、縮印或其他復(fù)制手段保存論文,可W公布論文的全部或部分內(nèi)1^采用影印容。■本學(xué)位論文屬于保密,在年解密后適用授權(quán)書(shū)。I□不保密0。(請(qǐng)?jiān)冢咨舷鄳?yīng)方框內(nèi)打V)日期‘作者簽名:年W月日o?i導(dǎo)師簽名;:日期年的月日基于隱馬爾可夫模型的中文詞義消歧技術(shù)研究摘要在自然語(yǔ)言中,一詞多義的現(xiàn)象普遍存在,這使得機(jī)器對(duì)自然語(yǔ)言的處理變得十分困難,詞義消歧是自然語(yǔ)言處理領(lǐng)域的一個(gè)關(guān)鍵問(wèn)題。詞義消歧的目標(biāo)就是讓機(jī)器能夠在特定的上下文中自動(dòng)判斷歧義詞的準(zhǔn)確含義。在信息檢索、主題跟蹤、文本
5、分類和機(jī)器翻譯等方面,都有著十分重要的作用。到目前為止,詞義消歧一直是困擾計(jì)算語(yǔ)言研究者的復(fù)雜問(wèn)題。本文的主要研究?jī)?nèi)容是基于機(jī)器學(xué)習(xí)理論的有監(jiān)督詞義消歧方法,這種方法是目前詞義消歧領(lǐng)域中的主流研究方法。該方法有著很強(qiáng)的擴(kuò)展性和靈活性,能夠應(yīng)對(duì)不同語(yǔ)言并適應(yīng)語(yǔ)言的發(fā)展。本文的主要研究?jī)?nèi)容有以下幾個(gè)部分:首先,對(duì)詞義消歧領(lǐng)域的發(fā)展情況進(jìn)行了闡述,并列舉了有代表性的方法。對(duì)消歧模型的權(quán)威評(píng)價(jià)體系進(jìn)行了介紹,并闡述了影響詞義消歧研究的仍未解決的問(wèn)題。其次,介紹了消歧過(guò)程中所用到的語(yǔ)料及詞典,對(duì)語(yǔ)料的解析過(guò)程、語(yǔ)料的性能、消歧特征的提取和選擇進(jìn)行了研究。為了判定分類器結(jié)果的正確性,研
6、究了兩種映射方法。在分析了同義詞詞林中對(duì)語(yǔ)義分類方式后,選擇兩層語(yǔ)義代碼作為消歧特征,以此來(lái)優(yōu)化隱馬爾可夫模型,構(gòu)建了基于隱馬爾可夫模型的消歧分類器。最后,將詞義消歧看作隱馬爾可夫模型的解碼問(wèn)題,提出了基于維特比算法的消歧算法,并詳細(xì)講解了算法的計(jì)算過(guò)程。做了兩組實(shí)驗(yàn)來(lái)評(píng)價(jià)本文所提出的方法。關(guān)鍵詞自然語(yǔ)言處理;詞義消歧;特征提??;隱馬爾可夫模型-I-ChineseWordSenseDisambiguationBasedonHiddenMarkovModelAbstractInnaturallanguage,thepolysemyphenomenonisuniversal.S
7、oitisverydifficultforthemachinetoprocessnaturallanguage.Wordsensedisambiguation(WSD)isanimportantprobleminnaturallanguageprocessing.Thetaskofwordsensedisambiguationistodeterminetheexactmeaningofanambiguouswordsinaspecificcontext.Ithasimportantrolesininformatio