資源描述:
《基于句法樹的中文詞義消歧方法研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、工學碩士學位論文基于句法樹的中文詞義消歧方法研究欒博哈爾濱理工大學國內圖書分類號:TP391.2工學碩士學位論文基于句法樹的中文詞義消歧方法研究碩士研究生:導師:申請學位級別:學科、專業(yè):所在單位:答辯日期:授予學位單位:欒博張春祥工學碩士計算機系統(tǒng)結構計算機科學與技術學院2014年3月哈爾濱理工大學ClassifiedIndex:TP391.2DissertationfortheMasterDegreeinEngineeringCandidate:Supervisor:OilParsingTreeLuanBOZhangChunxiangAcadem
2、icDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerSystemStructureDateofOralExamination:March,2014University2HarbinUniversityofScienceandTechnology哈爾濱理工大學碩士學位論文原創(chuàng)性聲明本人鄭重聲明:此處所提交的碩士學位論文《基于句法樹的中文詞義消歧方法研究》,是本人在導師指導下,在哈爾濱理工大學攻讀碩士學位期間獨立進行研究工作所取得的成果。據(jù)本人所知,論文中除已注明部分外不包含他人已發(fā)表或撰寫過的
3、研究成果。對本文研究工作做出貢獻的個人和集體,均已在文中以明確方式注明。本聲明的法律結果將完全由本人承擔。作者簽名:日期:≯礦,孑年弓月弓
4、日哈爾濱理工大學碩士學位論文使用授權書《基于句法樹的中文詞義消歧方法研究》系本人在哈爾濱理工大學攻讀碩士學位期間在導師指導下完成的碩士學位論文。本論文的研究成果歸哈爾濱理工大學所有,本論文的研究內容不得以其他單位的名義發(fā)表。本人完全了解哈爾濱理工大學關于保存、使用學位論文的規(guī)定,同意學校保留并向有關部門提交論文和電子版本,允許論文被查閱和借閱。本人授權哈爾濱理工大學可以采用影印、縮印或其他復制手段保存論文,可以公
5、布論文的全部或部分內容。本學位論文屬于保密廠],在年解密后適用授權書。不保密I刁。(請在以上相應方框內打√)作者簽名:導師簽名:鄉(xiāng)諸奄同期:,.Q14年弓月≥lR日期:’,Q14年弓月多i日哈爾濱理工大學工學碩士學位論文基于句法樹的中文詞義消歧方法研究摘要漢語的一詞多義現(xiàn)象使機器對自然語言的處理帶來了許多困難,很多自然語言處理領域的問題歸根結底都是解決詞語的歧義問題。如何才‘能讓計算機理解一個歧義詞在其特定的上下文中準確的含義是詞義消歧需要解決的首要問題。詞義消歧對于很多自然語言處理的應用問題都有非常重要的作用,諸如信息檢索、機器翻譯、文本分類和自動
6、文摘等。本文研究的是統(tǒng)計學習方法中的有指導的詞義消歧方法,這種方法與機器學習方法的結合是當前主流的詞義消歧方法。而且這種方法的靈活性好,擴展性高,同時還能夠應付語言的發(fā)展變化,受到了國內外學者的一致好評。本文主要有以下幾部分的研究內容:首先,研究了詞義消歧的多種分類方法,介紹了比較權威的詞義消歧評測體系,并提出了在詞義消歧的過程中可能遇到的問題及解決方案。其次,研究了詞義消歧特征工程的兩方面內容:特征的提取和特征的選擇。在特征提取部分,研究了基于滑動詞窗和基于句法分析樹的特征提取方法,重點闡述了句法分析樹的建立過程以及基于句法分析樹的特征提取方法的算
7、法流程。在特征選擇部分,研究了基于詞的特征提取方法,利用句法信息的特點,提出了將句法信息和詞性信息融合的特征選擇方法。同時,根據(jù)樸素貝葉斯模型的魯棒性和適用性等特點,優(yōu)化了基于句法樹的貝葉斯詞義消歧分類模型。最后,研究了詞義消歧模塊在機器翻譯中的應用。在實際機器翻譯系統(tǒng)中加入了詞義消歧模塊,雖然研究并不完善,得到的結果也不是很令人滿意,但也能給機器翻譯提供一定的現(xiàn)實意義。關鍵詞自然語言處理;詞義消歧;特征工程;機器學習方法;機器翻譯哈爾濱理工大學工學碩士學位論文isambiguationBased0ndParsingTreeAbstractThepo
8、lysemyphenomenonofChinesehasbroughtmanydifficultiestonaturallanguageprocessin(NLP).Themostimportantthinginnaturallanguageprocessingistosolvetheproblemsofambiguouswords.Wordsensedisambiguation(WSD)isusedtomakecomputerunderstandtheaccuratemeaningofanambiguouswordinacertaincontext
9、.ItisveryimportanttothefieldofnaturaIlanguageprocessin