資源描述:
《神經(jīng)機器翻譯系統(tǒng)在維吾爾語-漢語翻譯中的性能對比》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、神經(jīng)機器翻譯系統(tǒng)在維吾爾語-漢語翻譯中的性能對比哈里旦木?阿布都克里木劉洋孫茂松清華大學(xué)計算機科學(xué)與技術(shù)系智能技術(shù)與系統(tǒng)國家重點實驗室清華信息科學(xué)與技術(shù)國家實驗室(籌)摘要:基于深度學(xué)習(xí)的神經(jīng)機器翻譯已在多個語言對上顯著超過傳統(tǒng)的統(tǒng)計機器翻譯,成為當前的主流機器翻譯技術(shù)。該文從詞粒度層面出發(fā),對國際上具有影響力的6種神經(jīng)機器翻譯方法在維吾爾語-漢語翻譯任務(wù)上進行了深入分析和比較,這6種方法分別是基于注意力機制(Groundllog),詞表擴大(LV-groundhog),源語言和目標語言采用子詞(subword-nmt)、字符與詞混合(nmt.hybri
2、d)、子詞與字符(dl4mt-cdec)以及完全字符(dl4mt-c2c)方法。實驗結(jié)果表明:源語言采用子詞、目標語言采用字符的方法(dl4mtcdec)在維吾爾語-漢語神經(jīng)機器翻譯任務(wù)上性能最佳。該文不僅是首次將神經(jīng)機器翻譯方法應(yīng)用到維吾爾語-漢語機器翻譯任務(wù)上,也是首次將不同的神經(jīng)機器翻譯方法在同一語料庫上進行了對比分析。該研究對維吾爾語-漢語機器翻譯任務(wù)和神經(jīng)機器翻譯的進一步研究工作都具有重要的參考意義。關(guān)鍵詞:神經(jīng)機器翻譯;資源匱乏語言;維吾爾語;作者簡介:哈里旦木?阿布都克里木(1978—),女,博士研究生。作者簡介:劉洋,副教授,E-mail
3、:liuyang201l@tsinghua.edu.cn收稿日期:2017-02-23基金:國家自然科學(xué)基金重點項目(61331013)PerformancecomparisonofneuralmachinetranslationsystemsinUyghur-ChinesetranslationHalidanmuAbudukelimuLIUYangSUNMaosongTsinghuaNationalLaboratoryforInformstionScienceandTechnology,StateKeyLaboratoryofIntelligentTe
4、chnologyandSystems,DepartmentofComputerScienceandTechnology,TsinghuaUniversity;Abstract:Theneuralmachinetranslationbasedondeeplearningsignificantlysurpassesthetraditionalstatisticalmachinctremslationinmanylanguages,andbecomesthecurrentmainstreammachinetranslationtechnology.Thispa
5、percomparessixinfluentialneuralmachinetranslationmethodsfromthelevelofwordgranularityinthetaskofUyghur-Chinesemachinetranslation.Thesemethodsareattentionmechanism(Groundllog)、vocabularyexpansion(LV-groundhog),sourcelanguagcandtargetlanguagewithsubwordunits(subword-nmt),characters
6、andwordsmixed(nmt.hybrid),subwordunitsandcharacters(dl4mt-cdec),andcompletecharacters(dl4mt-c2c).TheexperimentalresultsshowthatUyghur-Chineseneuralmachinetransleitionperformsbestwhenthesourcelemguagcissegmcntedintosubwordunitsandthetargetlemguagcisrepresentedbycharacters(dl4mt-cd
7、ec).ThispaperisthefirsttouseneuralmachinetranslationforUyghur-Chinesemachinetranslationandthefirsttocomparedifferentneuralmachinetranslationmethodsonthesamecorpus.ThisworkisanimportantrefereneenotonlyforUyghur-Chinesemachinctremslation,butalsoforgencralncuralmachinctranslationtas
8、ks.Keyword:neuralmachinetranslation;low-