神經(jīng)機器翻譯系統(tǒng)在維吾爾語-漢語翻譯中的性能對比

神經(jīng)機器翻譯系統(tǒng)在維吾爾語-漢語翻譯中的性能對比

ID:34323734

大小:78.31 KB

頁數(shù):14頁

時間:2019-03-05

神經(jīng)機器翻譯系統(tǒng)在維吾爾語-漢語翻譯中的性能對比_第1頁
神經(jīng)機器翻譯系統(tǒng)在維吾爾語-漢語翻譯中的性能對比_第2頁
神經(jīng)機器翻譯系統(tǒng)在維吾爾語-漢語翻譯中的性能對比_第3頁
神經(jīng)機器翻譯系統(tǒng)在維吾爾語-漢語翻譯中的性能對比_第4頁
神經(jīng)機器翻譯系統(tǒng)在維吾爾語-漢語翻譯中的性能對比_第5頁
資源描述:

《神經(jīng)機器翻譯系統(tǒng)在維吾爾語-漢語翻譯中的性能對比》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。

1、神經(jīng)機器翻譯系統(tǒng)在維吾爾語-漢語翻譯中的性能對比哈里旦木?阿布都克里木劉洋孫茂松清華大學(xué)計算機科學(xué)與技術(shù)系智能技術(shù)與系統(tǒng)國家重點實驗室清華信息科學(xué)與技術(shù)國家實驗室(籌)摘要:基于深度學(xué)習(xí)的神經(jīng)機器翻譯已在多個語言對上顯著超過傳統(tǒng)的統(tǒng)計機器翻譯,成為當前的主流機器翻譯技術(shù)。該文從詞粒度層面出發(fā),對國際上具有影響力的6種神經(jīng)機器翻譯方法在維吾爾語-漢語翻譯任務(wù)上進行了深入分析和比較,這6種方法分別是基于注意力機制(Groundllog),詞表擴大(LV-groundhog),源語言和目標語言采用子詞(subword-nmt)、字符與詞混合(nmt.hybri

2、d)、子詞與字符(dl4mt-cdec)以及完全字符(dl4mt-c2c)方法。實驗結(jié)果表明:源語言采用子詞、目標語言采用字符的方法(dl4mtcdec)在維吾爾語-漢語神經(jīng)機器翻譯任務(wù)上性能最佳。該文不僅是首次將神經(jīng)機器翻譯方法應(yīng)用到維吾爾語-漢語機器翻譯任務(wù)上,也是首次將不同的神經(jīng)機器翻譯方法在同一語料庫上進行了對比分析。該研究對維吾爾語-漢語機器翻譯任務(wù)和神經(jīng)機器翻譯的進一步研究工作都具有重要的參考意義。關(guān)鍵詞:神經(jīng)機器翻譯;資源匱乏語言;維吾爾語;作者簡介:哈里旦木?阿布都克里木(1978—),女,博士研究生。作者簡介:劉洋,副教授,E-mail

3、:liuyang201l@tsinghua.edu.cn收稿日期:2017-02-23基金:國家自然科學(xué)基金重點項目(61331013)PerformancecomparisonofneuralmachinetranslationsystemsinUyghur-ChinesetranslationHalidanmuAbudukelimuLIUYangSUNMaosongTsinghuaNationalLaboratoryforInformstionScienceandTechnology,StateKeyLaboratoryofIntelligentTe

4、chnologyandSystems,DepartmentofComputerScienceandTechnology,TsinghuaUniversity;Abstract:Theneuralmachinetranslationbasedondeeplearningsignificantlysurpassesthetraditionalstatisticalmachinctremslationinmanylanguages,andbecomesthecurrentmainstreammachinetranslationtechnology.Thispa

5、percomparessixinfluentialneuralmachinetranslationmethodsfromthelevelofwordgranularityinthetaskofUyghur-Chinesemachinetranslation.Thesemethodsareattentionmechanism(Groundllog)、vocabularyexpansion(LV-groundhog),sourcelanguagcandtargetlanguagewithsubwordunits(subword-nmt),characters

6、andwordsmixed(nmt.hybrid),subwordunitsandcharacters(dl4mt-cdec),andcompletecharacters(dl4mt-c2c).TheexperimentalresultsshowthatUyghur-Chineseneuralmachinetransleitionperformsbestwhenthesourcelemguagcissegmcntedintosubwordunitsandthetargetlemguagcisrepresentedbycharacters(dl4mt-cd

7、ec).ThispaperisthefirsttouseneuralmachinetranslationforUyghur-Chinesemachinetranslationandthefirsttocomparedifferentneuralmachinetranslationmethodsonthesamecorpus.ThisworkisanimportantrefereneenotonlyforUyghur-Chinesemachinctremslation,butalsoforgencralncuralmachinctranslationtas

8、ks.Keyword:neuralmachinetranslation;low-

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。