語種識別論文：語種識別少數(shù)民族語語音檢測

ID：12907076

大?。?2.50 KB

頁數(shù)：5頁

時間：2018-07-19

資源描述：

《語種識別論文：語種識別少數(shù)民族語語音檢測》由會員上傳分享，免費在線閱讀，更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、語種識別論文：語種識別少數(shù)民族語語音檢測【中文摘要】據(jù)有關(guān)資料統(tǒng)計,當(dāng)今世界上共有5651種語言。語種之間的信息互通越來越重要,如何讓計算機(jī)識別出不同的語種已經(jīng)成為人們的迫切需求。語種識別(LanguageIdentification,LID),是計算機(jī)通過分析處理一段語音片斷以判別其屬于何種語言的過程,本質(zhì)上也是屬于語音識別的一個分支。它已經(jīng)廣泛的應(yīng)用于信息檢索和軍事安全等領(lǐng)域。當(dāng)前語種識別系統(tǒng)主要有三個方面：音位結(jié)構(gòu)模型系統(tǒng)、聲學(xué)模型系統(tǒng)以及聯(lián)合系統(tǒng)。其中聲學(xué)模型系統(tǒng)由于不需要人工標(biāo)注語料,而且系統(tǒng)擴(kuò)展性好,所以得到了廣泛

2、的應(yīng)用。本文研究與文本無關(guān)的少數(shù)民族語種識別方法,采用高斯混合模型—通用背景模型(GaussianMixtureModel-UniversalBackgroundMode,GMM-UBM)建立語種識別系統(tǒng),探索提高識別率的途徑。論文的主要工作有：(1)少數(shù)民族電話語音數(shù)據(jù)庫的錄制,該數(shù)據(jù)庫包含了9個少數(shù)民族語和漢語普通話共10個語種,每個語種有50個發(fā)音人,男女比例約為1:1,并進(jìn)行語音數(shù)據(jù)的整理。(2)構(gòu)建一個基于GMM-UBM的少數(shù)民族語種識別系統(tǒng),設(shè)計并實現(xiàn)語種識別實驗：用雙門限的方法進(jìn)行語音檢測；提取MFCC和SDC特

3、征參數(shù)；訓(xùn)練UBM模型和GMM模型。(3)用6個民族的不同時長的測試語音和漢語借詞進(jìn)行測試。按四種測試語料分別給出各個語種的識別率,對比兩種特征的識別率,從語音學(xué)的角度分析各語種之間誤識別的原因,還分析了漢語借詞對少數(shù)民族語種識別率的影響。實驗結(jié)果表明,論文設(shè)計的基于GMM-UBM的語種識別系統(tǒng)具有較好的擴(kuò)展性；雙門限的方法進(jìn)行語音檢測,能有效地去除噪音,提取到有用的語音幀；基于SDC特征參數(shù)的少數(shù)民族語種識別率明顯高于基于MFCC特征參數(shù)的識別率；6個語種之間存在有規(guī)律的誤識別；對漢語借詞的識別,實驗結(jié)果表明漢語借詞會使少數(shù)

4、民族語種識別率明顯下降?！居⑽恼緼ccordingtostatistics,thereare5651languagesintheworld.Withthecommunicationbetweenthelanguagesbecomesmoreandmoreimportant,howtomakecomputeridentifythedifferentlanguageshavebecomethepeople’surgentneeds.Languageidentificationistheprocessofdeterminingt

5、helanguageofaspokenutterance.Inessence,itisanaspectofspeechrecognition.Languageidentificationhasbeenwidelyusedinmulti-linguisticinformationservicesandsecurityfields.Therearethreetypesoflanguagerecognitionsystem:phonotacticapproachsystemincurrent,acousticapproachsyst

6、emandtheircombinedsystems.Acousticapproachsystemdoesnotrequiremanualtaggingcorpus,andithasagoodportable,soithasbeenwidelyused.Thispaperisfocusonthetest-independentlanguageidentificationmethod,usingGMM-UBMtobuildthelanguageidentificationsystem,andexploresmethodstoimp

7、rovetherecognitionrate.Themainworksareasfollows:(1)Wedesignaminority-orientedlanguageidentificationoftelephonespeechcorpus,whichconsistsofspontaneousutterancesin9minority-orientedlanguagesandMandarin.Theutterancesareproducedby25maleand25female,ineachlanguageoverreal

8、telephonelines.Thenwedosomepreliminarycollatingbeforeweusethem.(2)AlanguageidentificationsystemofminoritylanguagebasedonGMM-UBMmodelisbuil

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 5



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件，查看預(yù)覽時可能會顯示錯亂或異常，文件下載后無此問題，請放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤，付費完成后未能成功下載的用戶請聯(lián)系客服處理。

語種識別論文：語種識別少數(shù)民族語語音檢測

語種識別論文：語種識別少數(shù)民族語語音檢測

相關(guān)文章

相關(guān)標(biāo)簽

語種識別論文：語種識別 少數(shù)民族語 語音檢測

語種識別論文：語種識別 少數(shù)民族語 語音檢測

相關(guān)文章

相關(guān)標(biāo)簽

語種識別論文：語種識別少數(shù)民族語語音檢測

語種識別論文：語種識別少數(shù)民族語語音檢測