資源描述:
《語種識別論文:語種識別 少數(shù)民族語 語音檢測》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、語種識別論文:語種識別少數(shù)民族語語音檢測【中文摘要】據(jù)有關(guān)資料統(tǒng)計,當(dāng)今世界上共有5651種語言。語種之間的信息互通越來越重要,如何讓計算機(jī)識別出不同的語種已經(jīng)成為人們的迫切需求。語種識別(LanguageIdentification,LID),是計算機(jī)通過分析處理一段語音片斷以判別其屬于何種語言的過程,本質(zhì)上也是屬于語音識別的一個分支。它已經(jīng)廣泛的應(yīng)用于信息檢索和軍事安全等領(lǐng)域。當(dāng)前語種識別系統(tǒng)主要有三個方面:音位結(jié)構(gòu)模型系統(tǒng)、聲學(xué)模型系統(tǒng)以及聯(lián)合系統(tǒng)。其中聲學(xué)模型系統(tǒng)由于不需要人工標(biāo)注語料,而且系統(tǒng)擴(kuò)展性好,所以得到了廣泛
2、的應(yīng)用。本文研究與文本無關(guān)的少數(shù)民族語種識別方法,采用高斯混合模型—通用背景模型(GaussianMixtureModel-UniversalBackgroundMode,GMM-UBM)建立語種識別系統(tǒng),探索提高識別率的途徑。論文的主要工作有:(1)少數(shù)民族電話語音數(shù)據(jù)庫的錄制,該數(shù)據(jù)庫包含了9個少數(shù)民族語和漢語普通話共10個語種,每個語種有50個發(fā)音人,男女比例約為1:1,并進(jìn)行語音數(shù)據(jù)的整理。(2)構(gòu)建一個基于GMM-UBM的少數(shù)民族語種識別系統(tǒng),設(shè)計并實現(xiàn)語種識別實驗:用雙門限的方法進(jìn)行語音檢測;提取MFCC和SDC特
3、征參數(shù);訓(xùn)練UBM模型和GMM模型。(3)用6個民族的不同時長的測試語音和漢語借詞進(jìn)行測試。按四種測試語料分別給出各個語種的識別率,對比兩種特征的識別率,從語音學(xué)的角度分析各語種之間誤識別的原因,還分析了漢語借詞對少數(shù)民族語種識別率的影響。實驗結(jié)果表明,論文設(shè)計的基于GMM-UBM的語種識別系統(tǒng)具有較好的擴(kuò)展性;雙門限的方法進(jìn)行語音檢測,能有效地去除噪音,提取到有用的語音幀;基于SDC特征參數(shù)的少數(shù)民族語種識別率明顯高于基于MFCC特征參數(shù)的識別率;6個語種之間存在有規(guī)律的誤識別;對漢語借詞的識別,實驗結(jié)果表明漢語借詞會使少數(shù)
4、民族語種識別率明顯下降?!居⑽恼緼ccordingtostatistics,thereare5651languagesintheworld.Withthecommunicationbetweenthelanguagesbecomesmoreandmoreimportant,howtomakecomputeridentifythedifferentlanguageshavebecomethepeople’surgentneeds.Languageidentificationistheprocessofdeterminingt
5、helanguageofaspokenutterance.Inessence,itisanaspectofspeechrecognition.Languageidentificationhasbeenwidelyusedinmulti-linguisticinformationservicesandsecurityfields.Therearethreetypesoflanguagerecognitionsystem:phonotacticapproachsystemincurrent,acousticapproachsyst
6、emandtheircombinedsystems.Acousticapproachsystemdoesnotrequiremanualtaggingcorpus,andithasagoodportable,soithasbeenwidelyused.Thispaperisfocusonthetest-independentlanguageidentificationmethod,usingGMM-UBMtobuildthelanguageidentificationsystem,andexploresmethodstoimp
7、rovetherecognitionrate.Themainworksareasfollows:(1)Wedesignaminority-orientedlanguageidentificationoftelephonespeechcorpus,whichconsistsofspontaneousutterancesin9minority-orientedlanguagesandMandarin.Theutterancesareproducedby25maleand25female,ineachlanguageoverreal
8、telephonelines.Thenwedosomepreliminarycollatingbeforeweusethem.(2)AlanguageidentificationsystemofminoritylanguagebasedonGMM-UBMmodelisbuil