基于韻律特征的SVM說(shuō)話人識(shí)別

ID：37041485

大?。?.62 MB

頁(yè)數(shù)：65頁(yè)

時(shí)間：2019-05-20

資源描述：

《基于韻律特征的SVM說(shuō)話人識(shí)別》由會(huì)員上傳分享，免費(fèi)在線閱讀，更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、摘要摘要語(yǔ)音信號(hào)是用于個(gè)人身份確認(rèn)的一種有效的生物特征，與文本無(wú)關(guān)的說(shuō)話人識(shí)別的研究也是語(yǔ)音信號(hào)處理的一個(gè)重要的研究方向，其研究具有重要的理論意義和廣泛的應(yīng)用前景。為了考察最新的相關(guān)研發(fā)進(jìn)展，并提供統(tǒng)一的衡量標(biāo)準(zhǔn)，美國(guó)國(guó)家標(biāo)準(zhǔn)技術(shù)研究院(NIST)于1996年起開(kāi)始主持說(shuō)話人識(shí)別評(píng)測(cè)。NIST說(shuō)話人評(píng)測(cè)代表了說(shuō)話人識(shí)別領(lǐng)域的最高水準(zhǔn)，NIST設(shè)立了多項(xiàng)評(píng)測(cè)任務(wù)，探索和嘗試各種語(yǔ)音條件下的研究方法，并為各個(gè)項(xiàng)目指定統(tǒng)一的電話和廣播語(yǔ)音(多環(huán)境、多通道、大規(guī)模說(shuō)話人)、測(cè)試基準(zhǔn)、評(píng)測(cè)規(guī)則和標(biāo)準(zhǔn)。其中一個(gè)任務(wù)是采用長(zhǎng)語(yǔ)音進(jìn)行說(shuō)話人識(shí)別，是

2、為了探索用于與文本無(wú)關(guān)的說(shuō)話人識(shí)別的語(yǔ)音信號(hào)高層次信息而設(shè)置的。除了短時(shí)倒譜參數(shù)，語(yǔ)音中的高層次信息也是一種有效的說(shuō)話人特征參數(shù)，但其通常與文本內(nèi)容有關(guān)，因此研究從信號(hào)中提取可用于與文本無(wú)關(guān)說(shuō)話人識(shí)別的語(yǔ)音高層次特征信息就成了目前研究的焦點(diǎn)。本文對(duì)韻律的提取方法及其與區(qū)辨模型結(jié)合運(yùn)用于與文本無(wú)關(guān)的說(shuō)話人識(shí)別進(jìn)行了探討。從與文本無(wú)關(guān)的說(shuō)話人識(shí)別的特點(diǎn)出發(fā)，本文先講述概率統(tǒng)計(jì)模型，從文本相關(guān)的語(yǔ)音韻律（語(yǔ)音特征隨時(shí)間變化的軌跡）中提取的特征信息，進(jìn)行數(shù)據(jù)壓縮、聚類，再利用支持向量機(jī)SVM進(jìn)行區(qū)分。文章提出了一種基于小波分析從韻律中提取超

3、音段韻律信息的方法，分別從聲道的MFCC軌跡和基頻軌跡，時(shí)域能量軌跡中進(jìn)行超音段韻律特征的提取。由MFCC各維參數(shù)的近似不相關(guān)和聲道緩變的特點(diǎn)，MFCC軌跡的韻律特征只以概貌系數(shù)來(lái)刻畫，提取的PMFCC作為主參數(shù)，在參數(shù)級(jí)和由基頻F0軌跡的六維韻律特征參數(shù)PF0、由時(shí)域能量軌跡的六維韻律特征參數(shù)PE，組成更加有效的PMFCCFE參數(shù)，進(jìn)而利用支持向量機(jī)SVM模型進(jìn)行區(qū)分。在NIST數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)表明，與傳統(tǒng)的短時(shí)MFCC的GMM-UBM系統(tǒng)相比，超音段韻律特征PMFCCFE的GMM-SVM系統(tǒng)的EER相對(duì)下降了57.9%，MinDC

4、F相對(duì)下降了41.4%。顯著提高了說(shuō)話人識(shí)別的性能。關(guān)鍵字：韻律特征；GMM超矢量；SVM；文本無(wú)關(guān)說(shuō)話人識(shí)別IAbstractAbstractSpeechsignalaseffectivebiologicalfeature,isparticularlyusefulforidentification,andtext-independentspeakerrecognitionisoneoftheprimaryresearchfieldsofspeechsignalprocessing,andnotonlyofgreattheoreti

5、calsignificance,butalsohasawidevarietyofapplications.TheNationalInstituteofStandardsandTechnology(NIST)hascoordinatedSpeakerRecognitionEvaluationssince1996toinvestigateandmeasurethelatestapproaches.Theevaluationsrepresentthestate-of-the-artachievementsofspeechrecogniti

6、on.NISTsetsupseveraltaskstoexaminespeakerrecognitionperformanceunderdifferentcircumstances.NISTofferstotheparticipantstelephoneandbroadcastspeechdatarangingfrommultiplechannelstovariousenvironments,theevaluationspecifications,andsameevaluationcriterion.Onetaskofferslon

7、g-durationspeechfromspeakers,aimingtomakefulluseoftext-independenthighlevelinformationforrecognizingspeakers.Inadditiontoshort-termspectralfeaturessuchasMFCC,highlevelinformationcanalsoserveaseffectivefeatureforspeakerrecognition,butitusuallyassociatedwithdependenttext

8、.Thesolutiontoexplorethehighlevelfeaturefortext-independentspeakerrecognitionbecomesafocus.Thethesisillustratestheeff

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 65



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件，查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常，文件下載后無(wú)此問(wèn)題，請(qǐng)放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤，付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。

基于韻律特征的SVM說(shuō)話人識(shí)別

基于韻律特征的SVM說(shuō)話人識(shí)別

相關(guān)文章

相關(guān)標(biāo)簽