資源描述:
《基于NMF的語(yǔ)音增強(qiáng)算法研究》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、級(jí)分類(lèi)號(hào)密U單位代碼10154DC遼寧工業(yè)大學(xué)碩士學(xué)位論文-基子NMF的語(yǔ)音增強(qiáng)算法研究:乂V:令X太,、'專(zhuān)業(yè):通信與信息系統(tǒng)?,生:研究:蔣茂松?*v卜■?-:^指導(dǎo)教師卜王冬霞教授,、;^■--'-i、二?一八年三月*■..'>h廣*遼寧工業(yè)大學(xué)碩士學(xué)位論文基于NMF的語(yǔ)音增強(qiáng)算法研究專(zhuān)業(yè):通信與信息系統(tǒng)研究生:蔣茂松指導(dǎo)教師:王冬霞教授遼寧工業(yè)大學(xué)電子與信息工程學(xué)院二〇一八年三月MasterThesisS
2、tudyonSpeechEnhancementBasedonNMFAlgorithmSpeciality:CommunicationandInformationSystemsCandidate:JIANGMao-songSupervisor:ProfessorWANGDong-xiaLiaoningUniversityofTechnologyJinzhou,121001,ChinaMarch2018獨(dú)創(chuàng)性聲明本人聲明所呈交的論文是我個(gè)人在導(dǎo)師指導(dǎo)下進(jìn)行的研宄:r作及取得的研究成果。盡我所知,除了文中特別加以標(biāo)注和致謝的地方外,
3、論文中,不包含其他人己經(jīng)發(fā)表或撰寫(xiě)過(guò)的研究成果,也不包含為獲得遼寧工業(yè)大學(xué)或其他教育機(jī)構(gòu)的學(xué)位或證書(shū)而使用過(guò)的材料一。與我同工作的同志對(duì)本研究所作的任何貢獻(xiàn)均己在論文中作了明確的說(shuō)明并表示了謝意。研宄生簽名:以吆年3?月S曰關(guān)于論文使用授權(quán)的說(shuō)明本人完全了解遼寧工業(yè)大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定,即:學(xué)校冇權(quán)保留送交的復(fù)印權(quán),允許論文被查閱和借閱;學(xué)??梢怨颊撐牡娜炕虿浚崳姺謨?nèi)容,可以采用影印、縮印或其他復(fù)制手段保存論文。(保密的論文在解密后應(yīng)遵守此規(guī)定)研宄生簽名:導(dǎo)師簽名:2收
4、年;5月日摘要遼寧工業(yè)大學(xué)碩士學(xué)位論文摘要語(yǔ)音增強(qiáng)作為語(yǔ)音數(shù)字信號(hào)處理的一個(gè)重要分支,旨在提高被各種各樣噪聲干擾的語(yǔ)音質(zhì)量和可懂度,它主要應(yīng)用于語(yǔ)音通信、語(yǔ)音識(shí)別和語(yǔ)音壓縮編碼等數(shù)字處理系統(tǒng)的前期預(yù)處理中。由于傳統(tǒng)語(yǔ)音增強(qiáng)算法的局限性和對(duì)非平穩(wěn)背景噪聲的處理能力有限,因此近年來(lái)相繼提出了一些新的算法,其中基于非負(fù)矩陣分解的語(yǔ)音增強(qiáng)算法最為突出,借助機(jī)器學(xué)習(xí)從大量的語(yǔ)音數(shù)據(jù)中解析出所需的數(shù)據(jù)是當(dāng)前語(yǔ)音信號(hào)處理的研究一個(gè)熱門(mén)方向。論文主要工作是對(duì)單通道系統(tǒng)和多通道系統(tǒng)下的語(yǔ)音增強(qiáng)算法進(jìn)行了研究,提出有監(jiān)督學(xué)習(xí)的非負(fù)矩陣分解語(yǔ)音增強(qiáng)算法
5、及其算法的改進(jìn)。首先,對(duì)傳統(tǒng)語(yǔ)音增強(qiáng)算法及其局限性進(jìn)行了分析和研究,闡述了非負(fù)矩陣分解算法的基本原理及其特點(diǎn),并對(duì)算法收斂性和初始化等問(wèn)題進(jìn)行了研究。其次,針對(duì)有監(jiān)督學(xué)習(xí)算法中存在訓(xùn)練和測(cè)試數(shù)據(jù)特征間不匹配的問(wèn)題,論文改進(jìn)了非負(fù)矩陣分解算法,在其目標(biāo)函數(shù)中加入確切的正則化約束項(xiàng),如時(shí)間連續(xù)性或幅度譜的統(tǒng)計(jì)先驗(yàn)以及稀疏性等,促使不同字典的區(qū)分和判別力,從而提高收集語(yǔ)音數(shù)據(jù)的準(zhǔn)確性。此外,傳統(tǒng)語(yǔ)音增強(qiáng)算法系統(tǒng)都是基于短時(shí)傅里葉分析-修正-合成結(jié)構(gòu),而在大多數(shù)情況下認(rèn)為幅度譜估計(jì)在聽(tīng)覺(jué)感知方面比相位譜更加的重要,因此忽略了相位譜失真的影響。
6、針對(duì)相位失真問(wèn)題,論文提出了基于相位譜修正的非負(fù)矩陣分解語(yǔ)音增強(qiáng)的基補(bǔ)償算法。從數(shù)理統(tǒng)計(jì)學(xué)的角度出發(fā),對(duì)非負(fù)矩陣分解算法進(jìn)行分析和研究的同時(shí),并利用語(yǔ)音存在概率和相位譜修正方法提高增強(qiáng)語(yǔ)音質(zhì)量。最后,針對(duì)傳統(tǒng)多通道非負(fù)矩陣分解算法容易陷入局部最優(yōu)和計(jì)算復(fù)雜度較高等問(wèn)題,本論文提出了一種新的多通道非負(fù)矩陣分解模型。該模型主要是利用觀(guān)測(cè)數(shù)據(jù)的空間協(xié)方差進(jìn)行建模,結(jié)合矩陣跡的性質(zhì)巧妙地推出目標(biāo)函數(shù),接著利用有監(jiān)督學(xué)習(xí)算法原理對(duì)麥克風(fēng)拾取的混合信號(hào)進(jìn)行分析和研究,從而實(shí)現(xiàn)混合信號(hào)增強(qiáng)或分離效果。實(shí)驗(yàn)結(jié)果表明在非平穩(wěn)背景噪聲下,該算法不僅更好的
7、降低或抑制了背景噪聲干擾,而且提高了收斂速度,使得該算法更具有實(shí)用價(jià)值。關(guān)鍵詞:語(yǔ)音增強(qiáng);非負(fù)矩陣分解;有監(jiān)督學(xué)習(xí);相位譜;多通道非負(fù)矩陣分解IAbstract遼寧工業(yè)大學(xué)碩士學(xué)位論文AbstractSpeechenhancementisanimportantbranchofspeechsignalprocessing,toimproveallkindsofnoisespeechqualityandintelligibility.Itisalsoanimportantpre-pretreatmenttechnologyofspeech
8、communication,speechrecognition,andspeechcompressioncodinganddigitalprocessingsystem.Withthelimitationofconven