資源描述:
《基于動態(tài)時間規(guī)整的孤立咳嗽聲識別》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、從本學(xué)科出發(fā),應(yīng)著重選對國民經(jīng)濟具有一定實用價值和理論意義的課題。課題具有先進性,便于研究生提出新見解,特別是博士生必須有創(chuàng)新性的成果基于動態(tài)時間規(guī)整的孤立咳嗽聲識別摘要本文通過對咳嗽聲特性的分析,在對咳嗽聲進行預(yù)處理后,提取咳嗽的Mel頻率倒譜系數(shù)作為特征參數(shù),建立咳嗽模板庫。采用基于動態(tài)時間規(guī)整算法的模板匹配方法對特定人的孤立咳嗽進行識別,實驗證明,通過將咳嗽聲的特性和語音識別方法的結(jié)合,動態(tài)時間規(guī)整算法在對孤立咳嗽聲識別中有很好的準(zhǔn)確性和可靠性。關(guān)鍵詞特征提取;Mel頻率倒譜系數(shù);動態(tài)時間規(guī)整;咳嗽聲識別咳嗽是機體的一種保護性動作,以消除呼吸道的分泌物、滲出物及侵
2、入呼吸道的異物[1]。多數(shù)患者未能完整對自身的咳嗽特征進行描述,比如咳嗽的癥狀、發(fā)作時間、頻率等,影響了咳嗽的及時診斷和合理治療。因此,有必要進行咳嗽的實時監(jiān)測及其特征的識別。至今這種對咳嗽嚴重性的評估,主要依靠主觀措施,如咳嗽反射敏感性、患者對自身癥狀的感覺、咳嗽可視模擬測評、生活質(zhì)量問卷、咳嗽癥狀描述和患者的日記等[3]。從而使大部分的咳嗽監(jiān)測器的診斷受到人為的影響較大。利用可靠的咳嗽檢測算法可以減少大量需人工分析的數(shù)據(jù),甚至可以做到去除人工分析的過程,因此,要提高咳嗽聲識別系統(tǒng)的有效性,這就要求有一種算法能夠識別出大部分在特定錄音中的咳嗽聲,同時又能夠?qū)⑺c其它的
3、具有相似特性的聲音區(qū)分開來。文章在參考了國內(nèi)外關(guān)于咳嗽聲識別的研究課題份量和難易程度要恰當(dāng),博士生能在二年內(nèi)作出結(jié)果,碩士生能在一年內(nèi)作出結(jié)果,特別是對實驗條件等要有恰當(dāng)?shù)墓烙?。從本學(xué)科出發(fā),應(yīng)著重選對國民經(jīng)濟具有一定實用價值和理論意義的課題。課題具有先進性,便于研究生提出新見解,特別是博士生必須有創(chuàng)新性的成果現(xiàn)狀,并比較了咳嗽聲識別與語音識別的關(guān)系,提出使用動態(tài)時間規(guī)整算法作為本文咳嗽聲識別的主要算法。咳嗽發(fā)生機制咳嗽表現(xiàn)為深呼吸氣后,聲門關(guān)閉,繼而以突然劇烈的呼氣,沖出狹窄的聲門裂隙產(chǎn)生咳嗽動作和發(fā)出聲音[2]。Mel頻率倒譜系數(shù)[12](MFCC)頻率f與Mel頻
4、率B之間的轉(zhuǎn)換公式為:(1)MFCC的提取及計算過程如圖1所示。(1)原始咳嗽聲信號y(n)通過預(yù)加重、分幀、加窗處理后,得到每幀的時域信號x(n)。(2)將得到的每幀時域信號進行離散傅立葉變換(DFT)。(2)其中,X(k)為線性頻譜,N為DFT的窗寬。(3)線性頻譜經(jīng)過Mel頻率濾波器組處理后為M(t),然后對其進行對數(shù)能量處理,得到結(jié)果為d(m)。圖1Mel頻率倒譜系數(shù)(MFCC)提取過程圖通過Mel頻率濾波器組得到Mel頻譜其中Mel頻率濾波器組為在語音的頻譜范圍內(nèi)設(shè)置的若干個帶通濾波器,M為濾波器的個數(shù)。每個帶通濾波器的傳遞函數(shù)為:(3)f(m)可以用下面的方
5、法定義:(4)其中,Ss為采樣頻率,而B-1為B的逆函數(shù):,而濾波器的頻率應(yīng)用范圍的最低頻率為f=100Hz和最高頻率為f課題份量和難易程度要恰當(dāng),博士生能在二年內(nèi)作出結(jié)果,碩士生能在一年內(nèi)作出結(jié)果,特別是對實驗條件等要有恰當(dāng)?shù)墓烙嫛谋緦W(xué)科出發(fā),應(yīng)著重選對國民經(jīng)濟具有一定實用價值和理論意義的課題。課題具有先進性,便于研究生提出新見解,特別是博士生必須有創(chuàng)新性的成果=4000Hz,在實驗中為了減少甚至消除交流電的影響,濾波器的個數(shù)取M=26,即可以得到26維的MFCC倒譜系數(shù)??紤]到讓得到的結(jié)果對噪聲和譜估計誤差有更好的魯棒性,將經(jīng)過Mel濾波器組得到的Mel頻譜取對數(shù)
6、能量,其傳遞函數(shù)為:(5)(4)將上述對數(shù)頻譜d(m)經(jīng)過離散余弦變換(DCT)變換到倒頻譜域,得到Mel頻率倒譜系數(shù)(MFCC):(6)以上參數(shù)稱為靜態(tài)參數(shù),為了描述咳嗽聲幀之間的相關(guān)性,引入了動態(tài)參數(shù)一階差分和二階差分。2.模版匹配技術(shù)[12]模版匹配法是模式識別中最常用的一種相似度計算與匹配方法,把具有不同人的咳嗽聲信號經(jīng)過特征提取變換后作為不同的模版,構(gòu)建一個基于模版匹配的簡單的咳嗽聲識別系統(tǒng),如圖3所示,是該咳嗽聲識別系統(tǒng)的原理框圖。圖3基于模版匹配的咳嗽聲識別原理框圖相似度度量在基于模板匹配的咳嗽聲識別系統(tǒng)中,對原始的咳嗽聲信號進行訓(xùn)練得到一系列的特征模板,
7、將其存儲于模板庫中。而在識別過程中采用相似度度量來進行模板匹配,將特征模板庫中的各個模板稱為參考模板,用R來表示;在模板庫建好后,又將待識別的輸入咳嗽聲信號通過預(yù)處理和特征提取得到特征矢量序列,稱為待檢測模板,用W表示[12]。參考模板用R={R(1)、R(2)、……、R(m)、……、R(M)}表示,其中M為參考模板所包含的咳嗽幀的總數(shù),r為咳嗽幀的時序標(biāo)號,R(r)為第m幀的咳嗽特征矢量。待檢測模板用W={W(1)、W(2)、……、W(n)、……、W(N)}表示,其中N為參考模板所包含的咳嗽幀的總數(shù),w為咳嗽幀的時序標(biāo)號,W(w)為第n