資源描述:
《基于深度信念網(wǎng)絡(luò)的豬咳嗽聲識(shí)別》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫(kù)。
1、基于深度信念網(wǎng)絡(luò)的豬咳嗽聲識(shí)別黎煌趙建高云雷明剛劉望宏糞永杰華中農(nóng)業(yè)大學(xué)工學(xué)院生豬健康養(yǎng)殖協(xié)同創(chuàng)新中心華中農(nóng)業(yè)大學(xué)動(dòng)物科技學(xué)院動(dòng)物醫(yī)學(xué)院為丫在生豬養(yǎng)殖產(chǎn)生呼吸道疾病的初期,通過(guò)監(jiān)測(cè)豬咳嗽聲進(jìn)行疾病預(yù)警,提出了基于深度信念網(wǎng)絡(luò)(DBN)對(duì)豬咳嗽聲進(jìn)行識(shí)別的方法。以長(zhǎng)白豬咳嗽、打噴嚏、吃食、尖叫、哼哼、甩耳朵等聲音為研究對(duì)象,利用基于多窗譜的心理聲學(xué)語(yǔ)音增強(qiáng)算法和單參數(shù)雙門(mén)限端點(diǎn)檢測(cè)對(duì)豬聲音進(jìn)行預(yù)處理,實(shí)現(xiàn)豬聲音信號(hào)的去噪和有效信號(hào)檢測(cè)。基于吋間規(guī)整算法提取300維短吋能量和720維梅爾頻率倒譜系數(shù)(MFCC)組合成1020維特征參數(shù),將該組合特征參數(shù)作為DBN學(xué)習(xí)和識(shí)別數(shù)據(jù)集,選定3隱層
2、神經(jīng)元個(gè)數(shù)分別為42個(gè)、17個(gè)和7個(gè),構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu)為1020-42-17-7-2的5層深度信念網(wǎng)絡(luò)豬咳嗽聲識(shí)別模型。通過(guò)5折交叉實(shí)驗(yàn)驗(yàn)證,基于DBN的豬咳嗽聲識(shí)別率和總識(shí)別率均達(dá)到90.00%以上,誤識(shí)別率達(dá)到10%以?xún)?nèi),最優(yōu)組豬咳嗽聲識(shí)別率達(dá)到94.12%,誤識(shí)別率達(dá)到7.45%,總識(shí)別率達(dá)到93.2W。進(jìn)一步基于主成分分析法(PCA)提取1020維特征參數(shù)98.01%主成分得到479維特征參數(shù),通過(guò)5折交叉實(shí)驗(yàn)驗(yàn)證,豬咳嗽聲識(shí)別率、誤識(shí)別率和總識(shí)別率相對(duì)降維前均有所提高,最優(yōu)組豬咳嗽聲識(shí)別率達(dá)到95.80%,誤識(shí)別率達(dá)到6.83%,總識(shí)別率達(dá)到94.29%,實(shí)驗(yàn)結(jié)果表明所建模型是有
3、效可行的。關(guān)鍵詞:生豬;咳嗽;深度佶念網(wǎng)絡(luò);特征參數(shù);識(shí)別;生豬產(chǎn)業(yè)規(guī)模化發(fā)展的冋吋,呼吸道疾病己成為各大養(yǎng)豬場(chǎng)最常見(jiàn)、危害最嚴(yán)重的疾病之一。而咳嗽是豬呼吸道疾病的主要癥狀,尤其是早期癥狀,因此可以通過(guò)監(jiān)測(cè)咳嗽聲進(jìn)行豬早期呼吸道疾病預(yù)警11^1。目前所采用的方法一般為簡(jiǎn)單易行的人工檢測(cè),但是人工檢測(cè)不僅人力成本高,并且識(shí)別率難以得到保證。隨著現(xiàn)代信息、數(shù)字信號(hào)處理、傳感器等技術(shù)的快速發(fā)展,將計(jì)算機(jī)技術(shù)與聲音特征分析相結(jié)合,利用語(yǔ)音識(shí)別技術(shù)分析豬咳嗽聲與豬非咳嗽聲,對(duì)豬咳嗽聲進(jìn)行識(shí)別,有利于生豬呼吸道疾病的預(yù)警,促進(jìn)生豬健康養(yǎng)殖的發(fā)展U1。國(guó)外開(kāi)展豬聲音識(shí)別的研宄相對(duì)較早。MITCHEL
4、L等位1發(fā)現(xiàn)了健康豬和病豬咳嗽聲短時(shí)能量動(dòng)態(tài)變化的差異,測(cè)得健康豬咳嗽聲持續(xù)時(shí)間一般為0.21s,而病豬咳嗽聲持續(xù)時(shí)間一般為0.30s。SARA等通過(guò)實(shí)驗(yàn)發(fā)現(xiàn)病豬咳嗽咅頻的標(biāo)準(zhǔn)化壓力均方差及峰值頻率均值均低于健康豬,而病豬咳嗽聲持續(xù)時(shí)間和頻率均高丁?健康豬。EXADAKTYL0S等hl采用改進(jìn)的模糊c均值聚類(lèi)算法識(shí)別豬咳嗽,總識(shí)別率達(dá)到85%,其中病豬咳嗽聲識(shí)別率達(dá)到82%oGUARINO等M采用動(dòng)態(tài)時(shí)間規(guī)整(Dynamictimewarping,DTW)算法識(shí)別豬咳嗽,識(shí)別率達(dá)到85.5%,非咳嗽聲識(shí)別率達(dá)到86.6%。HTRTUM等£71考慮低頻環(huán)境噪聲對(duì)咳嗽聲的影響,建立環(huán)境噪聲
5、模型,在此棊礎(chǔ)上構(gòu)建棊于模糊c均值聚類(lèi)算法的咳嗽聲識(shí)別模型,非實(shí)時(shí)單個(gè)咳嗽聲識(shí)別率能夠達(dá)到92%,但錯(cuò)誤率達(dá)到21%。目前,國(guó)內(nèi)針對(duì)豬聲音識(shí)別的研宄尚處于起步階段。馬輝棟等M設(shè)計(jì)了基于短時(shí)能量和短時(shí)過(guò)零率的豬咳嗽聲雙門(mén)限端點(diǎn)檢測(cè)算法。劉振宇等m釆用隱馬爾科夫模型(Hiddenmarkovmodel,fMM)對(duì)豬咳嗽聲進(jìn)行識(shí)別,識(shí)別率達(dá)到80.0%。徐亞妮利用模糊c均值聚類(lèi)算法進(jìn)行豬咳嗽聲與尖叫聲識(shí)別,識(shí)別率分別達(dá)到83.4%和83.1%。深度信念網(wǎng)絡(luò)(Deepbeliefnets,DBN)由HINTON等[11]于2006年提出,DBN通過(guò)對(duì)人腦組織結(jié)構(gòu)和功能的模擬,有著與人類(lèi)類(lèi)似的記
6、憶能力、概括推理能力以及強(qiáng)大的分類(lèi)、預(yù)測(cè)能力[12]。最近幾年來(lái),深度學(xué)習(xí)在語(yǔ)音識(shí)別領(lǐng)域得到了很好的應(yīng)用,體現(xiàn)丫其強(qiáng)火的聲學(xué)建模能力[13-15]。本文把深度信念網(wǎng)絡(luò)引入豬聲音識(shí)別領(lǐng)域,以長(zhǎng)白豬咳嗽、打噴嚏、吃食、尖叫、哼哼、甩耳朵等聲音為研宄對(duì)象,構(gòu)建豬咳嗽聲識(shí)別模型,為生豬健康養(yǎng)殖過(guò)程中豬咳嗽聲的識(shí)別提供了一種新的方法。1豬聲音采集與預(yù)處理1.1豬聲音采集豬聲音采集在校屬精品豬場(chǎng)進(jìn)行。采集工具為美博-M66錄音筆,采樣頻率為48000Hz,采樣精度16位,可連續(xù)錄音24h。聲音采集在3-4月豬病多發(fā)期進(jìn)行,井采集10頭體重75kg左右長(zhǎng)白豬的聲音,經(jīng)獸咲診斷10頭豬中5頭豬感染呼吸
7、道疾病,咳嗽明顯。采用專(zhuān)家分類(lèi)法對(duì)錄音筆采集的豬聲音進(jìn)行分類(lèi)標(biāo)記,選取咳嗽、打噴嚏、吃食、尖叫、哼哼和甩耳朵聲作為研究對(duì)象。得到豬聲咅樣本1400個(gè),其屮咳嗽樣本594個(gè),打噴嚏樣本241個(gè),吃食樣本152個(gè),尖叫樣本130個(gè),哼哼樣本125個(gè),甩耳朵樣本158個(gè),保存為wav格式。1.2豬聲音預(yù)處理豬場(chǎng)環(huán)境下釆集到的豬聲音樣木伍含很多噪音和無(wú)效聲音,為提高豬咳嗽聲與非咳嗽聲識(shí)別率,在特征參數(shù)提取之前需要進(jìn)行去噪和端點(diǎn)檢測(cè)。1.2.1豬聲音樣本