資源描述:
《基于麥克風(fēng)陣列的時(shí)延定位算法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、ComputerEngineeringandApplications計(jì)算機(jī)工程與應(yīng)用基于麥克風(fēng)陣列的時(shí)延定位算法研究潘崢嶸,段麗萍,楊智剛PANZhengrong,DUANLiping,YANGZhigang蘭州理工大學(xué)電氣工程與信息工程學(xué)院控制理論與控制工程LanzhouUniversityofTechnology,Lanzhou,730050PANZhengrong,DUANLiping,YANGZhigang.Researchontime-delaylocalizationalgorithmbasedonmicrophonearrayAbstract:Aiming
2、atlowSNRofdelayestimationoftraditionalcross-powerspectrumphase(CSP)methodinthestrongnoiseenvironment,animprovedCSPmethodtosolvethisproblemisproposedinthispaper.Inthefirst,thetraditionalmethodofCSPisstudiedandthespeechsignalenergyontheratiooftotalenergyisanalyzed.Secondly,inorderthatthesp
3、eechsignalisnotdrownedinthestrongnoiseenvironment,anonlinearparameterchangingwithSignaltoNoiseRatio(SNR)isdefined.Byadjustingthenon-linearparametertocontrolthesizeofweightingfunction,therebyreducingtheinfluenceofnoise,theanti-noiseperformanceofthealgorithmisimproved.Finally,threemethodso
4、ftime-delayestimationarecomparedonmatlabplatformbyusingeightlineararraymicrophonevoicesignalacquisitionindifferentSNRenvironments,andsimulationresultsshowthattheimprovedCSPmethodhasbetterpositioningperformancethantraditionalCSPandSCOTmethodinthestrongnoiseenvironment.Keywords:SoundLocali
5、zation;Time-delayEstimation;Cross-powerSpectrumPhase摘要:針對互功率譜相位(CSP)法在低信噪比環(huán)境下,時(shí)延估計(jì)精度下降這一問題,提出了一種改進(jìn)的CSP方法。首先研究了傳統(tǒng)的CSP法,分析了語音信號能量在總能量中的比例問題,為保證強(qiáng)噪聲環(huán)境下,語音信號不被淹沒,定義了一個(gè)隨信噪比變化的非線性參量,通過該非線性參量調(diào)節(jié)加權(quán)函數(shù)的大小,進(jìn)而減小噪聲的影響,提高算法的抗噪性能。最后,采用8個(gè)線性陣列麥克風(fēng)采集語音信號,在Matlab平臺(tái)上,就傳統(tǒng)的CSP算法,SCOT算法,改進(jìn)CSP算法,在高信噪比和低信噪比環(huán)境下進(jìn)行仿真驗(yàn)
6、證,仿真結(jié)果表明,改進(jìn)的CSP方法在強(qiáng)噪聲環(huán)境下具有更好的定位性能。關(guān)鍵詞:聲源定位;時(shí)延估計(jì);互功率譜相位doi:10.3778/j.issn.1002‐8331.1312‐0447文獻(xiàn)標(biāo)識(shí)碼:A中圖分類號:TN912.3[4][5]1引言人,視頻會(huì)議系統(tǒng)等方面有廣泛的應(yīng)用。麥克風(fēng)陣列技術(shù)源于聲納、雷達(dá)等系統(tǒng)目前,基于麥克風(fēng)陣列的聲源定位方法[6]中陣列信號處理技術(shù),改變傳統(tǒng)單個(gè)麥克風(fēng)主要分為三類:第一類是基于波束形成的使用方式,利用多個(gè)麥克風(fēng)組成一定形狀的定位技術(shù),該方法對初始點(diǎn)的選擇非常敏陣列,同時(shí)采集語音,用陣列信號處理的方感,因此,不太適用于實(shí)時(shí)處理系統(tǒng)。第二
7、[1]法獲得高質(zhì)量的語音信號。它在時(shí)域和頻類是基于高分辨率譜估計(jì)的定位技術(shù),該方域的基礎(chǔ)上增加一個(gè)空間域,對接收到的來法存在運(yùn)算量大的缺點(diǎn),并且不適用于近自空間不同方向的語音信號進(jìn)行處理,能夠場。第三類是基于到達(dá)時(shí)間差的定位技術(shù),實(shí)現(xiàn)說話人方向的實(shí)時(shí)跟蹤,從而可實(shí)現(xiàn)定該算法原理簡單,且計(jì)算量小,估計(jì)精度相[2][7]向語音采集,提高信噪比。近年來,基于對較高,所以在實(shí)際系統(tǒng)中應(yīng)用較多。麥克風(fēng)陣列的聲源位置估計(jì)已經(jīng)成為一個(gè)基于到達(dá)時(shí)間差的定位算法分為兩個(gè)[3][8]十分活躍的研究領(lǐng)域,它在人機(jī)交互和智步驟:第一步為時(shí)延估計(jì),用于計(jì)算被測能空