資源描述:
《無線電對講語音的說話人分割聚類研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、無線電對講語音的說話人分割聚類研究肖澤蘋2016年1月無線電對講語音的說話人分割聚類研究作者姓名肖澤蘋學(xué)院名稱信息與電子學(xué)院指導(dǎo)教師謝湘副教授答辯委員會主席費澤松教授申請學(xué)位工學(xué)碩士學(xué)科專業(yè)信息與通信工程學(xué)位授予單位北京理工大學(xué)論文答辯日期2016年1月6日WirelessIntercomAudioofSpeakerSegmentationandClusteringResearchCandidateName:ZepingXiaoSchoolorDepartment:InformationandElectronicsFacultyMento
2、r:AssosiateProf.XiangXieChair,ThesisCommeetee:Prof.ZesongFeiDegreeApplied:MasterofEngineeringMajor:InformationEngineeringDegreeby:BeijingInstituteofTechnologyTheDateofDenfence:January.6,2016研究成果聲明本人鄭重聲明:所提交的學(xué)位論文是我本人在指導(dǎo)教師的指導(dǎo)下進行的研究工作獲得的研究成果。盡我所知,文中除特別標(biāo)注和致謝的地方外,學(xué)位論文中不包含其他人已經(jīng)
3、發(fā)表或撰寫過的研究成果,也不包含為獲得北京理工大學(xué)或其它教育機構(gòu)的學(xué)位或證書所使用過的材料。與我一同工作的合作者對此研究工作所做的任何貢獻均已在學(xué)位論文中作了明確的說明并表示了謝意。特此申明。簽名:日期:北京理工大學(xué)碩士學(xué)位論文摘要伴隨著信息爆炸和大數(shù)據(jù)時代的到來,音頻獲取途徑和數(shù)量迅速增加,音頻管理變得越來越復(fù)雜,說話人分割聚類作為音頻管理的一種方式近幾年在國際上逐漸成為研究熱點。說話人分割聚類是說話人識別、話者跟蹤、話者自適應(yīng)的前期處理和必要步驟。本文針對多說話人、信道變化、背景噪聲大的無線電對講語音,主要進行說話人分割聚類研究。在分
4、析現(xiàn)有無監(jiān)督說話人分割算法的基礎(chǔ)上,使用BIC、GLR和KL2準(zhǔn)則對音頻進行說話人分割,通過移動不同尺度的時間窗來快速確定存在的說話人變化點,最佳性能達到F=65.47%。說話人聚類是通過CLR距離的自底向上的層次聚類來實現(xiàn)的,聚類的終止條件是系統(tǒng)中指定的說話人個數(shù)。針對音頻中包含較大的背景噪聲,使用經(jīng)典的譜減法和維納濾波器對音頻進行語音增強,對增強后的語音進行說話人分割聚類實驗。在以上說話人分割算法性能遇到瓶頸時,通過觀察發(fā)現(xiàn)地面控制中心和飛行員說話結(jié)束后會產(chǎn)生按鍵音。由于按鍵音是說話人變化的標(biāo)識,由此提出信息融合的方法進行說話人分割聚
5、類。在研究現(xiàn)有聲學(xué)事件檢測算法的基礎(chǔ)上,使用時域分析和模型匹配的方法進行聲學(xué)事件檢出。通過實驗得到高召回率和高準(zhǔn)確率的事件位置后,對說話人分割結(jié)果進行修正。實驗表明增加事件檢測后說話人分割算法性能提升到77.18%,比之前單獨使用最好的BIC方法的綜合性能相對提升了17.88%,召回率和準(zhǔn)確率分別相對提升了20.01%和15.50%。關(guān)鍵詞:信息融合;說話人分割聚類;聲學(xué)事件檢測I北京理工大學(xué)碩士學(xué)位論文AbstractWiththearrivaloftheinformationexplosionandthebigdataera,thew
6、ayandquantityoftheaudioacquisitionisincreasingrapidly,themanagementofaudioisbecomingmoreandmorecomplex.Thespeakersegmentationandclusteringasawayofaudiomanagementgraduallybecomeahotresearchtopicinrecentyearsintheworld.Speakersegmentationandclusteringarethepre-processingand
7、necessarystepsforspeakeridentification,speakertrackingandspeakeradaptations.Inthispaperforwalkie-talkieradiosystem’sspeechwithmulti-speakers,channelchangeandlargenoises,wefocusonspeakersegmentationandclustering.Firstweanalysisoftheexistingunsupervisionalgorithmsofspeakers
8、egmentationandusetheBIC,GLRandKL2criterionforspeakersegmentation,throughmovingtimewindowofdiffer