說的技巧-顧客更在乎你怎么說

說的技巧-顧客更在乎你怎么說

ID:22318201

大?。?.12 MB

頁數(shù):36頁

時(shí)間:2018-10-20

說的技巧-顧客更在乎你怎么說_第1頁
說的技巧-顧客更在乎你怎么說_第2頁
說的技巧-顧客更在乎你怎么說_第3頁
說的技巧-顧客更在乎你怎么說_第4頁
說的技巧-顧客更在乎你怎么說_第5頁
資源描述:

《說的技巧-顧客更在乎你怎么說》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫

1、語音端點(diǎn)檢測(cè)的方法演講者:劉德體語音端點(diǎn)檢測(cè)的目的和意義基于短時(shí)能量和短時(shí)平均過零率的端點(diǎn)檢測(cè)基于倒譜特征的端點(diǎn)檢測(cè)基于熵的端點(diǎn)檢測(cè)基于復(fù)雜性的端點(diǎn)檢測(cè)(KC復(fù)雜性和C0復(fù)雜性)不同語音端點(diǎn)檢測(cè)方法的實(shí)驗(yàn)結(jié)果對(duì)比語音端點(diǎn)檢測(cè)的目的和意義目的語音信號(hào)端點(diǎn)檢測(cè)技術(shù)其目的就是從包含語音的一段信號(hào)中準(zhǔn)確地確定語音的起始點(diǎn)和終止點(diǎn),區(qū)分語音和非語音信號(hào),它是語音處理技術(shù)中的一個(gè)重要方面。意義有效的端點(diǎn)檢測(cè)技術(shù)不僅能在語音識(shí)別系統(tǒng)中減少數(shù)據(jù)的采集量,節(jié)約處理時(shí)間,還能排除無聲段或噪聲段的干擾,提高語音識(shí)別系統(tǒng)的性能,而且在語音編碼中還能降低噪聲和

2、靜音段的比特率,提高編碼效率?;诙虝r(shí)能量和短時(shí)平均過零率的端點(diǎn)檢測(cè)短時(shí)能量語音和噪聲的區(qū)別可以體現(xiàn)在它們的能量上,語音段的能量比噪聲段能量大,語音段的能量是噪聲段能量疊加語音聲波能量的和。在信噪比很高時(shí),那么只要計(jì)算輸入信號(hào)的短時(shí)能量或短時(shí)平均幅度就能夠把語音段和噪聲背景區(qū)分開。這是僅基于短時(shí)能量的端點(diǎn)檢測(cè)方法。信號(hào){x(n)}的短時(shí)能量定義為:語音信號(hào)的短時(shí)平均幅度定義為:其中w(n)為窗函數(shù)。短時(shí)平均過零率短時(shí)過零表示一幀語音信號(hào)波形穿過橫軸(零電平)的次數(shù)。過零分析是語音時(shí)域分析中最簡(jiǎn)單的一種。對(duì)于連續(xù)語音信號(hào),過零意味著時(shí)域

3、波形通過時(shí)間軸;而對(duì)于離散信號(hào),如果相鄰的取樣值的改變符號(hào)稱為過零。過零率就是樣本改變符號(hào)次數(shù)。信號(hào){x(n)}的短時(shí)平均過零率定義為:式中,sgn為符號(hào)函數(shù),即:過零率有兩類重要的應(yīng)用:第一,用于粗略地描述信號(hào)的頻譜特性;第二,用于判別清音和濁音、有話和無話。從上面提到的定義出發(fā)計(jì)算過零率容易受低頻干擾,特別是50Hz交流干擾的影響。解決這個(gè)問題的辦法,一個(gè)是做高通濾波器或帶通濾波,減小隨機(jī)噪聲的影響;另一個(gè)有效方法是對(duì)上述定義做一點(diǎn)修改,設(shè)一個(gè)門限T,將過零率的含義修改為跨過正負(fù)門限。于是,有定義:檢測(cè)方法利用過零率檢測(cè)清音,用短

4、時(shí)能量檢測(cè)濁音,兩者配合。首先為短時(shí)能量和過零率分別確定兩個(gè)門限,一個(gè)是較低的門限數(shù)值較小,對(duì)信號(hào)的變化比較敏感,很容易超過;另一個(gè)是比較高的門限,數(shù)值較大。低門限被超過未必是語音的開始,有可能是很短的噪聲引起的,高門限被超過并且接下來的自定義時(shí)間段內(nèi)的語音超過低門限,意味著信號(hào)開始。此時(shí)整個(gè)端點(diǎn)檢測(cè)可分為四段:靜音段、過渡段、語音段、結(jié)束。實(shí)驗(yàn)時(shí)使用一個(gè)變量表示當(dāng)前狀態(tài)。靜音段,如果能量或過零率超過低門限,就開始標(biāo)記起始點(diǎn),進(jìn)入過渡段。過渡段當(dāng)兩個(gè)參數(shù)值都回落到低門限以下,就將當(dāng)前狀態(tài)恢復(fù)到靜音狀態(tài)。而如果過渡段中兩個(gè)參數(shù)中的任一個(gè)

5、超過高門限,即被認(rèn)為進(jìn)入語音段。處于語音段時(shí),如果兩參數(shù)降低到門限以下,而且總的計(jì)時(shí)長(zhǎng)度小于最短時(shí)間門限,則認(rèn)為是一段噪音,繼續(xù)掃描以后的語音數(shù)據(jù),否則標(biāo)一記結(jié)束端點(diǎn)。20004000600080001000012000140001600018000-101Speech2040608010012014016018020022002040Energy204060801001201401601802002200102030ZCR數(shù)字“4”的短時(shí)能量與平均過零率基于倒譜特征的端點(diǎn)檢測(cè)概念信號(hào)倒譜的一種定義是信號(hào)的能量譜密度函數(shù)S(ω)的對(duì)數(shù)

6、的傅里葉反變換,或者可以將信號(hào)s(n)的倒譜c(n)看成是logS(ω)的傅里葉級(jí)數(shù)展開,即:式中Cn=C-n為實(shí)數(shù),通常稱為倒譜系數(shù),且對(duì)于一對(duì)譜密度函數(shù)S(w)與S’(w),利用Parseval定理,其對(duì)數(shù)譜的均方距離可用倒譜距離表示:式中,Cn與C’n分別代表譜密度函數(shù)S(w)與S’(w)的倒譜系數(shù)。方法:倒譜距離的測(cè)量法步驟類似于基于能量的端點(diǎn)檢測(cè),只是將倒譜距離代替短時(shí)能量來作為特征參數(shù)。首先,假定前幾幀信號(hào)是背景噪聲,計(jì)算這些幀的倒譜系數(shù),利用前幾幀倒譜系數(shù)的平均值可估計(jì)背景噪聲的倒譜系數(shù),噪聲倒譜系數(shù)的近似值可按下述規(guī)則

7、進(jìn)行更新,即當(dāng)前幀被認(rèn)為是非語音幀:式中為噪聲倒譜系數(shù)的近似值,為當(dāng)前測(cè)試幀的倒譜系數(shù),p為調(diào)節(jié)參數(shù)。倒譜距離可用下式近似計(jì)算:式中對(duì)應(yīng)于的噪聲倒譜系數(shù),計(jì)算所有測(cè)試幀與背景噪聲之間的倒譜距離可得到倒譜距離軌跡類似于基于能量的端點(diǎn)檢測(cè)過程利用倒譜距離軌跡可檢測(cè)語音的端點(diǎn)?;陟氐亩它c(diǎn)檢測(cè)基于信息熵的檢測(cè)方法對(duì)于離散型信源,當(dāng)它由若干隨機(jī)事件所組成時(shí),隨機(jī)事件出現(xiàn)的不確定度用其出現(xiàn)的概率來描述。事件出現(xiàn)的可能性愈小,概率就愈小,·而所含信息量卻愈大;相反,事件出現(xiàn)可能性愈大,概率就愈大,而所含信息量卻愈小。則信源提供的平均信息量為:這里

8、所定義的H(x)就是信息熵。由于語音信號(hào)的幅度相對(duì)于背景噪聲而言其幅度的動(dòng)態(tài)范圍大。因此可以認(rèn)為語音信號(hào)在范圍(一M,M)中的隨機(jī)事件大,也就是熵值大,而無聲狀態(tài)(信號(hào)中只含噪聲)的幅度小、分布相對(duì)集中,因而熵值小。按照

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。