現(xiàn)代語音學的發(fā)展現(xiàn)狀及展望

ID：36901057

大?。?85.31 KB

頁數(shù)：12頁

時間：2019-05-10

資源描述：

《現(xiàn)代語音學的發(fā)展現(xiàn)狀及展望》由會員上傳分享，免費在線閱讀，更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、現(xiàn)代語音學的現(xiàn)狀和展望鮑懷翹中國社會科學院民族學與人類學研究所InstituteofEthnologyandAnthropology,CASSbaohq@263.net實驗語音學（簡稱“語音學”）是一門借助醫(yī)學、聲學、計算科學、心理學的知識和最先進的設備來揭示和研究語音產(chǎn)生的過程、語音的聲學特性和人對于語聲感知特性的科學。凡是依靠語音來進行交際的地方，不論是人和人，還是人和機器，都是可以找到語音學的足跡，語音學成為語言科學中最活躍、最貼近應用的一個分支學科。語音學有三個基本的分支：生理語音學，聲學語音學和感知語音學1，生理語音學

2、(Physiologicalphonetics)：語音的產(chǎn)生首先由肺氣流沖擊聲帶使其產(chǎn)生開合振動，帶音氣流（嗓音、濁音）在聲腔（口腔、鼻腔、咽腔）中產(chǎn)生共振，從而發(fā)出不同的語音（音素）1.1聲帶發(fā)音狀態(tài)及其振動機理的研究：聲帶振動是產(chǎn)生元音、濁輔音和韻律的決定性條件1.1.1利用頻閃喉鏡來研究聲帶的振動狀態(tài)，聲帶振動周期；1.1.2聲帶振動的理論：粘膜肌彈性空氣動力學說。根據(jù)這一學說,石坂謙三和Flanagan(1978)提出了雙質(zhì)量模型及其等效電路.1.1.3研究意義：語言學意義（元、輔音緊松問題）；嗓音醫(yī)學；語音技術(shù)（語音編

3、碼壓縮、語音合成、語音轉(zhuǎn)換等）1，生理語音學（PhysiologicalPhonetics）：1.2聲腔共鳴研究：1.2.1發(fā)音動作的靜態(tài)綜合研究：《普通話發(fā)音圖譜》19631.2.2發(fā)音動作的X光電影及其后期圖像處理；1.2.3動態(tài)腭位研究；1.2.4唇形動作研究及普通話視位；1.2.5聲腔形狀與共振峰相互關(guān)系（言語產(chǎn)生聲學理論）：2.聲學語音學（AcousticPhonetics）語音表現(xiàn)為一種音頻信號，是可感知的信息和計算機語音處理技術(shù)的物質(zhì)基礎。2.1利用語音信號處理設備（Multi-speech,Praat,wavel

4、etMinispeech….）來分析語音的聲學特性，元音(單元音、復合元音)、輔音、聲調(diào)各有自己特定的聲學特征，這些特征都與語音的生理特征緊密相關(guān)；2.2語音聲學參數(shù)數(shù)據(jù)庫：2.2.1元音聲學參數(shù)，聲學元音圖，生理與聲學兩者關(guān)系圖；2.2.2輔音聲學參數(shù)；2.2.3聲學參數(shù)數(shù)據(jù)庫：3.語音語料庫建設語言資源無論是對于語音應用技術(shù)還是基礎研究來說都顯得越來越重要了，在口語處理中就需要各種各樣的庫。3.1語音系統(tǒng)分析需要一個能全面反映該語言語音特點的的語料庫；3.2基于數(shù)據(jù)驅(qū)動的語音合成需要一個大規(guī)模的語音庫提供合成的所有語音單元（

5、以句子的形式）；感情語料庫等；3.3語音識別、語音翻譯需要特定的語料庫；3.4生理研究需要一個生理參數(shù)數(shù)據(jù)庫以獲得發(fā)音參數(shù)；3.5語料庫都需要標注（音素和韻律），以便于進行聲學和韻律特征分析；因此需要一套音素和韻律標注用的符號系統(tǒng)和平臺，（如語言所提出的SAMPA-C,C-TOBI音段和韻律標注系統(tǒng)）當前語音合成技術(shù)發(fā)展介紹：4.1共振峰合成器4.2波形拼接合成器是當前的主流技術(shù)：通過統(tǒng)計方法（HMM）得到的聲學參數(shù)模型具有良好的領域普適性，并且通過模型生成的語音參數(shù)更加平滑，不易發(fā)生拼接合成中常見的不連續(xù)現(xiàn)象合成1角色轉(zhuǎn)換合成

6、歌唱合成：利用輸入的樂譜信息控制合成語音的韻律特征5.自動發(fā)音評估和診斷技術(shù)(AutomaticPronunciationAssessmentandDiagnosis)這項語音技術(shù)是以語音自動識別（以統(tǒng)計方法作為基本技術(shù)）為基礎、是計算機輔助語言學習系統(tǒng)和計算機輔助語言測試系統(tǒng)的的重要核心技術(shù)。在普通話及普通話作為第二語言的學習診斷系統(tǒng)研究實踐中，語音學專家知識及其分析得到的規(guī)則已發(fā)揮了很大的作用，目的是尋找區(qū)分其發(fā)音的可量化的特征，利用這些特征構(gòu)建分類器，完成發(fā)音質(zhì)量自動評估和錯誤檢測。5.1最近，著名美籍華裔科學家李錦輝博士

7、提出一項完全利用語音聲學特征和語音規(guī)則系統(tǒng)來作為識別的模板，越來越多的學者也認同這一主張；5.2中國科技大學魏思等人利用容易混淆的音素對的發(fā)音錯誤先驗知識來修正后驗概率，排除了常見典型錯誤和易混淆音素，提高了發(fā)音質(zhì)量評估的性能并加強了常見典型錯誤的檢測能力。5.3.S.M.Witt提到，在語音頻譜結(jié)構(gòu)中，母語和非母語主要區(qū)別在于F2、F3以上共振峰的不同，在時域上充分利用VOT、GAP的不同作為區(qū)別性特征；5.4Hiller等人在SPELL項目(自動識別)中利用聲學語音學特征，其方法是：首先估計元音段的共振峰和基頻，歸一化處理后

8、，分析得到所發(fā)元音在聲學元音圖上的位置，通過相似度來估計元音發(fā)音的準確性；5.5董斌（中科院聲學所）等針對普通話/z/和/zh/組輔音聲學特征的不同，采用強頻集中區(qū)的能量分布作為區(qū)別性特征，對平、翹舌部位進行區(qū)分，收到了很好的效果；語音學研究及其應用方面雖取得了

當前文檔最多預覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 12



此文檔下載收益歸作者所有

當前文檔最多預覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學公式或PPT動畫的文件，查看預覽時可能會顯示錯亂或異常，文件下載后無此問題，請放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容，確認文檔內(nèi)容符合您的需求后進行下載，若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤，付費完成后未能成功下載的用戶請聯(lián)系客服處理。

現(xiàn)代語音學的發(fā)展現(xiàn)狀及展望

現(xiàn)代語音學的發(fā)展現(xiàn)狀及展望

相關(guān)文章

相關(guān)標簽