資源描述:
《現(xiàn)代語音學的發(fā)展現(xiàn)狀及展望》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、現(xiàn)代語音學的現(xiàn)狀和展望鮑懷翹中國社會科學院民族學與人類學研究所InstituteofEthnologyandAnthropology,CASSbaohq@263.net實驗語音學(簡稱“語音學”)是一門借助醫(yī)學、聲學、計算科學、心理學的知識和最先進的設備來揭示和研究語音產(chǎn)生的過程、語音的聲學特性和人對于語聲感知特性的科學。凡是依靠語音來進行交際的地方,不論是人和人,還是人和機器,都是可以找到語音學的足跡,語音學成為語言科學中最活躍、最貼近應用的一個分支學科。語音學有三個基本的分支:生理語音學,聲學語音學和感知語音學1,生理語音學
2、(Physiologicalphonetics):語音的產(chǎn)生首先由肺氣流沖擊聲帶使其產(chǎn)生開合振動,帶音氣流(嗓音、濁音)在聲腔(口腔、鼻腔、咽腔)中產(chǎn)生共振,從而發(fā)出不同的語音(音素)1.1聲帶發(fā)音狀態(tài)及其振動機理的研究:聲帶振動是產(chǎn)生元音、濁輔音和韻律的決定性條件1.1.1利用頻閃喉鏡來研究聲帶的振動狀態(tài),聲帶振動周期;1.1.2聲帶振動的理論:粘膜肌彈性空氣動力學說。根據(jù)這一學說,石坂謙三和Flanagan(1978)提出了雙質(zhì)量模型及其等效電路.1.1.3研究意義:語言學意義(元、輔音緊松問題);嗓音醫(yī)學;語音技術(shù)(語音編
3、碼壓縮、語音合成、語音轉(zhuǎn)換等)1,生理語音學(PhysiologicalPhonetics):1.2聲腔共鳴研究:1.2.1發(fā)音動作的靜態(tài)綜合研究:《普通話發(fā)音圖譜》19631.2.2發(fā)音動作的X光電影及其后期圖像處理;1.2.3動態(tài)腭位研究;1.2.4唇形動作研究及普通話視位;1.2.5聲腔形狀與共振峰相互關(guān)系(言語產(chǎn)生聲學理論):2.聲學語音學(AcousticPhonetics)語音表現(xiàn)為一種音頻信號,是可感知的信息和計算機語音處理技術(shù)的物質(zhì)基礎。2.1利用語音信號處理設備(Multi-speech,Praat,wavel
4、etMinispeech….)來分析語音的聲學特性,元音(單元音、復合元音)、輔音、聲調(diào)各有自己特定的聲學特征,這些特征都與語音的生理特征緊密相關(guān);2.2語音聲學參數(shù)數(shù)據(jù)庫:2.2.1元音聲學參數(shù),聲學元音圖,生理與聲學兩者關(guān)系圖;2.2.2輔音聲學參數(shù);2.2.3聲學參數(shù)數(shù)據(jù)庫:3.語音語料庫建設語言資源無論是對于語音應用技術(shù)還是基礎研究來說都顯得越來越重要了,在口語處理中就需要各種各樣的庫。3.1語音系統(tǒng)分析需要一個能全面反映該語言語音特點的的語料庫;3.2基于數(shù)據(jù)驅(qū)動的語音合成需要一個大規(guī)模的語音庫提供合成的所有語音單元(
5、以句子的形式);感情語料庫等;3.3語音識別、語音翻譯需要特定的語料庫;3.4生理研究需要一個生理參數(shù)數(shù)據(jù)庫以獲得發(fā)音參數(shù);3.5語料庫都需要標注(音素和韻律),以便于進行聲學和韻律特征分析;因此需要一套音素和韻律標注用的符號系統(tǒng)和平臺,(如語言所提出的SAMPA-C,C-TOBI音段和韻律標注系統(tǒng))當前語音合成技術(shù)發(fā)展介紹:4.1共振峰合成器4.2波形拼接合成器是當前的主流技術(shù):通過統(tǒng)計方法(HMM)得到的聲學參數(shù)模型具有良好的領域普適性,并且通過模型生成的語音參數(shù)更加平滑,不易發(fā)生拼接合成中常見的不連續(xù)現(xiàn)象合成1角色轉(zhuǎn)換合成
6、歌唱合成:利用輸入的樂譜信息控制合成語音的韻律特征5.自動發(fā)音評估和診斷技術(shù)(AutomaticPronunciationAssessmentandDiagnosis)這項語音技術(shù)是以語音自動識別(以統(tǒng)計方法作為基本技術(shù))為基礎、是計算機輔助語言學習系統(tǒng)和計算機輔助語言測試系統(tǒng)的的重要核心技術(shù)。在普通話及普通話作為第二語言的學習診斷系統(tǒng)研究實踐中,語音學專家知識及其分析得到的規(guī)則已發(fā)揮了很大的作用,目的是尋找區(qū)分其發(fā)音的可量化的特征,利用這些特征構(gòu)建分類器,完成發(fā)音質(zhì)量自動評估和錯誤檢測。5.1最近,著名美籍華裔科學家李錦輝博士
7、提出一項完全利用語音聲學特征和語音規(guī)則系統(tǒng)來作為識別的模板,越來越多的學者也認同這一主張;5.2中國科技大學魏思等人利用容易混淆的音素對的發(fā)音錯誤先驗知識來修正后驗概率,排除了常見典型錯誤和易混淆音素,提高了發(fā)音質(zhì)量評估的性能并加強了常見典型錯誤的檢測能力。5.3.S.M.Witt提到,在語音頻譜結(jié)構(gòu)中,母語和非母語主要區(qū)別在于F2、F3以上共振峰的不同,在時域上充分利用VOT、GAP的不同作為區(qū)別性特征;5.4Hiller等人在SPELL項目(自動識別)中利用聲學語音學特征,其方法是:首先估計元音段的共振峰和基頻,歸一化處理后
8、,分析得到所發(fā)元音在聲學元音圖上的位置,通過相似度來估計元音發(fā)音的準確性;5.5董斌(中科院聲學所)等針對普通話/z/和/zh/組輔音聲學特征的不同,采用強頻集中區(qū)的能量分布作為區(qū)別性特征,對平、翹舌部位進行區(qū)分,收到了很好的效果;語音學研究及其應用方面雖取得了