資源描述:
《當代機器語言能力的研究現(xiàn)狀與展望-論文.pdf》由會員上傳分享,免費在線閱讀,更多相關內容在應用文檔-天天文庫。
1、語言科學2014年1月ISSN1671——9484CN32——1687/G第13卷第1期(總第68期)34—4l當代機器語言能力的研究現(xiàn)狀與展望*耿立波劉濤俞士汶孫茂松。楊亦鳴~江蘇師范大學語言科學學院江蘇徐州221009北京大學計算語言學研究所北京100871。清華大學計算機科學與技術系北京10O084語言能力協(xié)同創(chuàng)新中心江蘇徐州221009提要機器語言能力是當代科學研究領域中的前沿和重大課題。文章首先對機器語言能力研究的現(xiàn)狀進行了回顧和分析,然后對其發(fā)展趨勢進行了展望,指出研究語言的大腦神經機制是實現(xiàn)機器語言能力研究突破的新路
2、徑;有必要構建機器語言能力評估等級量表,以便有針對性地提升機器處理人類自然語言的能力;提高機器的語言能力還必須加強學科問的合作和研究隊伍的培養(yǎng)與建設。關鍵詞機器語言能力神經機制等級量表中圖分類號H08文獻標識碼A文章編號1671—9484(2014)01—0034—081引言機器語言能力[1]主要是指機器對人類自然語言信息的智能化處理能力,研究內容涉及機器學習,機器翻譯,信息檢索,人機問答,語言、文字視聽信息的機器自動化處理(例如語音合成與自動辨識、古文字和少數(shù)民族文字信息自動化處理等),物聯(lián)網中機器與機器、機器與人之間語言信號的
3、傳感等諸多方向,其研究核心就是要探索如何賦予機器以人的語言能力,即如何使機器能夠模仿人腦的語言加工機制,生成、理解和學習人類自然語言,從而實現(xiàn)機器與人、機器與機器之間的有效交際。機器語言能力是一個融計算機科學、人工智能、自動化控制、數(shù)學、語言學、腦科學、認知科學等多門學科為一體的現(xiàn)代交叉科學研究領域。首先,機器語言能力研究是要研制出具有人腦智能的計算機系統(tǒng)作為處理自然語言[收稿日期]2013年3月13日[定稿日期32o13年9月16日doi:10.7509/j.1insci.201309.028467本研究得到國家973計劃課題(
4、2014CB340502)、國家社會科學基金重大項目(10&ZD126)、國家自然科學基金項目(31271196)、教育部人文社會科學研究規(guī)劃項目(12YJC740024、13YJC740057)、江蘇省社會科學基金項目(11YYC011)、江蘇高校優(yōu)勢學科建設工程資助項目(PAPD)、江蘇高校哲學社會科學重點研究基地重大項目、江蘇師范大學科研基金項目(13XLR13、llXLR47)的資助,《語言科學》編輯部以及匿名審稿專家提出了寶貴的修改意見,謹此一并致謝?!谝蛔髡撸汗⒘⒉?、劉濤。通訊作者:楊亦鳴(yangym@jsnu.e
5、du.cn)、俞士汶(yusw@pku.edu.cn)、孫茂松(sins@mail.tsinghua.edu.cn)。[1]該術語的提出首見于江蘇師范大學楊亦鳴教授于2013年6月28日在徐州召開的“語言能力研究與語言能力協(xié)同創(chuàng)新中心建設高峰論壇”和2013年7月2O日在南京召開的“江蘇省第二期鄉(xiāng)鎮(zhèn)語言文字規(guī)范化視導員培訓班”所作的《語言與語言能力》專題演講。34耿立波等當代機器語言能力的研究現(xiàn)狀與展望的物質載體,因而是計算機科學、人工智能和自動化控制研究領域的一部分。其次,計算機自然語言處理是以數(shù)學模型為基礎發(fā)展起來的,例如從早
6、期的上下文無關語法、詞匯功能語法,到當前盛行的n元語法、隱馬爾可夫模型等。另外,這一領域又與語言學有著極為密切的關系,機器語言能力研究的最終目標是要賦予機器以人的語言能力,而揭示人類的語言能力正是現(xiàn)代語言學的研究目的,所以研究機器的語言能力,必然要對人類語言本身的性質和規(guī)律展開研究,要以當代語言學的研究成果為指導。同時需要進一步指出的是,語言是人腦最為高級的功能,腦科學研究的最高水平就是語言的認知研究,就是要揭示語言的神經機制(楊亦鳴和劉濤2010),著名的語言學家生成語法學派的創(chuàng)始人喬姆斯基也認為只有腦和語言關系的研究才真正涉及
7、語言能力(楊亦鳴2007;楊亦鳴和劉濤2013),因此要使機器具有人類的語言能力,必須要先了解語言的人腦神經機制,從這個意義上講,腦科學和認知科學中關于語言認知神經機制的研究已經成為機器語言能力研究能否取得突破的關鍵。近幾十年來,科學界對于機器語言能力的研究突飛猛進,在機器翻譯、信息檢索等計算機自然語言處理的諸多方面都取得了卓有成效的研究成果,機器處理自然語言的水平有了很大提高,但這種發(fā)展勢頭在近階段已漸趨緩,其瓶頸就在于目前的研究仍然無法使機器的語言能力真正達到人腦的智能水平。那么怎樣才能真正實現(xiàn)機器智能化水平的突破,使機器具有
8、人類一樣的處理自然語言的能力?除了原有路徑,能否在現(xiàn)有研究的基礎上辟出一條新路?現(xiàn)在已經成為現(xiàn)代科學研究領域中的重大挑戰(zhàn)。本文將在對機器語言能力相關研究現(xiàn)狀回顧和分析的基礎上,對其發(fā)展趨勢進行展望,希望能夠為該研究領域的發(fā)展提供一些啟示。2機器語言