資源描述:
《當(dāng)代機(jī)器語言能力的研究現(xiàn)狀與展望-論文.pdf》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、語言科學(xué)2014年1月ISSN1671——9484CN32——1687/G第13卷第1期(總第68期)34—4l當(dāng)代機(jī)器語言能力的研究現(xiàn)狀與展望*耿立波劉濤俞士汶孫茂松。楊亦鳴~江蘇師范大學(xué)語言科學(xué)學(xué)院江蘇徐州221009北京大學(xué)計(jì)算語言學(xué)研究所北京100871。清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系北京10O084語言能力協(xié)同創(chuàng)新中心江蘇徐州221009提要機(jī)器語言能力是當(dāng)代科學(xué)研究領(lǐng)域中的前沿和重大課題。文章首先對(duì)機(jī)器語言能力研究的現(xiàn)狀進(jìn)行了回顧和分析,然后對(duì)其發(fā)展趨勢進(jìn)行了展望,指出研究語言的大腦神經(jīng)機(jī)制是實(shí)現(xiàn)機(jī)器語言能力研究突破的新路
2、徑;有必要構(gòu)建機(jī)器語言能力評(píng)估等級(jí)量表,以便有針對(duì)性地提升機(jī)器處理人類自然語言的能力;提高機(jī)器的語言能力還必須加強(qiáng)學(xué)科問的合作和研究隊(duì)伍的培養(yǎng)與建設(shè)。關(guān)鍵詞機(jī)器語言能力神經(jīng)機(jī)制等級(jí)量表中圖分類號(hào)H08文獻(xiàn)標(biāo)識(shí)碼A文章編號(hào)1671—9484(2014)01—0034—081引言機(jī)器語言能力[1]主要是指機(jī)器對(duì)人類自然語言信息的智能化處理能力,研究內(nèi)容涉及機(jī)器學(xué)習(xí),機(jī)器翻譯,信息檢索,人機(jī)問答,語言、文字視聽信息的機(jī)器自動(dòng)化處理(例如語音合成與自動(dòng)辨識(shí)、古文字和少數(shù)民族文字信息自動(dòng)化處理等),物聯(lián)網(wǎng)中機(jī)器與機(jī)器、機(jī)器與人之間語言信號(hào)的
3、傳感等諸多方向,其研究核心就是要探索如何賦予機(jī)器以人的語言能力,即如何使機(jī)器能夠模仿人腦的語言加工機(jī)制,生成、理解和學(xué)習(xí)人類自然語言,從而實(shí)現(xiàn)機(jī)器與人、機(jī)器與機(jī)器之間的有效交際。機(jī)器語言能力是一個(gè)融計(jì)算機(jī)科學(xué)、人工智能、自動(dòng)化控制、數(shù)學(xué)、語言學(xué)、腦科學(xué)、認(rèn)知科學(xué)等多門學(xué)科為一體的現(xiàn)代交叉科學(xué)研究領(lǐng)域。首先,機(jī)器語言能力研究是要研制出具有人腦智能的計(jì)算機(jī)系統(tǒng)作為處理自然語言[收稿日期]2013年3月13日[定稿日期32o13年9月16日doi:10.7509/j.1insci.201309.028467本研究得到國家973計(jì)劃課題(
4、2014CB340502)、國家社會(huì)科學(xué)基金重大項(xiàng)目(10&ZD126)、國家自然科學(xué)基金項(xiàng)目(31271196)、教育部人文社會(huì)科學(xué)研究規(guī)劃項(xiàng)目(12YJC740024、13YJC740057)、江蘇省社會(huì)科學(xué)基金項(xiàng)目(11YYC011)、江蘇高校優(yōu)勢學(xué)科建設(shè)工程資助項(xiàng)目(PAPD)、江蘇高校哲學(xué)社會(huì)科學(xué)重點(diǎn)研究基地重大項(xiàng)目、江蘇師范大學(xué)科研基金項(xiàng)目(13XLR13、llXLR47)的資助,《語言科學(xué)》編輯部以及匿名審稿專家提出了寶貴的修改意見,謹(jǐn)此一并致謝?!谝蛔髡撸汗⒘⒉ā?。通訊作者:楊亦鳴(yangym@jsnu.e
5、du.cn)、俞士汶(yusw@pku.edu.cn)、孫茂松(sins@mail.tsinghua.edu.cn)。[1]該術(shù)語的提出首見于江蘇師范大學(xué)楊亦鳴教授于2013年6月28日在徐州召開的“語言能力研究與語言能力協(xié)同創(chuàng)新中心建設(shè)高峰論壇”和2013年7月2O日在南京召開的“江蘇省第二期鄉(xiāng)鎮(zhèn)語言文字規(guī)范化視導(dǎo)員培訓(xùn)班”所作的《語言與語言能力》專題演講。34耿立波等當(dāng)代機(jī)器語言能力的研究現(xiàn)狀與展望的物質(zhì)載體,因而是計(jì)算機(jī)科學(xué)、人工智能和自動(dòng)化控制研究領(lǐng)域的一部分。其次,計(jì)算機(jī)自然語言處理是以數(shù)學(xué)模型為基礎(chǔ)發(fā)展起來的,例如從早
6、期的上下文無關(guān)語法、詞匯功能語法,到當(dāng)前盛行的n元語法、隱馬爾可夫模型等。另外,這一領(lǐng)域又與語言學(xué)有著極為密切的關(guān)系,機(jī)器語言能力研究的最終目標(biāo)是要賦予機(jī)器以人的語言能力,而揭示人類的語言能力正是現(xiàn)代語言學(xué)的研究目的,所以研究機(jī)器的語言能力,必然要對(duì)人類語言本身的性質(zhì)和規(guī)律展開研究,要以當(dāng)代語言學(xué)的研究成果為指導(dǎo)。同時(shí)需要進(jìn)一步指出的是,語言是人腦最為高級(jí)的功能,腦科學(xué)研究的最高水平就是語言的認(rèn)知研究,就是要揭示語言的神經(jīng)機(jī)制(楊亦鳴和劉濤2010),著名的語言學(xué)家生成語法學(xué)派的創(chuàng)始人喬姆斯基也認(rèn)為只有腦和語言關(guān)系的研究才真正涉及
7、語言能力(楊亦鳴2007;楊亦鳴和劉濤2013),因此要使機(jī)器具有人類的語言能力,必須要先了解語言的人腦神經(jīng)機(jī)制,從這個(gè)意義上講,腦科學(xué)和認(rèn)知科學(xué)中關(guān)于語言認(rèn)知神經(jīng)機(jī)制的研究已經(jīng)成為機(jī)器語言能力研究能否取得突破的關(guān)鍵。近幾十年來,科學(xué)界對(duì)于機(jī)器語言能力的研究突飛猛進(jìn),在機(jī)器翻譯、信息檢索等計(jì)算機(jī)自然語言處理的諸多方面都取得了卓有成效的研究成果,機(jī)器處理自然語言的水平有了很大提高,但這種發(fā)展勢頭在近階段已漸趨緩,其瓶頸就在于目前的研究仍然無法使機(jī)器的語言能力真正達(dá)到人腦的智能水平。那么怎樣才能真正實(shí)現(xiàn)機(jī)器智能化水平的突破,使機(jī)器具有
8、人類一樣的處理自然語言的能力?除了原有路徑,能否在現(xiàn)有研究的基礎(chǔ)上辟出一條新路?現(xiàn)在已經(jīng)成為現(xiàn)代科學(xué)研究領(lǐng)域中的重大挑戰(zhàn)。本文將在對(duì)機(jī)器語言能力相關(guān)研究現(xiàn)狀回顧和分析的基礎(chǔ)上,對(duì)其發(fā)展趨勢進(jìn)行展望,希望能夠?yàn)樵撗芯款I(lǐng)域的發(fā)展提供一些啟示。2機(jī)器語言