資源描述:
《以概率為基礎(chǔ)的語言研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、以概率為基礎(chǔ)的語言研究 一、語言事實(shí)與語言理論 20世紀(jì)中葉以來,生成轉(zhuǎn)換語法突破原來結(jié)構(gòu)主義和行為主義的藩籬,掀起了語言學(xué)界的軒然大波,出現(xiàn)了眾多語言理論異彩紛呈的局面。在語言學(xué)爭論中,各種語言學(xué)派都列舉語言事實(shí)作為其理論的支撐點(diǎn)。從現(xiàn)代語言學(xué)的傳統(tǒng)來看,從描寫主義、歷史主義到結(jié)構(gòu)主義,從語言習(xí)得、語言教學(xué)到語文改革,都注重收集語言數(shù)據(jù),提倡經(jīng)驗主義。Chomsky(1957,1961)的理性主義則主張語言學(xué)家的任務(wù)是描寫人的語言能力,外部語料(例如語料庫)無法解釋語言能力。理性主義所根據(jù)的語言事實(shí)是語言學(xué)家本身的母語知識(直覺、天性),由此可推導(dǎo)
2、出UG(linguisticuniversals,語言共同性、語言共項)。Chomsky主要針對20世紀(jì)中葉以前以經(jīng)驗主義為基礎(chǔ)的語法研究(例如Fries依賴美國政府非正式通訊檔案來編寫AmericanEnglishGrammar,1940),不無道理。但理性主義研究方法提出以來,語言理論層出不窮,而我們在沉迷于理論的解釋時,卻往往忽略了一個出發(fā)點(diǎn):語言理論雖可解釋語言事實(shí),但語言事實(shí)本身并非語言理論的產(chǎn)物。語言事實(shí)和語言理論究竟誰是第一性的?如果我們承認(rèn)語言事實(shí)是第一性的,那么根據(jù)哪些語言事實(shí)來提升語言理論?是語言研究者憑本人直覺所提供的語言事實(shí),還是大
3、多數(shù)語言使用者所提供的語言事實(shí)?鄭錦全在談到美國語言學(xué)研究現(xiàn)狀時指出:“目前美國語言學(xué)界存在一個問題:理論泛濫,而缺少充分的語言材料,不夠扎實(shí)”(張鳳芝等2002:77)?! ≌Z言學(xué)中理性主義的基石之一是語言能力/運(yùn)用的兩分法,自Saussure提出“語言”和“言語”的區(qū)別以來,贊成此說者不少。Chomsky強(qiáng)化了它們的區(qū)別,將之看成是涇渭分明。對此,不同的語言學(xué)家從不同的角度提出了相反的看法。從語篇研究的角度持相反意見的語言學(xué)家有:Pike,Hjelmslev,Firth,Halliday,vanDijkKintsch,Hartmann等人(見Beaug
4、rande1991)。社會語言學(xué)家(如Hymes1972)、功能語法學(xué)派(如Hallidayl973)、應(yīng)用語言學(xué)家(如cEneryanningSchutze(1999)認(rèn)為,從1960到1985之間,理性主義完全統(tǒng)治了語言學(xué)、心理學(xué)、人工智能和自然語言處理,但是原來在1920-1960年間盛行過的經(jīng)驗主義傳統(tǒng)在1970-1989年之間有所復(fù)蘇。經(jīng)驗主義也認(rèn)為人的大腦生來就有認(rèn)知能力,不過并沒有理性主義所說的與語言組件有關(guān)的原則和程序。經(jīng)驗主義從信息論的角度出發(fā),不贊成范疇化的原則,把語言現(xiàn)象分為合語法和不合語法。Colorlessgreenideassl
5、eepfuriously雖然合乎語法,但實(shí)際上沒有人那樣說。還不如把語言事件的出現(xiàn)看成是概率性的行為,如把句子分為“經(jīng)常出現(xiàn)”和“不經(jīng)常出現(xiàn)”。所以一個學(xué)英語的學(xué)生寫下這樣的句子:Inadditiontothis,sheinsistedthatenmanunfairly./Ihaveanacheinthehead.即算是合語法,操本族語者也聽得懂,但卻覺得他們自己不會這樣說。ManningSchutze(1999)認(rèn)為,語言的非范疇化現(xiàn)象在語言變化中尤為明顯。英語中的sky(1957)反對根據(jù)語料庫的話語來計算句子的概率,認(rèn)為這樣一來,合語法和不合語法的句
6、子的概率都會很低,難以解釋語言的能產(chǎn)性。ManningSchutze(1999)認(rèn)為這種看法只是針對那些對概率表征有偏見的人而言的。以tall(高)的認(rèn)知表征而言,當(dāng)我們看到一個堂堂七尺的男子漢,又第一次看到這樣的高度時,我們才會叫他“高個子”,而不會把他看成非范疇化的男子。如果又看到一個只有四尺的男子,我們絕不會叫他為“高個子”。所以概率論的模型很容易表征這種規(guī)律性,而對未經(jīng)檢驗的句子做出判斷。它不會把未經(jīng)判斷的句子都看成一樣。 三、語料庫語言學(xué)的興起 Svartvik(1996)指出,語料庫正在成為主流,它不但提供了一種研究方法,而且提供了一種
7、新的哲學(xué)思維方式,就像Leech(1992)所說的,“它是一種‘芝麻開門’,導(dǎo)致關(guān)于語言的新思維方式”。Sampson(2001)認(rèn)為,由于語言運(yùn)用存在一些別的因素而排斥它,也違反科學(xué)常理。例如加速使物體下落部分地受引力規(guī)律所控制,但其他的外部因素(例如空氣阻力、氣流運(yùn)動)也會發(fā)生干擾。一個研究引力規(guī)律的物理學(xué)家不會因為有了這些外部因素,而放棄觀察數(shù)據(jù)。他無非是把這些因素分離開來。Sampson(1992)指出,采用內(nèi)省式方法想出來的句子和語料庫所收集的句子相距甚遠(yuǎn),不但是語料,就是內(nèi)省式判斷也存在任意性偏態(tài)。Chomsky認(rèn)為有些句子不見于語料庫,這實(shí)際
8、上說明一個饒有趣味而又十分重要的問題:頻數(shù)問題。人類并不太清楚某些