關(guān)于新的句法標(biāo)注模型探索的論文

ID：10827144

大?。?9.00 KB

頁(yè)數(shù)：6頁(yè)

時(shí)間：2018-07-08

資源描述：

《關(guān)于新的句法標(biāo)注模型探索的論文》由會(huì)員上傳分享，免費(fèi)在線閱讀，更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、關(guān)于新的句法標(biāo)注模型探索的論文　　論文關(guān)鍵詞：語(yǔ)料庫(kù)語(yǔ)言學(xué)　語(yǔ)義處理　句法標(biāo)注模型　　論文摘要：由于自然語(yǔ)言的語(yǔ)義存在不確定性，形式化很困難，因此語(yǔ)義處理成為自然語(yǔ)言處理的瓶頸所在?；诖笠?guī)模標(biāo)注語(yǔ)料庫(kù)的語(yǔ)義處理已經(jīng)成為發(fā)展趨勢(shì)，語(yǔ)料標(biāo)注本質(zhì)上就是語(yǔ)言知識(shí)(包括語(yǔ)義)形式化?，F(xiàn)有句法標(biāo)注模型主要包括基于短語(yǔ)結(jié)構(gòu)語(yǔ)法(psg)和基于依存語(yǔ)法(dg)的句法標(biāo)注模型，還存在一些局限性。文章在現(xiàn)有句法標(biāo)注模型的基礎(chǔ)上結(jié)合認(rèn)知語(yǔ)法(cg)的有關(guān)理論提出改進(jìn)思路，以探索新的句法標(biāo)注模型。　　　　人類(lèi)社會(huì)發(fā)展的

2、基本軌跡是：原始社會(huì)—農(nóng)業(yè)社會(huì)—工業(yè)社會(huì)—信息社會(huì)。人工智能的目標(biāo)是用計(jì)算機(jī)模擬人的智能，以最大限度地解放和延伸人的智能，無(wú)疑是信息社會(huì)的制高點(diǎn)。語(yǔ)言是人思維的物質(zhì)外殼，人不可能離開(kāi)語(yǔ)言而具備真正屬于人的高級(jí)智能。因此，模擬人類(lèi)語(yǔ)言智能的自然語(yǔ)言處理無(wú)疑是人工智能的重要研究方向。然而，迄今為止的研究表明，在可以預(yù)見(jiàn)的將來(lái)，語(yǔ)義處理將是自然語(yǔ)言處理的瓶頸所在。原因是語(yǔ)義十分復(fù)雜，而基于現(xiàn)有計(jì)算機(jī)軟硬件的自然語(yǔ)言處理要求語(yǔ)義形式化。解決這一問(wèn)題的根本之道是：探索新的句法標(biāo)注模型，進(jìn)行大規(guī)模的語(yǔ)義標(biāo)注，

3、基于語(yǔ)料庫(kù)進(jìn)行語(yǔ)義知識(shí)獲取和自然語(yǔ)言處理?！　　　∫?、句法標(biāo)注模型　　　　語(yǔ)言的復(fù)雜性在于語(yǔ)言與認(rèn)識(shí)的關(guān)系。語(yǔ)言具有意義，而意義是入對(duì)主客觀世界的認(rèn)識(shí)結(jié)果。主客觀世界的復(fù)雜性決定了意義的復(fù)雜性，進(jìn)一步?jīng)Q定了語(yǔ)言的復(fù)雜性。語(yǔ)言本身又可以視為人的主客觀世界中的一部分，因此語(yǔ)言研究是一種特殊的認(rèn)識(shí)活動(dòng)，是人對(duì)語(yǔ)言的認(rèn)識(shí)。.由此可見(jiàn)，語(yǔ)言離不開(kāi)認(rèn)識(shí)。人對(duì)主客觀世界的認(rèn)識(shí)可以如此描述：認(rèn)識(shí)主體借助認(rèn)識(shí)工具按照認(rèn)識(shí)方法處理認(rèn)識(shí)對(duì)象獲得認(rèn)識(shí)結(jié)果。認(rèn)識(shí)是由多種認(rèn)識(shí)因素(主體、工具、方法、對(duì)象)共同作用的活動(dòng)，認(rèn)識(shí)

4、結(jié)果是這一活動(dòng)的產(chǎn)物，被多種認(rèn)識(shí)因素共同決定，任何一種認(rèn)識(shí)因素的改變必然導(dǎo)致認(rèn)識(shí)結(jié)果出現(xiàn)或大或小的差異。顯然，認(rèn)識(shí)結(jié)果與認(rèn)識(shí)對(duì)象不能等同，是認(rèn)識(shí)主體對(duì)認(rèn)識(shí)對(duì)象的選擇性反映，認(rèn)識(shí)具有主觀能動(dòng)性。從這個(gè)意義上講。認(rèn)識(shí)不可能也不應(yīng)該去被動(dòng)地還原認(rèn)識(shí)對(duì)象，而是從符合主體目的性出發(fā)，力求簡(jiǎn)單有效地描述和預(yù)測(cè)認(rèn)識(shí)對(duì)象。借用模型的概念，認(rèn)識(shí)結(jié)果就是認(rèn)識(shí)對(duì)象的模型(model)，認(rèn)識(shí)就是建立認(rèn)識(shí)對(duì)象的模型，簡(jiǎn)稱(chēng)建模(modeling)。這是一種實(shí)用主義認(rèn)識(shí)觀?！　∧Ｐ鸵话惴譃樾睦砟Ｐ?psychologicalm

5、odel)、數(shù)學(xué)模型(mathematicalmodel)和物理模型(physicalmodel)。心理模型是認(rèn)識(shí)對(duì)象在人認(rèn)識(shí)中的定性關(guān)系，是數(shù)學(xué)模型的基礎(chǔ)；數(shù)學(xué)模型是認(rèn)識(shí)對(duì)象在人認(rèn)識(shí)中的定量關(guān)系，是物理模型的基礎(chǔ)；物理模型是人借助特定材料和工具按照認(rèn)識(shí)對(duì)象的數(shù)學(xué)模型實(shí)現(xiàn)的物質(zhì)結(jié)構(gòu)。傳統(tǒng)意義上的建模主要指建立數(shù)學(xué)模型和物理模型，一般意義上的建模還包括建立心理模型。人的認(rèn)識(shí)能力是有限的，表現(xiàn)在：人不能建立任意認(rèn)識(shí)對(duì)象的心理模型，也不能建立任意心理模型的數(shù)學(xué)模型，也不能建立任意數(shù)學(xué)模型的物理模型。由于

6、具有明確的實(shí)用主義特點(diǎn)，建模在理工科領(lǐng)域大行其道，在文科領(lǐng)域也逐漸受到青睞。人類(lèi)將二進(jìn)制數(shù)學(xué)模型成功實(shí)現(xiàn)為晶體管物理模型，并開(kāi)發(fā)出越來(lái)越復(fù)雜和先進(jìn)的計(jì)算機(jī)軟件和硬件，從而進(jìn)入信息時(shí)代。20世紀(jì)以來(lái)一些主要或次要的語(yǔ)言理論都或多或少應(yīng)用了數(shù)學(xué)模型，特別是一些面向語(yǔ)言計(jì)算的語(yǔ)言理論。隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展，人們對(duì)計(jì)算機(jī)自動(dòng)或輔助處理語(yǔ)言信息的需求越來(lái)越大。但計(jì)算機(jī)的根本缺陷在于，凡是不能建立數(shù)學(xué)模型的信息都無(wú)法處理。傳統(tǒng)語(yǔ)言理論往往只在心理模型層面定性研究，無(wú)法滿足這一需要。因此有必要引入數(shù)學(xué)模型研

7、究語(yǔ)言，稱(chēng)為語(yǔ)言數(shù)學(xué)模型，簡(jiǎn)稱(chēng)語(yǔ)言模型(1anguagemodel)。統(tǒng)計(jì)語(yǔ)言模型(sta-tisticallanguagemodel)就是一個(gè)成功的例子。但統(tǒng)計(jì)語(yǔ)言模型的性能取決于訓(xùn)練語(yǔ)料的規(guī)模和質(zhì)量。目前，由于語(yǔ)料的不斷積累和計(jì)算機(jī)技術(shù)的不斷進(jìn)步，語(yǔ)料規(guī)模已不成問(wèn)題，語(yǔ)料中包含語(yǔ)言知識(shí)的數(shù)量和質(zhì)量才是關(guān)鍵?！　∮?jì)算機(jī)的語(yǔ)言知識(shí)主要來(lái)源于人。將語(yǔ)料中包含的語(yǔ)言知識(shí)標(biāo)注出來(lái)，有助于計(jì)算機(jī)獲得更豐富、更有價(jià)值的語(yǔ)言知識(shí)，從而提高語(yǔ)言處理水平，這就是語(yǔ)料標(biāo)注(corpustagging)。一般認(rèn)為主要

8、包括詞匯標(biāo)注(1exicaltagging，分詞、詞結(jié)構(gòu)標(biāo)注、詞性標(biāo)注、詞義標(biāo)注等)、句法標(biāo)注(syntaxtagging，語(yǔ)法樹(shù)標(biāo)注、語(yǔ)義樹(shù)標(biāo)注等)、語(yǔ)篇標(biāo)注(discoursetagging，語(yǔ)體標(biāo)注、領(lǐng)域標(biāo)注等)等內(nèi)容。經(jīng)過(guò)標(biāo)注的語(yǔ)料還可以用于語(yǔ)言學(xué)研究、語(yǔ)言教學(xué)、語(yǔ)言測(cè)試、詞典編撰等諸多理論研究和實(shí)踐應(yīng)用領(lǐng)域，越來(lái)越受到人們重視，并形成一門(mén)新興學(xué)科——語(yǔ)料庫(kù)語(yǔ)言學(xué)(corpuslinguistics)。目前，相對(duì)句法標(biāo)注，詞匯標(biāo)注有更成熟的規(guī)范、準(zhǔn)確率更高的技術(shù)和更大的標(biāo)注

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 6



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件，查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常，文件下載后無(wú)此問(wèn)題，請(qǐng)放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤，付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。

關(guān)于新的句法標(biāo)注模型探索的論文

關(guān)于新的句法標(biāo)注模型探索的論文

相關(guān)文章

相關(guān)標(biāo)簽