資源描述:
《單擊此處輸入中文題名(不超過(guò)20》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、06’第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)語(yǔ)料庫(kù)中的插入語(yǔ)標(biāo)注研究12安娜,侯敏(1.中國(guó)傳媒大學(xué),北京100024;2。中國(guó)傳媒大學(xué),北京100024)摘要:本文通過(guò)對(duì)“傳媒語(yǔ)言語(yǔ)料庫(kù)”和部分人民日?qǐng)?bào)語(yǔ)料中包含的插入語(yǔ)的分析,比較全面地考察了漢語(yǔ)插入語(yǔ)的使用情況,并試圖按語(yǔ)義類型和語(yǔ)用功能將插入語(yǔ)進(jìn)行分類,歸納出漢語(yǔ)插入語(yǔ)的主要特點(diǎn),在此基礎(chǔ)上從話語(yǔ)分析的角度確立了話語(yǔ)標(biāo)記集來(lái)標(biāo)注插入語(yǔ)。關(guān)鍵詞:插入語(yǔ);標(biāo)注;話語(yǔ)標(biāo)記集ResearchontaggingtheParenthesisincorpus12AnNa,HouMin(1.CommunicationUniver
2、sityofChina,Beijing100024;2.CommunicationUniversityofChina,Beijing100024)Abstract:ThroughanalyzingtheparenthesisinCorpus,weknewtheusageofChineseparenthesiscompletely.Moreover,parenthesisareclassifiedaccordingtotheirpragmaticfunctions.Weconcludedthepragmaticfeaturesoftheseparenthesi
3、s.Basedonthetheoryofdiscourseanalysis,wesetupapragmaticannotationmanualforparenthesissothattheirpragmaticfunctionscanbereflected.Keywords:parenthesis,tagging,annotationmanual1.引言在加工生語(yǔ)料時(shí),通行的做法是使用分詞標(biāo)注工具對(duì)原始語(yǔ)料進(jìn)行標(biāo)注。我們采用的是由中國(guó)傳媒大學(xué)應(yīng)用語(yǔ)言學(xué)系改進(jìn)后的北大的分詞標(biāo)注系統(tǒng)。在對(duì)加工后的熟語(yǔ)料進(jìn)行校對(duì)時(shí),我們發(fā)現(xiàn)目前的插入語(yǔ)標(biāo)記存在一定的問(wèn)題。插入語(yǔ)的
4、組成比較復(fù)雜,有作者簡(jiǎn)介:安娜(1979-),女,山東青島,在讀博士E-mail.yunxiner07@cuc.edu.cn106’第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)些是詞,有些是詞的組合。對(duì)由詞充當(dāng)?shù)牟迦胝Z(yǔ),北大的分詞標(biāo)注系統(tǒng)把它當(dāng)作一個(gè)詞匯單位來(lái)處理,只在句法層面上給插入語(yǔ)一個(gè)詞性標(biāo)記,如“據(jù)說(shuō)/v”。對(duì)那些由詞的組合充當(dāng)?shù)牟迦胝Z(yǔ),北大的分詞系統(tǒng)對(duì)每一個(gè)組成成分進(jìn)行了詞性標(biāo)注,如“按/v道理/n”。我們認(rèn)為插入語(yǔ)是在語(yǔ)用平面上需要研究的內(nèi)容,應(yīng)該根據(jù)我們的研究目的來(lái)決定是否要在詞性標(biāo)注階段給插入語(yǔ)一個(gè)詞性標(biāo)記。我們認(rèn)為,插入語(yǔ)可以存在于句法分析之外,它們是不充當(dāng)
5、句法成分的,提供的只是語(yǔ)用層面的程序信息,而并不是句法層面的概念信息,對(duì)話語(yǔ)命題的真假不產(chǎn)生影響,在話語(yǔ)中的作用主要是語(yǔ)用的而非句法的。因此,在我們進(jìn)行分詞標(biāo)注的過(guò)程中,主張不考慮插入語(yǔ)的詞性標(biāo)記,只給出特定的語(yǔ)用標(biāo)記就可以。但究竟給插入語(yǔ)詞性標(biāo)記還是語(yǔ)用標(biāo)記最終還是由分詞目的決定的。自然語(yǔ)言十分復(fù)雜,大規(guī)模真實(shí)文本在處理時(shí)存在的噪聲很多,想得到一棵完整的句法樹很困難。其中,插入語(yǔ)也屬于畫樹時(shí)的噪聲之一。插入語(yǔ)的構(gòu)成非常復(fù)雜,在句法分析的過(guò)程中我們很難為它在句法樹中找出一個(gè)合理的句法位置。因此,我們認(rèn)為在句法分析的層面可以把插入語(yǔ)排除在句法分析的內(nèi)容之外,這
6、也可以作為剔除文本噪聲的一種手段。2.插入語(yǔ)的研究插入語(yǔ)是獨(dú)立語(yǔ)中的一種。在獨(dú)立語(yǔ)研究領(lǐng)域中,由于研究的出發(fā)點(diǎn)和側(cè)重點(diǎn)不同,出現(xiàn)了各種名稱,如:獨(dú)立成分、獨(dú)立語(yǔ)、插說(shuō)等等(本文研究的“插入語(yǔ)”只是獨(dú)立語(yǔ)的一個(gè)組成部分)。以往的研究成果主要集中在獨(dú)立語(yǔ)的性質(zhì)、獨(dú)立語(yǔ)的語(yǔ)義分類、獨(dú)立語(yǔ)的功能這三方面。由于插入語(yǔ)是獨(dú)立語(yǔ)的下位分類,因此插入語(yǔ)繼承了獨(dú)立語(yǔ)的大部分性質(zhì)。2.1插入語(yǔ)的性質(zhì)關(guān)于插入語(yǔ)的性質(zhì),語(yǔ)言學(xué)家們基本認(rèn)為插入語(yǔ)是句子中的特殊成分。如:1)句子中有一些詞語(yǔ),不同別的成分發(fā)生結(jié)構(gòu)關(guān)系,位置一般比較靈活。(胡裕樹)2)句子中的某個(gè)實(shí)詞或短語(yǔ),跟它前后別的
7、詞語(yǔ)沒(méi)有結(jié)構(gòu)關(guān)系,但又是句意上所必需的成分。(黃伯榮)3)獨(dú)立成分雖然不同別的成分發(fā)生結(jié)構(gòu)關(guān)系,但跟整個(gè)句子還是有聯(lián)系的,因此我們同意把他叫做獨(dú)立成分,算作特殊的句子成分。(張靜)4)獨(dú)立語(yǔ)是地位獨(dú)特、位置靈活的成分。這是一種語(yǔ)用成分,也叫獨(dú)立成分。(邢福義)5)插說(shuō)是句子平面上的一種現(xiàn)象,就是把一個(gè)完整的結(jié)構(gòu)切開,當(dāng)中插入一個(gè)與前后都不發(fā)生結(jié)構(gòu)關(guān)系的詞語(yǔ)。(《現(xiàn)代漢語(yǔ)》北大版)6)插說(shuō)也叫插入語(yǔ),是句子中比較特殊的成分。不是句子的成分,也不跟句中各個(gè)成分發(fā)生結(jié)構(gòu)上的關(guān)系,也不表示語(yǔ)氣。插說(shuō)可在句首、句中或句末。(劉月華等)7)在句子里插入一個(gè)成分,它不作主
8、語(yǔ)、謂語(yǔ)、賓語(yǔ)、補(bǔ)語(yǔ)、定語(yǔ)、狀語(yǔ),同時(shí)既不起連接作用