中國英語學(xué)習(xí)者的語料庫CLEC 桂詩春 楊惠中

中國英語學(xué)習(xí)者的語料庫CLEC 桂詩春 楊惠中

ID:48338361

大?。?81.02 KB

頁數(shù):10頁

時間:2019-10-26

中國英語學(xué)習(xí)者的語料庫CLEC 桂詩春 楊惠中_第1頁
中國英語學(xué)習(xí)者的語料庫CLEC 桂詩春 楊惠中_第2頁
中國英語學(xué)習(xí)者的語料庫CLEC 桂詩春 楊惠中_第3頁
中國英語學(xué)習(xí)者的語料庫CLEC 桂詩春 楊惠中_第4頁
中國英語學(xué)習(xí)者的語料庫CLEC 桂詩春 楊惠中_第5頁
資源描述:

《中國英語學(xué)習(xí)者的語料庫CLEC 桂詩春 楊惠中》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫

1、中國英語學(xué)習(xí)者語料庫CLEC收集了包括中學(xué)生、大學(xué)英語4級和6級、專業(yè)英語低年級和高年級在內(nèi)的5種學(xué)生的語料一百多萬詞,并對言語失誤進行標注。其目的就是觀察各類學(xué)生的英語特征和言語失誤的情況,希望通過定量和定性的方法對中國學(xué)習(xí)者英語作出較為精確的描寫,為我國學(xué)生的英語教學(xué)提供有用的反饋信息。表1CLEC語料分布類型詞次ST2208088ST3209043ST4212855ST5214510ST6226106總計1070602??言語失誤標注原則?1.????????簡單合理,易于系統(tǒng)操作。參與標注的人比較多,分類表過于繁復(fù),就難于掌握。我們采取兩級分類,第一級有11類:詞形(fm)、動

2、詞短語(vp)、名詞短語(np)、代詞(pr)、形容詞短語(aj)、副詞(ad)、介詞短語(pp)、連詞(cj)、詞匯(wd)、搭配(cc)、句子(sn)。每一類里再用數(shù)目字細分。如[cc]為詞語搭配不當,[cc1]表示名詞和名詞的搭配,[cc2]表示名詞和動詞的搭配,[cc3]表示動詞和名詞的搭配,等等。?2.????????分類表的類別要適中。過粗容易統(tǒng)一,但信息太少,不利于分析學(xué)習(xí)者的失誤/過細難以統(tǒng)一,容易把同一種失誤歸到不同類別。目前我們采取的辦法是對常見的失誤從細(如vp和np都有9小類),對少見的失誤從粗(如cj只有兩小類)。現(xiàn)在的分類表有61個失誤碼,是屬于中等規(guī)模的分

3、類表。?3.?????提供足夠的失誤信息(失誤本身、失誤類型和失誤發(fā)生范圍)。例如Inthepast,peopleare[vp6,4-]kindtoeachother…,失誤用方括號表示,放在失誤之后。[vp6]Inthepast,peopleare[vp6,4-]kindtoeachother……,[vp6,4-]are為vp(動詞)第6種(時態(tài))失誤,4-為失誤發(fā)生的范圍,-表示失誤的位置,4表示失誤前有4個詞。要聯(lián)系這4個詞,才能判斷areare這個詞用錯了。?4.?????開放性。容許研究者根據(jù)需要對失誤類型進行補充或進一步再分出細類。例如[sn8]為句子結(jié)構(gòu)有缺陷,研究者可以

4、對這種失誤再分為若干細類來研究。這需要把sn8的失誤全部檢索出來,然后定出第三級的分類范疇,如sn81,sn82,等等。5.????????對語體或失誤的來由暫不作標注,因為這需要標注者較多的主觀判斷,更難以統(tǒng)一。言語失誤分類表(總數(shù):61)詞形動詞短語名詞短語代詞碼類型碼類型碼類型碼類型fm1Spellingvp1patternnp1patternpr1Referencefm2wordbuildingvp2setphrasenp2setphrasepr2anticipatoryitfm3capitalizationvp3agreementnp3agreementpr3Agreemen

5、t??vp4finite/non-finitenp4casepr4Case??vp5non-finitenp5countabilitypr5wh-??vp6tensenp6numberpr6Indefinite??vp7voicenp7article????vp8moodnp8quantifiers????vp9modal/auxiliarynp9otherdeterminers??形容詞短語副詞介詞短語連詞碼類型碼類型碼類型碼類型aj1patternad1orderpp1patterncj1patternaj2setphrasead2modificationpp2setphrasec

6、j2setphraseaj3degreead3degree????aj4-ed/-ingconfusion??????aj5predicative/attributive??????詞語搭配句子碼類型碼類型碼類型wd1ordercc1noun/nounsn1run-onsentencewd2partofspeechcc2noun/verbsn2sentencefragmentwd3substitutioncc3verb/nounsn3danglingmodifierwd4absencecc4adj/nounsn4illogicalcomparisonwd5redundancycc5ve

7、rb/advsn5topicprominencewd6repetitioncc6adv/adjsn6Coordinationwd7ambiguity??sn7Subordination????sn8structuraldeficiency????sn9Punctuation         標注說明碼分類類別說明fm1wordSpelling(拼寫)spelling,coinage,abbreviation,apostrophefm2wordw

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。