資源描述:
《英語特殊句式的信息依存句法標注研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、重慶大學碩士學位論文英語特殊句式的信息依存句法標注研究姓名:于蕊申請學位級別:碩士專業(yè):外國語言學及應用語言學指導教師:李良炎20120528中文摘要摘要特殊旬式一直以來都是語言學研究領域的熱點和難點,對語料庫建設中的句法標注更是構成了很大的挑戰(zhàn)。句法標注的實質就是句法結構的形式化,需要用到相應的形式句法理論,目前主要采用短語結構語法理論和依存語法理論。從語料庫建設的現(xiàn)狀來看,這兩種理論形成了平分秋色的局面,說明各自仍然存在一定的優(yōu)勢和局限。隨著語料庫建設規(guī)模不斷擴大,對語料庫的應用需求逐漸提高,語料標注成
2、為語料庫語言學研究的核心問題,包括詞類標注、句法標注、語義標注和語篇標注。其中,詞類標注已經基本成熟,句法標注成為當前語料標注研究的重點和難點。信息依存語言模型(InformationDependencyLanguageModel,IDLM)是由李良炎(2009)提出的一種面向語料庫建設的句法標注理論,該理論借鑒了認知語法的概念自主.依存原理,整合了短語結構語法和依存語法的描寫方法,從句法和語義兩個方面對語言進行描寫和解釋。作為一種新的形式句法理論,在應用于語料庫建設之前,有必要結合具體語種進行充分的預研究
3、。本文將以該理論為工具,對英語句法標注過程中的熱點或難點問題——英語特殊句式進行分析,一方面驗證該理論應用于英語的可行性,另一方面初步形成英語特殊句式的標注規(guī)范,從而為大規(guī)模的英語句法標注奠定理論和知識基礎。全文共分五章。第一章介紹本研究的動機、意義、方法、研究對象以及論文的組織結構。第二章從語料庫建設、句法標注理論研究、英語特殊句式研究、英語特殊句式數(shù)據調查四個方面綜述研究現(xiàn)狀。第三章為本文的理論基礎,主要介紹信息依存語言模型的主要原理和標注方法,并結合對一個具體英語句式的句法標注過程予以說明。第四章以信
4、息依存語言模型為工具,對英語的幾種主要特殊句式(致使句式、使役句式、倒裝句式、現(xiàn)存句式、雙賓句式)進行系統(tǒng)地分析,包括旬式的研究綜述、真實語義分析、句法結構生成、語義語用解釋。第五章為本文的結論。研究發(fā)現(xiàn):1.幾種英語特殊句式主要應用了信息依存語言模型的省略、位移、合并等句素變換和句素組合操作,語用目的在于語用焦點的轉移,一些句式具有明顯的構式義:2.信息依存語言模型從真實語義出發(fā),在借鑒語言學研究成果的基礎上能夠較好的分析和解釋英語特殊句式,其標注結果具有可解釋性、可檢索性,能夠滿足語料庫建設的需要??傊?/p>
5、,信息依存語言模型一方面為語料庫句法標注提供了一套解決方案,一方面也為語言學研究提供了一種新的視角。對特殊句式的信息依存語言模型分析M.A.ThesisofChongqingUniversity是對語料庫句法標注規(guī)范和知識的完善與補充。通過對英語特殊句式的分析,可以探索一套應用于語料庫建設的英語特殊句式標注規(guī)范,作為語料庫建設的核心知識庫,為人工標注提供一套相對合理的規(guī)范和參考,還可以作為計算機自動標注程序實現(xiàn)的基礎。本研究作為語料庫建設的預研究,有助于克服句法標注難題,從而提高語料庫的建設和應用水平。關鍵
6、詞:英語特殊句式,信息依存語言模型,句法標注,語料庫建設IIABSTRACTSpecialsentencepatternisahotanddifficulttopicinlinguistics,andalsoachallengeforsyntactictaggingincorpusconstruction.Theessenceofsyntactictaggingistheformalizmionofsyntacticstructureinaccordancewiththecorrespondingforma
7、lsyntactictheories.Atpresent,twomajortheoriesPhraseStructureGrammar(PSG、)andDependencyGrammar(DG)areadoptedinsyntactictagginginequalproportionsandeachofthemarecharacterizedoftheirownadvantagesandlimitations.Withthecontinuousexpansionofcorporaandthegraduali
8、ncreasingrequirementsOncorpusapplication,corpusannotationemergesasthecoreissueincorpuslinguisticstudy.Itconsistsofpart。of-speech(POS)tagging,syntactictagging,semantictagginganddiscourseannotation,withinwhichP