信息技術(shù)傳統(tǒng)蒙古文詞語語義分類體系及其標記集

信息技術(shù)傳統(tǒng)蒙古文詞語語義分類體系及其標記集

ID:32360561

大?。?30.16 KB

頁數(shù):21頁

時間:2019-02-03

信息技術(shù)傳統(tǒng)蒙古文詞語語義分類體系及其標記集_第1頁
信息技術(shù)傳統(tǒng)蒙古文詞語語義分類體系及其標記集_第2頁
信息技術(shù)傳統(tǒng)蒙古文詞語語義分類體系及其標記集_第3頁
信息技術(shù)傳統(tǒng)蒙古文詞語語義分類體系及其標記集_第4頁
信息技術(shù)傳統(tǒng)蒙古文詞語語義分類體系及其標記集_第5頁
資源描述:

《信息技術(shù)傳統(tǒng)蒙古文詞語語義分類體系及其標記集》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。

1、蒙古語言文字數(shù)字資源建設與共享工程信息處理用蒙古文相關(guān)標準MGC/01‐05?信息技術(shù)傳統(tǒng)蒙古文詞語語義分類體系及其標記集Informationtechnology—SemanticclassificationofMongolianwordsandexpressionmarksset內(nèi)蒙古自治區(qū)民族事務委員會內(nèi)蒙古大學2016年11月前言本標準是消化和吸收語義分類規(guī)范標準、語義自動分析、生成和計算等思想的基礎(chǔ)上,依據(jù)《面向信息處理的蒙古語動詞語義研究》(內(nèi)蒙古出版集團內(nèi)蒙古人民出版社,2009年)、《面向信息處理的蒙古語名詞語義研究》(內(nèi)蒙古出版集團內(nèi)蒙古人民出版社,2

2、015年)等學術(shù)著作為基礎(chǔ),以《蒙古語詞典》(1997年)、《蒙漢詞典》(1999年)、《蒙古語語法信息詞典》(內(nèi)蒙古大學蒙古學學院)、《蒙古語語義信息詞典》(內(nèi)蒙古大學蒙古學學院)等作為資源來源,運用語義場理論(Theory?of?Semantic?Field)、義素分析法(Sememe?Analysis),根據(jù)蒙古語詞語基本詞匯意義(本體概念意義),信息處理用語義知識的視角對于蒙古語常用詞語詞義進行分類,在更大層次上把眾多的具有相同或相近語義歸為一個語義場,以便在同一語義場中綜合考察和刻畫詞語語義單位,涵蓋蒙古語三大“開放性”詞類—名詞、動詞和形容詞,規(guī)定了信息處理

3、用蒙古文詞語語義分類標記集。本標準由內(nèi)蒙古自治區(qū)民族事務委員會提出。本標準是2016年內(nèi)蒙古自治區(qū)蒙古語言文字數(shù)字資源建設與共享工程項目“信息處理用蒙古文相關(guān)標準”(第一包)(編號NZC2016‐A03‐8)的科研成果。本標準起草單位:內(nèi)蒙古大學本標準起草人:海銀花、額爾敦朝魯、那順烏日圖、吳金星、麗麗、斯欽圖。‐?1?‐?信息技術(shù)傳統(tǒng)蒙古文詞語語義分類體系及其標記集1范圍本標準規(guī)定了信息處理用蒙古文詞語語義分類標記集,包括蒙古語名詞、形容詞和動詞詞語及其語文現(xiàn)象或詞義分類單位的標記符號。本標準適用于蒙古文的各種語料庫、詞匯集-詞典、語文知識庫等。2術(shù)語和定義下列術(shù)語和

4、定義適用于本標準。2.1蒙古文信息處理Mongolianinformationprocessing用計算機對蒙古文形、音、義等信息進行輸入、排序、存儲、輸出、統(tǒng)計、提取等。2.2標記單位taggingunit蒙古文信息處理中使用的詞匯、詞法、正字法、語義及其他單位,如單詞、復合詞、固定詞、習用語、成語、縮略語、熟語、構(gòu)形附加成分、連接元音、字母、數(shù)字、標點符號等,這里重點標明蒙古語語義分類及其相關(guān)標記單位。2.3語義分類semanticclassification指根據(jù)蒙古語詞語最基本的詞匯意義即概念意義,對其進行分類和歸類,反映其共性和個性,最終獲取語義系統(tǒng)。關(guān)于事物

5、本體的語義主要牽涉到名詞,關(guān)于行為和狀態(tài)的語義主要牽涉到動詞,關(guān)于屬性的語義主要牽涉到形容詞。這樣一來,本體、行為和屬性的語義特征分類便同名詞、動詞和形容詞的分類對應,構(gòu)成一個完整的系統(tǒng)。2.4語義場semanticfield(又叫l(wèi)exicalfielddomain)是由具有某些共同語義特征的一群詞類聚而成的場。如蒙古語中表示親屬關(guān)系的名詞:父親、母親、哥哥、弟弟、姐姐、叔叔、阿姨等都有一個共同的義素[+親屬],便組成了語義場中的“親屬場”(kindshipfield);形容詞包括像“ulagan”(紅色)、“xar_a”(黑色)、“?agan”(白色)、“nogog

6、an”(綠色)等這樣區(qū)分顏色的詞語形成“顏色場”。語義場的主要特點是層次性和系統(tǒng)性。2.4.1上下位關(guān)系hyponymyrelation大的分類場之下嵌套著小的分類場,下位分類場被領(lǐng)屬于上位分類場,處于中間層次的詞義,既是其上位的分類,又是其下位的領(lǐng)域,它們相互之間構(gòu)成上下位關(guān)系。例如名詞“bodadobodas”(具體物)可分為“amidubodas”(有生命物)和“amigüybodas”(無生命物)2個子類,繼而把“amidubodas”(有生命物)可分為“x?m?n”(人)、“amitan”(動物)、“urgumal”(植物)等3個子類;從而產(chǎn)生具體物-有生命物

7、-人、動物、植物等上下位關(guān)系。2.4.2繼承關(guān)系successionrelation上下位關(guān)系中,下位詞義繼承了上位的基本義素。如“x?m?n”(人)、“amitan”(動物)、“urgumal”(植物)等下位繼承其上位“amidubodas”(有生命物)的基本義素。‐?2?‐?2.4.3嵌套關(guān)系nestingrelation大的分類場之下嵌套著小的子分類場,大的構(gòu)件場之下嵌套著小的構(gòu)件場。如同上述“有生物”場之間嵌套的小的分類場“人”、“動物”和“植物”場,“動物”場之下嵌套著更小的“野生動物”、“水性動物”、“鳥類”等子分類場。2.4

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。