資源描述:
《GBT26235-2010 信息技術(shù) 信息處理用蒙古文詞語標(biāo)記.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、ICS35.040L71圓亙中華人民共和國國家標(biāo)準(zhǔn)GB/T26235--2010信息技術(shù)信息處理用蒙古文詞語標(biāo)記Informationtechnology--Mongolianwordandexpressionmarksforinformationprocessing2011—01-14發(fā)布2011-05-01實施宰瞀鸛鬻瓣警糌瞥星發(fā)布中國國家標(biāo)準(zhǔn)化管理委員會促19前言?????????1范圍???????·2術(shù)語和定義?·???3標(biāo)記的范圍???····4標(biāo)記的級別及命名方法5詞語標(biāo)記代碼???·目次GB/T2
2、6235--2010刖罱GB/T26235--2010本標(biāo)準(zhǔn)是依據(jù)《現(xiàn)代蒙古語}(1964)等語法著作為基礎(chǔ),規(guī)定了信息處理用的蒙古文詞語標(biāo)記。本標(biāo)準(zhǔn)由全國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會提出并歸口。本標(biāo)準(zhǔn)起草單位:中國電子技術(shù)標(biāo)準(zhǔn)化研究所、內(nèi)蒙古大學(xué)、內(nèi)蒙古師范大學(xué)、內(nèi)蒙古教育出版社、內(nèi)蒙古自治區(qū)蒙古語文工作委員會、北京北大方正電子有限公司、濰坊北大青鳥華光照排有限公司。本標(biāo)準(zhǔn)起草人:那順烏日圖、何正安、青格樂圖、確精扎布、六十三、淑琴、賀喜格都仁、唐英敏、呂建春、阿榮塔娜。Ⅲ信息技術(shù)信息處理用蒙古文詞語標(biāo)記GB/T2
3、6235--20101范圍本標(biāo)準(zhǔn)規(guī)定了信息處理用蒙古文詞語標(biāo)記,只包括某種語文現(xiàn)象或單位的標(biāo)記符號。本標(biāo)準(zhǔn)適用于蒙古文的各種語料庫、詞匯集~詞典、語文知識庫等。2術(shù)語和定義下列術(shù)語和定義適用于本標(biāo)準(zhǔn)。2.1蒙古文信息處理Mongolianinformationprocessing用計算機對蒙古文形、音、義等信息進行輸入、排序、存儲、輸出、統(tǒng)計、提取等。2.2標(biāo)記單位taggingunit蒙古文信息處理中使用的詞匯、詞法、正字法及其他單位,如單詞、復(fù)合詞、固定詞、習(xí)用語、成語、縮略語、構(gòu)形附加成分、連接元音、字母、
4、數(shù)字、標(biāo)點符號等。2.3詞類wordclass詞的語法分類,根據(jù)詞法形態(tài)、句法功能、語義特征劃分出來的類。2.4不確定詞ambiguousword無法確定詞性的詞或詞素,包括:a)無法確定詞性的同形兼類詞(如沒有上下文環(huán)境的形式);b)不能單獨使用的復(fù)合詞成分,如fiy(ilyolan),tomsi(tog—atomsifigey),say(gajarsayfigey),xu(XUluubang);c)形容詞最高級形式:ub(ubulagan),xab(xabxar—a)等。2.5復(fù)合詞compoundword由
5、兩個實詞(有時也包括輔助意義的詞)組成,語法和詞匯上都構(gòu)成一個單位的固定短語。2.6固定詞fixedword由一個實詞和一個虛詞組成,連用成型且未轉(zhuǎn)義的固定短語。2.7習(xí)用語habitualusage由一個轉(zhuǎn)義形容詞和一個實詞組成,主謂結(jié)構(gòu)且表達一個詞匯意義的固定短語。2.8成語idiom由3個或3個以上詞組成,充當(dāng)一個句子成分的固定短語。2.9縮略語abbreviation專有名詞或常用語的簡略形式?!縂B/T26235--20102.10構(gòu)形附加成分morphologicalforms只增加語法意義的詞法形態(tài)
6、。2.11連接元音connectivevowel輔音結(jié)尾的詞干后,加接以“S,G,N,M,R,L,Y”輔音開頭的附加成分時,詞干后增加的元音或音節(jié)。2.12標(biāo)記tag對文本中標(biāo)記單位的類別進行標(biāo)注的代碼。3標(biāo)記的范圍本標(biāo)準(zhǔn)包括詞類、復(fù)合詞、固定詞、習(xí)用語、成語、縮略語、構(gòu)形附加成分、連接元音、字母、數(shù)字、標(biāo)點符號等的標(biāo)記。4標(biāo)記的級別及命名方法4.1第一級標(biāo)記的命名方法用大寫英文字母標(biāo)記第一級。如:A(來自adjective):形容詞S(來自sula):語氣詞4.2第二級標(biāo)記的命名方法用小寫英文字母標(biāo)記第二級。如
7、:Qn(來自noun):名量詞Qc(來自Lag):時間量詞Qv(來自verb):動量詞4.3第三級標(biāo)記的命名方法用數(shù)字標(biāo)記第三級。如:Fa0:形容詞級附加成分的原級Fal:形容詞級附加成分的比較級4.4第四級標(biāo)記的命名方法用數(shù)字標(biāo)記第四級。如:Fall:形容詞級附加成分的比較級1Fal2:形容詞級附加成分的比較級25詞語標(biāo)記代碼本詞語標(biāo)記代碼分為詞類標(biāo)記代碼、構(gòu)形附加成分標(biāo)記代碼、其他標(biāo)記代碼。以下是詞語標(biāo)記內(nèi)容。注:表中右上角的數(shù)字表示該項所包含的附加成分或連接元音數(shù)n代表與詞干分寫的附加成分...:代表任意成
8、分。為了簡化分類,將。動態(tài)詞尾”放在“連接元音”部分。5.1詞類標(biāo)記代碼詞類標(biāo)記代碼見表1。2表1詞類標(biāo)記代碼GB/T26235--2010標(biāo)記代碼序號語文現(xiàn)象/單位詞類名稱代碼說明第一級第二級第三級lN名詞2Ne普通名詞eng3siregeNel可數(shù)名詞4Ne2不可數(shù)名詞5Nt專有名詞6batusiixeNtl人名7Nt2地名86bormonggol—ilnyexesu