漢字‘身份證’雜談、趣談-‘語委身份證’及‘標(biāo)準(zhǔn)身份證’

漢字‘身份證’雜談、趣談-‘語委身份證’及‘標(biāo)準(zhǔn)身份證’

ID:9047056

大?。?4.00 KB

頁數(shù):3頁

時間:2018-04-15

漢字‘身份證’雜談、趣談-‘語委身份證’及‘標(biāo)準(zhǔn)身份證’_第1頁
漢字‘身份證’雜談、趣談-‘語委身份證’及‘標(biāo)準(zhǔn)身份證’_第2頁
漢字‘身份證’雜談、趣談-‘語委身份證’及‘標(biāo)準(zhǔn)身份證’_第3頁
資源描述:

《漢字‘身份證’雜談、趣談-‘語委身份證’及‘標(biāo)準(zhǔn)身份證’》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫

1、漢字‘身份證’雜談、趣談(二)----‘語委身份證’及‘標(biāo)準(zhǔn)身份證’兩種‘身份證’的比較(即《字表》與《編碼標(biāo)準(zhǔn)》的比較)乙:那么,漢字身份證問題,應(yīng)該如何理解,如何處理?新時期漢字的‘身份證’到底什么意思呀?甲:現(xiàn)在如果從實際出發(fā),應(yīng)該承認(rèn)有兩種‘身份證’:一種是‘語委身份證’;另一種是‘標(biāo)準(zhǔn)身份證’。兩種身份證有嚴(yán)重打架現(xiàn)象。語委身份證,是以國家語委的法規(guī)為依據(jù)判定。那些異體字直到2003年《字表》發(fā)布才獲得語委身份證。而按漢字編碼技術(shù)標(biāo)準(zhǔn)看,1993年就獲得了標(biāo)準(zhǔn)身份證。對于繁體字,1993年也獲得了‘標(biāo)準(zhǔn)身份證’,而國家語委至今還是扣發(fā)著繁體字的‘語委身份證’

2、,王組長更是明確地把繁體字稱為“不規(guī)范字”;這就像是給繁體字脖子上掛上一塊‘走資派’的牌子一樣。這是同一個國家、兩個部門在打架。乙:看來,收進(jìn)《字表》,就算有了‘語委身份證’了。那‘標(biāo)準(zhǔn)身份證’的判據(jù)是什么?甲:電腦時代,有‘標(biāo)準(zhǔn)身份證’應(yīng)該是指‘能夠在網(wǎng)絡(luò)上為廣大海內(nèi)外漢字用戶使用’,顯然地,這個‘使用’是通過‘電腦’及/或‘網(wǎng)絡(luò)’的‘使用’。一個漢字能夠做到這一點,僅僅要求它是漢字編碼標(biāo)準(zhǔn)字符集里的成員。具體些說:它具備如下5條:①被收入標(biāo)準(zhǔn)化的編碼字符集。②在漢字編碼表里獲得一個位置,或得到一個屬于它的二進(jìn)制代碼。這種編碼字符集結(jié)構(gòu)越來越復(fù)雜。③給出它的字形信息

3、,包括一般至少四種字體(宋、仿、隸、楷),每一種字體的數(shù)十種字號(如初號、一號、......五號、小五號、六號、...)的不同點陣精度的(15*16、24*24、...128*128、...256*256...)點陣字形信息。④有多種漢字輸入法給出了每個漢字的輸入代碼,及大量涉及該字的詞匯、短語的輸入代碼。⑤有相應(yīng)的操作系統(tǒng)及文字處理軟件。特別是前四款,必須對每一個漢字單獨給出。從這五個條件看:1993年,這些異體字僅僅解決了①、②、③;到1995年五條都具備。而國家語委給予的僅僅是①。以上五款中的每一項(也可以不妨除去①)都包含著大量、繁雜的技術(shù)工作。就說第②款吧。

4、對于最早、最簡單的漢字基本集來說,它收漢字6763個。其中每個用兩個字節(jié)(兩個8位二進(jìn)制數(shù)碼)表達(dá)。整個基本集用一張94*94的表格表示。對于GBK1和GBK2來說,即使用雙字節(jié)編碼,也使用四字節(jié)編碼。其編碼表結(jié)構(gòu)復(fù)雜得多。下面圖表是解說編碼結(jié)構(gòu)時通常需要引用的。對于理工科大學(xué)生,講解這個結(jié)構(gòu)圖表也需化不少時間那。GB18030-2000碼位總體結(jié)構(gòu)圖GB18030-2000漢字  如下表所示,GB18030-2000收錄了27533個漢字:  類別碼位范圍碼位數(shù)字符數(shù)字符類型雙字節(jié)部分第一字節(jié)0xB0-0xF7第二字節(jié)0xA1-0xFE67686763漢字第一字節(jié)0

5、x81-0xA0第二字節(jié)0x40-0xFE60806080漢字第一字節(jié)0xAA-0xFE第二字節(jié)0x40-0xA081608160漢字四字節(jié)部分第一字節(jié)0x81-0x82第二字節(jié)0x30-0x39第三字節(jié)0x81-0xFE第四字節(jié)0x30-0x3965306530CJK統(tǒng)一漢字?jǐn)U充A  (注:此處CJK表示中日韓)乙:看來,編碼字符集結(jié)構(gòu)是越來越復(fù)雜了。甲:是的。再說③,漢字的字形信息。它至少包括四種字體(宋、仿、隸、楷)、數(shù)十種字號的點陣字形信息,還包括不同精度(如:16*16,24*24,48*48,....,256*256等等)。這里,還有許多技術(shù)問題,如字形的

6、曲線輪廓表達(dá)。對一種字體,只需要一個中低規(guī)模儲存量的曲線表達(dá),就能夠自動、快速生成各種精度的點陣字形信息。乙:我知道,漢字字庫工作量極大,新技術(shù)也多。已經(jīng)是一項產(chǎn)業(yè)了。甲:最后說④,多種漢字輸入法。每個都要給出每個漢字的輸入代碼,以及相關(guān)詞語的智能化輸入設(shè)計。以上的②、③、④、⑤,是國家語委的《字表》里都沒有的。就27484個漢字而言,其五款(①—⑤),和簡單的8105個字的《字表》的僅僅①的工作量比較,大上幾百倍幾千倍恐怕都不只。由于有①—⑤款,編碼字符集里的字,才能夠使我們與五湖四海的人網(wǎng)絡(luò)溝通。如果沒有《標(biāo)準(zhǔn)身份證》,而只有《語委身份證》(只有①),那我們都得退

7、回到鉛字時代,退回到四碼電報時代。《語委身份證》僅僅相當(dāng)于《標(biāo)準(zhǔn)身份證》里的①款。乙:能否再簡要些總結(jié)一下《字表》與《編碼標(biāo)準(zhǔn)》的基本差異?甲:《字表》是機(jī)械化時代,鉛字時代漢字規(guī)范的主要方式,也幾乎是唯一方式。它主要是針對人,針對使用漢字的人。通過對漢字使用者的教育、管理,實現(xiàn)對漢字的規(guī)范;它并不能直接控制、指揮最終的漢字設(shè)備。而《編碼標(biāo)準(zhǔn)》則是電腦時代的產(chǎn)物。它是新時代漢字規(guī)范的最重要、最有效、最強(qiáng)大的手段。它即針對‘人’(漢字使用者),也針對、或者更針對‘設(shè)備及系統(tǒng)’。它能夠直接地管理、控制最終的漢字設(shè)備,如打字機(jī)、打印機(jī)、復(fù)印機(jī)、....。它

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。