各種編碼的區(qū)別

各種編碼的區(qū)別

ID:32376745

大?。?8.74 KB

頁數(shù):8頁

時間:2019-02-03

各種編碼的區(qū)別_第1頁
各種編碼的區(qū)別_第2頁
各種編碼的區(qū)別_第3頁
各種編碼的區(qū)別_第4頁
各種編碼的區(qū)別_第5頁
資源描述:

《各種編碼的區(qū)別》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫

1、ASCII,UNICODE,UTF8,BIG5,GB2312,GBK,GB18030等幾種常用編碼區(qū)別?????最近老為編碼問題而煩燥,下定決心一定要將其弄明白!本文主要總結(jié)網(wǎng)上一些朋友提供的ascii,ISO-8859-1,unicode,utf8,gb2312,big5,gbk,gb18030等幾種常區(qū)別.????1.ASCII碼????目前計(jì)算機(jī)中用得最廣泛的字符集及其編碼,是由美國國家標(biāo)準(zhǔn)局(ANSI)制定的ASCII碼(AmericanStandardCodeforInformationIntercha

2、nge,美國標(biāo)準(zhǔn)信息交換碼),它已被國際標(biāo)準(zhǔn)化組織(ISO)定為國際標(biāo)準(zhǔn),稱為ISO646標(biāo)準(zhǔn)。適用于所有拉丁文字字母,ASCII碼有7位碼和8位碼兩種形式。????我們知道,在計(jì)算機(jī)內(nèi)部,所有的信息最終都表示為一個二進(jìn)制的字符串。每一個二進(jìn)制位(bit)有0和1兩種狀態(tài),因此八個二進(jìn)制位就可以組合出256種狀態(tài),這被稱為一個字節(jié)(byte)。也就是說,一個字節(jié)一共可以用來表示256種不同的狀態(tài),每一個狀態(tài)對應(yīng)一個符號,就是256個符號,從0000000到11111111。ASCII表ASCII值控制字符ASCI

3、I值控制字符ASCII值控制字符ASCII值控制字符0NUL32(space)64@96、1SOH33!65A97a2STX34”66B98b3ETX35#67C99c4EOT36$68D100d5ENQ37%69E101e6ACK38&70F102f7BEL39,71G103g8BS40(72H104h9HT41)73I105i10LF42*74J106j11VT43+75K107k12FF44,76L108l13CR45-77M109m14SO46.78N110n15SI47/79O111o16DLE4808

4、0P112p17DCI49181Q113q18DC250282R114r19DC351383X115s20DC452484T116t21NAK53585U117u22SYN54686V118v23TB55787W119w24CAN56888X120x25EM57989Y121y26SUB58:90Z122z27ESC59;91[123{28FS60

5、29GS61=93]125}30RS62>?94^126~31US63?95—127DELNUL空字符(Null)VT垂直制表SYN空轉(zhuǎn)同步SOH?標(biāo)

6、題開始FF??走紙控制ETB?信息組傳送結(jié)束STX?正文開始CR??回車CAN?作廢ETX?正文結(jié)束SO??移位輸出EM??紙盡EOY?傳輸結(jié)束SI???移位輸入SUB?換置ENQ?詢問字符DLE?空格ESC?換碼ACK?承認(rèn)DC1?設(shè)備控制1FS??文字分隔符BEL?報(bào)警DC2?設(shè)備控制2GS??組分隔符BS??退一格DC3?設(shè)備控制3RS??記錄分隔符HT??橫向列表DC4?設(shè)備控制4US??單元分隔符LF??換行NAK?否定DEL?刪除英語用128個符號編碼就夠了,但是用來表示其他語言,128個符號是不夠的

7、。比如,在法語中,字母上方有注音符號,它就無法用ASCII碼表示。于是,一些歐洲國家就決定,利用字節(jié)中閑置的最高位編入新的符號。比如,法語中的é的編碼為130(二進(jìn)制10000010)。這樣一來,這些歐洲國家使用的編碼體系,可以表示最多256個符號。但是,這里又出現(xiàn)了新的問題。不同的國家有不同的字母,因此,哪怕它們都使用256個符號的編碼方式,代表的字母卻不一樣。比如,130在法語編碼中代表了é,在希伯來語編碼中卻代表了字母Gimel(?),在俄語編碼中又會代表另一個符號。但是不管怎樣,所有這些編碼方式中,0—1

8、27表示的符號是一樣的,不一樣的只是128—255的這一段,所以出現(xiàn)后面的統(tǒng)一編碼方式。注:若想得到更詳細(xì)的參見http://ascii.911cha.com/2、各地的方言在中國,大陸最常用的就是GBK18030編碼,除此之外還有GBK,GB2312,這幾個編碼的關(guān)系是這樣的。字符必須編碼后才能被計(jì)算機(jī)處理。計(jì)算機(jī)使用的缺省編碼方式就是計(jì)算機(jī)的內(nèi)碼。早期的計(jì)算機(jī)使用7位的ASCII編碼,但為了處理漢字,又設(shè)計(jì)出用于簡體中文的GB2312和用于繁體中文的big5。GB2312(1980年)一共收錄了7445個字符

9、,包括6763個漢字和682個其它符號。漢字區(qū)的內(nèi)碼范圍高字節(jié)從B0-F7,低字節(jié)從A1-FE,占用的碼位是72*94=6768。其中有5個空位是D7FA-D7FE。GB2312支持的漢字太少。1995年的漢字?jǐn)U展規(guī)范GBK1.0收錄了21886個符號,它分為漢字區(qū)和圖形符號區(qū)。漢字區(qū)包括21003個字符。從ASCII、GB2312到GBK,這些編碼方法是向下兼容的,即同

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。