字符集與編碼

字符集與編碼

ID:44917671

大小:18.00 KB

頁數(shù):4頁

時間:2019-11-05

字符集與編碼_第1頁
字符集與編碼_第2頁
字符集與編碼_第3頁
字符集與編碼_第4頁
資源描述:

《字符集與編碼》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫

1、字符集與編碼一.字符集與編碼之間的關(guān)系1.為了在計算機(jī)中存儲與處理,必須對字符進(jìn)行數(shù)字化編碼。2.字符集規(guī)定了包含哪些字符,每個字符的值是什么3.編碼規(guī)定了對于這些值,如何存儲4.有些標(biāo)準(zhǔn)同時規(guī)定了字符集及其編碼如:目前使用最廣泛的西文字符集及其編碼是ASCII字符集和ASCII碼(ASCII是AmericanStandardCodeforInformationInterchange的縮寫),它同時也被國際標(biāo)準(zhǔn)化組織(InternationalOrganizationforStandardization,ISO)批準(zhǔn)為國際標(biāo)準(zhǔn)5.有些

2、標(biāo)準(zhǔn)同一個字符集可以有多種編碼格式二.字符集及編碼1.SBCS(singlebytecharacterset)1.1ASCII(1).7位編碼,范圍0x00-0x7F(2).碼值32-127(0x20-0x7F)(3).0x00-0x1F之間的為控制字符,每個字符有一個縮寫的名字(4).數(shù)字,大寫字母,小寫字母的編碼都是連續(xù)的 目前使用最廣泛的西文字符集及其編碼是ASCII字符集和ASCII碼(ASCII是AmericanStandardCodeforInformationInterchange的縮寫),它同時也被國際標(biāo)準(zhǔn)化組織(In

3、ternationalOrganizationforStandardization,ISO)批準(zhǔn)為國際標(biāo)準(zhǔn)?! 』镜腁SCII字符集共有128個字符,其中有96個可打印字符,包括常用的字母、數(shù)字、標(biāo)點符號等,另外還有32個控制字符。標(biāo)準(zhǔn)ASCII碼使用7個二進(jìn)位對字符進(jìn)行編碼,對應(yīng)的ISO標(biāo)準(zhǔn)為ISO646標(biāo)準(zhǔn)。下表展示了基本ASCII字符集及其編碼:  字母和數(shù)字的ASCII碼的記憶是非常簡單的。我們只要記住了一個字母或數(shù)字的ASCII碼(例如記住A為65,0的ASCII碼為48),知道相應(yīng)的大小寫字母之間差32,就可以推算出其余

4、字母、數(shù)字的ASCII碼?! ‰m然標(biāo)準(zhǔn)ASCII碼是7位編碼,但由于計算機(jī)基本處理單位為字節(jié)(1byte=8bit),所以一般仍以一個字節(jié)來存放一個ASCII字符。每一個字節(jié)中多余出來的一位(最高位)在計算機(jī)內(nèi)部通常保持為0(在數(shù)據(jù)傳輸時可用作奇偶校驗位)?! ∮捎跇?biāo)準(zhǔn)ASCII字符集字符數(shù)目有限,在實際應(yīng)用中往往無法滿足要求。為此,國際標(biāo)準(zhǔn)化組織又制定了ISO2022標(biāo)準(zhǔn),它規(guī)定了在保持與ISO646兼容的前提下將ASCII字符集擴(kuò)充為8位代碼的統(tǒng)一方法。ISO陸續(xù)制定了一批適用于不同地區(qū)的擴(kuò)充ASCII字符集,每種擴(kuò)充ASCII字

5、符集分別可以擴(kuò)充128個字符,這些擴(kuò)充字符的編碼均為高位為1的8位代碼(即十進(jìn)制數(shù)128~255),稱為擴(kuò)展ASCII碼。1.2EBCDID廣義二進(jìn)制編碼的十進(jìn)制交換碼(EBCDIC,ExtendedBinaryCodedDecimalInterchangeCode)(讀作"ehb-suh-dik"或"ehb-kuh-dik"),是字母或數(shù)字字符的二進(jìn)制編碼,它是IBM為更大型的操作系統(tǒng)開發(fā)的。EBCDIC是用于IBMS/390服務(wù)器上的IBMOS/390操作系統(tǒng)的文本文件的編碼。在一個EBCDIC文件中,每個字母或數(shù)字字符都用一個8

6、位的二進(jìn)制數(shù)來表示(八個由0和1組成的字符串)。共有256個可能的字符(字母、數(shù)字和一些特殊字符)?! BM的個人電腦和工作站操作系統(tǒng)不使用IBM所有的EBCDIC編碼。相反的,它們使用文本的工業(yè)標(biāo)準(zhǔn)編碼,ASCII碼。轉(zhuǎn)化程序允許不同的操作系統(tǒng)將文件從一種編碼轉(zhuǎn)化成另一種編碼。1.3ISO8859-x(1)x=1~15,是一系列標(biāo)準(zhǔn),對應(yīng)13種不同的語言(2)ISO-8859-x是單字節(jié)編碼,8位編碼(3)0x00-0x7F部分跟ASCII兼容(4)0x80及以上部分部分除了少數(shù)字符,用來編碼相應(yīng)的語言的專有字符,各不相同。(5)

7、ISO-8859-1最常見,收集了西歐字符(6)因為沒有一個全集字符集,ISO-8859-X之間不能互相轉(zhuǎn)換。2.DBCS(doublebytecharacterset)2.1GB2312(1)兼容ASCII的部分用單字節(jié)編碼(2)漢字部分的編碼根據(jù)區(qū)位碼進(jìn)行,用兩字節(jié)表示,第一個字節(jié)等于區(qū)位碼的區(qū)碼+0xA0,第一個字節(jié)等于區(qū)位碼的位碼+0xA0,因此每個字節(jié)都在0xA0以上(3)7445個符號,支持6763個簡體漢字和682個符號·最常用的稱為一級漢字,3755個,按照拼音排序·次常用的稱為二級漢字,3008個,按照部首排序2.2

8、GBK(1)規(guī)范,沒能成為標(biāo)準(zhǔn),但隨著Windows流行很廣泛。(2)與GB2312向下兼容(3)比GB2312增加了大量的繁體字和異體字(4)首字節(jié)擴(kuò)展到0x81-0xFE,第二個字節(jié)擴(kuò)展到0x40-0xFE。2394

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。