資源描述:
《字庫知識(shí)淺談》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、字庫知識(shí)淺談字庫知識(shí)淺談漢字有多少呢?從國家標(biāo)準(zhǔn)GB2132到GBK,再到GB18030,標(biāo)準(zhǔn)收錄的漢字從6763個(gè)增加到現(xiàn)在的27000多個(gè)。為了使?jié)h字信息應(yīng)用于計(jì)算機(jī)中,通過電腦存貯、傳輸、顯示、打印、照排輸出等等,需要將這些漢字?jǐn)?shù)字化,字庫就是對(duì)漢字及其它字符的數(shù)字化。字庫主耍涉及的知識(shí)冇字庫格式、編碼、字體樣式、輸入法、制作等一、字庫格式在字庫的應(yīng)用中,經(jīng)常會(huì)碰到點(diǎn)陣字庫、PS字庫、TrueType字庫這三種說法,這是按照字庫的自身格式來說的。1、點(diǎn)陣格式點(diǎn)陣格式是以橫向掃描線上點(diǎn)陣的黑或者口來記錄字形
2、的,滿足針式打印機(jī)、屏幕顯示的要求。點(diǎn)陣字體數(shù)據(jù)量大,不適于放人,放人之后,字的邊緣會(huì)出現(xiàn)鋸齒現(xiàn)象。前點(diǎn)陣字庫應(yīng)用范
3、韋
4、比較廣,手機(jī)、掌上電腦、機(jī)頂盒、MP3播放器、卡拉0K點(diǎn)播機(jī)、其它專用設(shè)備等。2^TrueType格式TrueType格式是由Apple公司和Microsoft公司聯(lián)合開發(fā)的一種曲線輪廓?形描述技術(shù)。采用直線和二次B樣條函數(shù)來描述字的筆劃輪廓,字形描述靈活方便,數(shù)據(jù)量小。對(duì)于細(xì)小的字符,通過專門的提示信息(Hinting)指令集,可以獲得非常好的還原結(jié)果。TrueType格式兼容性好,跨Wi
5、ndows和MAC平臺(tái);顯示效果好,可直接在屏幕上顯示輸出,在卬前工藝中一般作為前端顯示字庫。TrueType格式還具冇所見即所得效果,支持幾乎所有的輸岀設(shè)備,可以進(jìn)行打印、照排輸出,不過精度有一定限度。另外TrueType格式支持字體嵌入技術(shù),可以把TrueType字體嵌入到排版文件小,直接用于后端輸出。Typel格式Typel格式由Adobe開發(fā)的一種曲線輪廓字形描述技術(shù),使用的PostScript語言,常稱為PS格式。采用三次貝塞爾(Bezier)曲線來描述筆劃輪廓。PS格式主要用于激光打印機(jī)、激光照排機(jī)
6、、CTP(計(jì)算機(jī)直接制版)等高精度輸出。PS格式輸出質(zhì)量最好,可以任意縮放,字形淸晰、光滑。PS字庫一般安裝在與打印機(jī)或照排機(jī)相連的后端設(shè)備上。由于屏幕不是PS設(shè)備,使用的都是點(diǎn)陣格式,所以PS字用于屏幕顯示時(shí),耍轉(zhuǎn)換為相應(yīng)的點(diǎn)陣字。轉(zhuǎn)換丁具為ATM(AdobeTypeManager)即字庫管理系統(tǒng),它能夠?qū)ypel輪廓字庫在計(jì)算機(jī)小展開成點(diǎn)陣型數(shù)據(jù),同時(shí)用于終端顯示和非PS打印機(jī)輸出。另外在PS格式屮,還有一種由Typel演變出來的Type3格式。Type3字庫屮,字形輪廓數(shù)據(jù)的格式可以自定,而Typel的
7、字形輪廓數(shù)據(jù)的格式遵守統(tǒng)一規(guī)范。二、字庫編碼字庫的編碼是字庫組織的依據(jù),也是文字處理的基礎(chǔ)。不同國家和地區(qū)冇不同的編碼標(biāo)準(zhǔn),和中文字庫有關(guān)的常見編碼有:GB2312-80、BIG5編碼、GBK、IS010646/Unicode、GB18030-2000、BIG5、方正748編碼,下面簡要介紹一下:1、GB2312-80編碼全稱是GB2312-80《信息交換用漢字編碼字符集基本集》,1980年發(fā)布,是中文信息處理的國家標(biāo)準(zhǔn),在人陸及海外使用簡體中文的地區(qū)使用。使用雙字節(jié)編碼方案。共收錄T6763個(gè)簡體漢字、682
8、個(gè)符號(hào),具屮一級(jí)漢字3755個(gè)(按拼音排序),二級(jí)漢字3008個(gè)(按偏旁排序)。冃前的DOS操作系統(tǒng)‘Windows操作系統(tǒng)以及MacOS的中文版都支持GB2312-80編碼系統(tǒng)。2、BIG5編碼是冃前臺(tái)灣、香港地區(qū)普遍使用的一種繁體漢字的編碼標(biāo)準(zhǔn),包括440個(gè)符號(hào),一級(jí)漢字5401個(gè)、二級(jí)漢字7652個(gè),共計(jì)13063個(gè)漢字。3、GBK編碼(ChineseIntornalCodeSpecification)GBK編碼的制訂于1995年12月完成。它是繼GB2312后新的中文編碼擴(kuò)展國家標(biāo)準(zhǔn)。該編碼標(biāo)準(zhǔn)兼容GB
9、2312,共收錄漢字21003個(gè)、符號(hào)883個(gè),并提供1894個(gè)碼位川于補(bǔ)字。簡、繁體漢字融于一庫,并月.GBK編碼的漢字完全按拼音排序。Windows95/98/2000簡體中文版的字庫表層編碼采用的就是GBK。GBK編碼的漢字共分5部分。其中GBK1和GBK5為符號(hào)部分,GBK2即兼容GB2312的部分,GBK3和GBK4為擴(kuò)展?jié)h字部分。4、IS010646/Unicode編碼國際標(biāo)準(zhǔn)組織于1984年4月成立ISO/IEC工作組,對(duì)各國文字、符號(hào)進(jìn)行統(tǒng)一編碼的工作,并出臺(tái)了Unicode編碼。Unicode
10、是一種重耍的交互和顯示的通用字符編碼標(biāo)準(zhǔn),它覆蓋了美國、歐洲、中東、非洲、印度、亞洲和太平洋的語言,以及古文和專業(yè)符號(hào)。Unicode允許交換、處理和顯示多語言文本以及公用的專業(yè)和數(shù)學(xué)符號(hào)。Unicode采用16位(即雙字節(jié))編碼體系。1996年公布的2.0版本中包含符號(hào)6811個(gè),漢字20902個(gè),韓文拼咅11172個(gè),造字區(qū)6400個(gè),保留20249個(gè),共計(jì)65534個(gè)。隨著國際標(biāo)