關(guān)于處理java web中中文亂碼的問題

關(guān)于處理java web中中文亂碼的問題

ID:6037925

大?。?0.00 KB

頁數(shù):9頁

時(shí)間:2017-12-31

關(guān)于處理java web中中文亂碼的問題_第1頁
關(guān)于處理java web中中文亂碼的問題_第2頁
關(guān)于處理java web中中文亂碼的問題_第3頁
關(guān)于處理java web中中文亂碼的問題_第4頁
關(guān)于處理java web中中文亂碼的問題_第5頁
資源描述:

《關(guān)于處理java web中中文亂碼的問題》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、河北師范大學(xué)附屬民族學(xué)院學(xué)生畢業(yè)論文(設(shè)計(jì))題目關(guān)于JavaWeb技術(shù)開發(fā)中中文亂碼問題的深入討論作者姓名張?zhí)忑埾祫e數(shù)信系專業(yè)計(jì)算機(jī)應(yīng)用技術(shù)班級(jí)08專1班指導(dǎo)教師段繼光完成日期2011年5月30日河北師范大學(xué)附屬民族學(xué)院教務(wù)處編制關(guān)于JavaWeb技術(shù)開發(fā)中中文亂碼問題的深入探討數(shù)信系08專1班張?zhí)忑?8221035指導(dǎo)老師:段繼光摘要:在利用Servalete/Jsp技術(shù)開發(fā)Web應(yīng)用程序的時(shí)候,不可避免的會(huì)遇到中文亂碼問題。如:頁面編碼不一致;表單get提交時(shí)產(chǎn)生亂碼問題;表單使用post方式時(shí)產(chǎn)生的亂碼問題等。本文首先詳細(xì)分析這

2、些中文亂碼問題產(chǎn)生的原因,并以圖例清晰具體的展現(xiàn)出來,最后在此基礎(chǔ)上提出詳細(xì)合理的解決方案。關(guān)鍵字:JavaWeb技術(shù)開發(fā)中文亂碼字符集1.引言為了能在計(jì)算機(jī)中表示不同語言中字符,每個(gè)國家(或區(qū)域)都規(guī)定了計(jì)算機(jī)信息交換用的字符編碼集,如美國的ASCII,中國GB2312和GBK,日本的JIS等。Java語言內(nèi)部用Unicode來表示字符,Unicode被稱為統(tǒng)一的字符編碼標(biāo)準(zhǔn)集,它為幾乎每種語言中的字符設(shè)定了唯一的二進(jìn)制編碼,以滿足跨語言、跨平臺(tái)進(jìn)行文本轉(zhuǎn)換、處理的要求。這也使得Java具有良好的可移植性,符合其國際化的思想。然而在

3、實(shí)際應(yīng)用中,由于應(yīng)用程序的運(yùn)行環(huán)境不同,和各個(gè)本地字符集的補(bǔ)充、完善,以及系統(tǒng)或應(yīng)用程序?qū)崿F(xiàn)的不規(guī)范,轉(zhuǎn)碼時(shí)出現(xiàn)的中文亂碼問題時(shí)時(shí)困擾著程序員和用戶。2.中文亂碼產(chǎn)生的原因Java中文問題一直困擾著很多初學(xué)者,如果了解了Java系統(tǒng)的中文問題原理,我們就可以對(duì)中文問題能夠采取根本的解決之道。最古老的解決方案是使用String的字節(jié)碼轉(zhuǎn)換,這種方案問題是不方便,我們需要破壞對(duì)象封裝性,進(jìn)行字節(jié)碼轉(zhuǎn)換。還有一種方式是對(duì)J2EE容器進(jìn)行編碼設(shè)置,如果J2EE應(yīng)用系統(tǒng)脫離該容器,則會(huì)發(fā)生亂碼,而且指定容器配置不符合J2EE應(yīng)用和容器分離的原則

4、。在Java內(nèi)部運(yùn)算中,涉及到的所有字符串都會(huì)被轉(zhuǎn)化為UTF-8編碼來進(jìn)行運(yùn)算。那么,在被Java轉(zhuǎn)化之前,字符串是什么樣的字符集?Java總是根據(jù)操作系統(tǒng)的默認(rèn)編碼字符集來決定字符串的初始編碼,而且Java系統(tǒng)的輸入和輸出的都是采取操作系統(tǒng)的默認(rèn)編碼。因此,如果能統(tǒng)一Java系統(tǒng)的輸入、輸出和操作系統(tǒng)3者的編碼字符集合,將能夠使Java系統(tǒng)正確處理和顯示漢字。這是處理Java系統(tǒng)漢字的一個(gè)原則,但是在實(shí)際項(xiàng)目中,能夠正確抓住和控制住Java系統(tǒng)的輸入和輸出部分是比較難的。J2EE中,由于涉及到外部瀏覽器和數(shù)據(jù)庫等,所以中文問題亂碼顯

5、得非常突出。J2EE應(yīng)用程序是運(yùn)行在J2EE容器中。在這個(gè)系統(tǒng)中,輸入途徑有很多種:一種是通過頁面表單打包成請(qǐng)求(request)發(fā)往服務(wù)器的;第二種是通過數(shù)據(jù)庫讀入;還有第3種輸入比較復(fù)雜,JSP在第一次運(yùn)行時(shí)總是被編譯成Servlet,JSP中常常包含中文字符,那么編譯使用javac時(shí),Java將根據(jù)默認(rèn)的操作系統(tǒng)編碼作為初始編碼。除非特別指定,如在Jbuilder/eclipse中可以指定默認(rèn)的字符集。輸出途徑也有幾種:第一種是JSP頁面的輸出。由于JSP頁面已經(jīng)被編譯成Servlet,那么在輸出時(shí),也將根據(jù)操作系統(tǒng)的默認(rèn)編碼來

6、選擇輸出編碼,除非指定輸出編碼方式;還有輸出途徑是數(shù)據(jù)庫,將字符串輸出到數(shù)據(jù)庫。由此看來,一個(gè)J2EE系統(tǒng)的輸入輸出是非常復(fù)雜,而且是動(dòng)態(tài)變化的,而Java是跨平臺(tái)運(yùn)行的,在實(shí)際編譯和運(yùn)行中,都可能涉及到不同的操作系統(tǒng),如果任由Java自由根據(jù)操作系統(tǒng)來決定輸入輸出的編碼字符集,這將不可控制地出現(xiàn)亂碼。正是由于Java的跨平臺(tái)特性,使得字符集問題必須由具體系統(tǒng)來統(tǒng)一解決,所以在一個(gè)Java應(yīng)用系統(tǒng)中,解決中文亂碼的根本辦法是明確指定整個(gè)應(yīng)用系統(tǒng)統(tǒng)一字符集。指定統(tǒng)一字符集時(shí),到底是指定ISO8859_1、GBK還是UTF-8呢?(1)如

7、統(tǒng)一指定為ISO8859_1,因?yàn)槟壳按蠖鄶?shù)軟件都是西方人編制的,他們默認(rèn)的字符集就是ISO8859_1,包括操作系統(tǒng)Linux和數(shù)據(jù)庫MySQL等。這樣,如果指定Jive統(tǒng)一編碼為ISO8859_1,那么就有下面3個(gè)環(huán)節(jié)必須把握:A開發(fā)和編譯代碼時(shí)指定字符集為ISO8859_1。B運(yùn)行操作系統(tǒng)的默認(rèn)編碼必須是ISO8859_1,如Linux。C在JSP頭部聲明:。(2)如果統(tǒng)一指定為GBK中文字符集,上述3個(gè)環(huán)節(jié)同樣需要做到,不同的是只能運(yùn)行在默認(rèn)編碼為GBK的操作系統(tǒng),如中文Windows。統(tǒng)一編碼為ISO8859_1和GBK雖然

8、帶來編制代碼的方便,但是各自只能在相應(yīng)的操作系統(tǒng)上運(yùn)行。但是也破壞了Java跨平臺(tái)運(yùn)行的優(yōu)越性,只在一定范圍內(nèi)行得通。例如,為了使得GBK編碼在linux上運(yùn)行,設(shè)置Linux編碼為GBK。那么有沒有一種除了應(yīng)用系統(tǒng)以外

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。