資源描述:
《維吾爾文字分析與文字轉(zhuǎn)換器的設(shè)計(jì)與實(shí)現(xiàn)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、摘要摘要在歷史上維吾爾族用過(guò)很多的文字,比如,古代突厥文,察哈臺(tái)文等。最近的文字改革是1983年實(shí)行,1983年之前維吾爾族用的文字是維吾爾新文字,85年以后開(kāi)始使用阿拉伯字母基礎(chǔ)上改過(guò)來(lái)的維吾爾老文字。所以現(xiàn)在新疆的維吾爾族人當(dāng)中有兩種文字同時(shí)使用的現(xiàn)象。近幾年來(lái),隨著計(jì)算機(jī)軟硬件技術(shù)和Internet技術(shù)的迅速發(fā)展,計(jì)算機(jī)已經(jīng)深入到了人類社會(huì)的每一個(gè)角落。新疆是個(gè)少數(shù)民族聚居的地區(qū),很多方面都有使用少數(shù)民族語(yǔ)言文字的要求,最近的Windows環(huán)境下多文種信息處理平臺(tái)的開(kāi)發(fā)研究不僅豐富了多文種平臺(tái)的開(kāi)發(fā)理論和方法,而且有助于少數(shù)民族語(yǔ)言信息的計(jì)算機(jī)處理的推廣應(yīng)用。另一方面,民文
2、信息處理過(guò)程中所使用的沒(méi)有規(guī)范化的字符編碼方案給民文信息資源的資源共享和Internt技術(shù)的普及帶來(lái)了很大麻煩。這種情況下,為了促進(jìn)實(shí)行己進(jìn)入U(xiǎn)nicode的維文編碼方案和實(shí)現(xiàn)維文信息處理的標(biāo)準(zhǔn)化,開(kāi)發(fā)一個(gè)高性能智能化的維文編碼轉(zhuǎn)換技術(shù)成為維文信息處理中十分關(guān)鍵和活躍的領(lǐng)域。為了能夠在任何Windows平臺(tái)上處理維文,實(shí)現(xiàn)維文信息資源的最大共享,本文提出了一種全新的借助于Unicode編碼方案來(lái)實(shí)現(xiàn)WORD環(huán)境中維文老新文字的轉(zhuǎn)換技術(shù)和多編碼轉(zhuǎn)換技術(shù),并在此基礎(chǔ)上促進(jìn)和實(shí)現(xiàn)維文信息處理的標(biāo)準(zhǔn)化。為了實(shí)現(xiàn)這一系統(tǒng),我們的總體設(shè)計(jì)原則和目標(biāo)是:設(shè)計(jì)并實(shí)現(xiàn)多方向文字轉(zhuǎn)換(非標(biāo)淮維吾爾老
3、文字,維吾爾新文字,Unicode維文,維吾爾拉丁文)技術(shù)給用戶提供極大方便并保留用老系統(tǒng)輸入的數(shù)據(jù)。本文對(duì)維吾爾新文字,維吾爾老文字,西里爾文的編碼方式進(jìn)行了深入地研究,在深入研究比較常用的幾種非標(biāo)準(zhǔn)維文輸入法編碼方式的基礎(chǔ)上,實(shí)現(xiàn)了多方向文字轉(zhuǎn)換技術(shù),不僅給用戶提供了極大的方便而且還能保留用非標(biāo)準(zhǔn)系統(tǒng)輸入的數(shù)據(jù)。這項(xiàng)工作對(duì)用計(jì)算機(jī)來(lái)處理維吾爾文字是十分有意義的。關(guān)鍵詞:維吾爾文字;維吾爾新文字;維吾爾老文字;維文輸入法;UnicodeI萬(wàn)方數(shù)據(jù)ABSTRACTABSTRACTTheUyghurusesalotofwritingsinhistory.Forexample,the
4、ancientTurkic,heChagatai.Thewritingwasreformedin1983.TheUyghurusednewwritingbefore1983andthepreviouswritingwhichwascorrectedbasedonArabian.UsedinUyghurminoritywasthemy,willstartuseletterofalphabetfoundationtothemistakesuphereafterfor85yearsofthemyoldwriting.SotheUyghurinXinjianghavetwokindsof
5、writingsnow.Recently,withtherapiddevelopmentofcomputersoftwareandhardwaretechnology,thecomputerhaspervadedeverycornerofoursociety.Xinjiangisamufti-nationalregionmainlyinhabitedbyethnicminorities,andthereisafrequentneedtouseminorityscripts.TheresearchondevelopingaWindows-basedmulti-scriptopera
6、tingplatformdoesnotonlyaimatenrichingthetheoriesandmethodologiesofmulti-scriptplatformdevelopmenttechnologybutitalsoseekstomakethecomputerizingofminoritylanguageinformationeasier.Ontheotherhand,on-standardizedcharacterencodingschemesusedforminority-languageinformationprocessingcausemanyproble
7、mshinderingthesharingofminorityinformationresourcesandslowingthepenetrationoftheInternet.Undersuchcircumstances,developingahighlyefficientandintellectualizedUighurUnicodeon-lineinputtingtechniqueandimplementingthenormsacceptedbyUnicodeforUygh