資源描述:
《西夏文四角號碼輸入法研究》由會員上傳分享,免費在線閱讀,更多相關內容在工程資料-天天文庫。
1、第31卷第4期寧夏大學學報(自然科學版)2010年12月Vol.31No.4JournalofNingxiaUniversity(NaturalScienceEdition)Dec.2010文章編號:02532328(2010)04032405西夏文四角號碼輸入法研究1,21,21柳長青,史偉,杜建錄(1.寧夏大學西夏學研究院,寧夏銀川750021;2.寧夏大學數(shù)學計算機學院,寧夏銀川750021)摘要:對基于Hook,asp.net和輸入法生成器技術的西夏文四角號碼輸入法進行了深入研究,實現(xiàn)了在Windows系統(tǒng)下西夏文的錄入
2、,為西夏古籍文獻的數(shù)字化、文本化提供了專用在線輸入平臺.并利用在線模糊輸入方法修復了西夏古籍文獻中的部分殘缺西夏字.西夏文四角號碼輸入法對于如契丹文、女真文等少數(shù)民族語言文字的計算機輸入法研究具有一定的借鑒價值.關鍵詞:西夏文;西夏文獻;四角號碼;輸入法;互聯(lián)網(wǎng)分類號:(中圖)TP391文獻標志碼:A西夏文是黨項族創(chuàng)立的一種少數(shù)民族語言文塊字,因此可利用此特點建立西夏文四角號碼檢字[1]字.西夏字近似于漢字,但其結構與漢字有很大差法.漢字四角號碼檢字法是根據(jù)漢字的構成特點而異,筆畫繁瑣且無一字與漢字相同.編制的,這種方法同樣適用于西夏文.目前,西夏文當前在西夏文數(shù)字化的研究方面,日
3、本國立亞檢字編碼普遍采用李范文先生的四角號碼檢字[3]非語言文化研究所1996年制作了西夏文字庫和排法.該方法將西夏字的筆形歸納為9種,9種筆形版系統(tǒng);臺灣中央研究院語言學研究所的龔煌城和用9個阿拉伯數(shù)字表示,另加無筆形或筆形已取號林英津于2000年合作開發(fā)了西夏文字形屬性資料后的代碼0,共10個代碼.其筆形、代碼及說明如表庫及計算機輸入法;柳長青于1999年開發(fā)了夏漢1所示.字處理及電子字典軟件,該軟件是按照四角號碼和表1西夏字筆形代碼表順序號檢字法對西夏字進行排列、注音和釋義的筆形名代碼筆形示例說明Windows單機版應用軟件,提供了外掛式的西夏文橫1橫或橫起、橫結束單四角號碼輸入法
4、;2005年景永時和賈常業(yè)開發(fā)了基垂2豎或撇筆于方正典碼系統(tǒng)之上的西夏文錄入系統(tǒng),該系統(tǒng)主點、捺3點或捺要解決了在方正飛騰、蒙泰等排版軟件中的西夏文叉4兩筆交叉或一橫與兩豎交叉輸入問題.一橫與三豎交叉或一豎與兩、串5三橫交叉由于目前已無人能讀出西夏字的準確讀音,故復多串6一橫與四豎或一豎與四橫交叉在計算機中對西夏字進行快速、準確的輸入是困擾筆角7一筆成角或兩筆構成角西夏學學者的難題.如何建立一種通用的適用于西八8類似漢字八或八的變形夏文、漢文計算機混合編輯與排版的西夏文計算機小9類似漢字小或小的變形輸入法則是西夏文信息處理亟待解決的問題.單筆或復筆已取碼且又不能0另角成其它形1西夏文檢字編碼
5、西夏字筆畫繁多,如果僅采用四角取號,重碼頗[2]西夏文檢字編碼可以借鑒漢字方法.西夏文多,不利于計算機快速錄入的要求,因此采用基本號字是通過仿照漢字而創(chuàng)制的,即以偏旁部首組成方加附加碼的方法減少重碼.這樣,每一個西夏字的檢收稿日期:20090429基金項目:國家自然科學基金資助項目(60803104);國家社科基金重點資助項目(06AMZ001);寧夏自然科學基金資助項目(NZ0836);寧夏高等學??蒲匈Y助項目(2007,2009)作者簡介:柳長青(1976),男,副教授,博士研究生,主要從事西夏文信息處理研究.第4期柳長青等:西夏文四角號碼輸入法研究325字碼實際上就由6位十進制
6、數(shù)構成,即4位基本號監(jiān)視系統(tǒng)的作用.Windows對鉤子過程采用指針列[3-4]加2位附號.其具體取碼方法為:表法進行管理,同類型鉤子的地址存在于同一個數(shù)1)基本號的取碼順序為:左上角、右上角、左下組中,每個數(shù)組元素是一個鉤子的起地址.不同類型角、右下角.例如:鉤子對應不同的數(shù)組.Windows通過維護10個這2341的基本號為2341;樣的數(shù)組來完成對鉤子的管理,這些數(shù)組被稱為鉤22子鏈.每一個安裝的鉤子,都被排在相應鉤子鏈的鏈24的基本號為2224.頭上.2)附號的取碼順序為:靠近左下角、靠近右下2.2鉤子函數(shù)的構造方法角.例如:3鉤子過程實際上是一個函數(shù),它的格式應符合241的附號為2
7、2,檢字碼為234122;下列語法規(guī)則:2222keyhook(Code:Integer;wParam:WPARAM;lParam:LPARAM):24的附號為22,檢字碼為222422.22LRESULT;stdcall.其中,參數(shù)Code稱為鉤子代碼,鉤子函數(shù)根據(jù)它2外掛式西夏文輸入法確定所要完成的動作,不同類型鉤子的Code取值范圍Windows操作系統(tǒng)內部及系統(tǒng)與應用程序之不同;參數(shù)wP