資源描述:
《基于KNN的手寫數(shù)字的識(shí)別.pdf》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、第55卷第10期農(nóng)業(yè)裝備與車輛工程2017年10月V01.55No.10AGRICULTURALEQUIPMENT&VEHICLEENGINEERINGOctober2017doi:10.39696.issn.1673-3142.2017.10.022基于KNN的手寫數(shù)字的識(shí)別田紹興,陳勁杰(200093上海市上海理工大學(xué)機(jī)械工程學(xué)院)【摘要】手寫數(shù)字的識(shí)別是模式識(shí)別及機(jī)器學(xué)習(xí)的一個(gè)重要應(yīng)用,應(yīng)用范圍非常廣泛。提出了一種基于KNN算法的手寫數(shù)字識(shí)別方法,該方法提出基于相似度的文本分類,通過訓(xùn)練得到一個(gè)KNN分類模型,進(jìn)入進(jìn)行手寫數(shù)字的識(shí)
2、別。實(shí)驗(yàn)證明該方法能夠快速有效的進(jìn)行手寫數(shù)字的識(shí)別?!娟P(guān)鍵詞】手寫數(shù)字識(shí)別;文本分類;模式i欺,J54;KNN【中圖分類號(hào)】TP391【文獻(xiàn)標(biāo)識(shí)碼】B【文章編號(hào)】1673—3142(2017)10-0096-03HandwrittenNumeralRecognitionBasedonKNNTianShaoxing,ChenJinjie(SchoolofMechanicalEngineering,UniversityofShanghaiforScienceandTechnology,Shanghai200093,China)【Abstra
3、ct】Handwrittennumeralrecosnitionisanapplicationofpattemrecognitionandmachinelearningandhaswideuseinmanyfields.AmethodtorecosmzehandwriaennumeralbasedonKNNispIol瑚ed,whichisputforwardbasedonsimilarityoftextclassification.AmodelofKNNclassificationisobtainedbytraining,intoha
4、ndwriaennumeralsrecognition.Theexperimentsshowthatthepropo∞dmethodcanquicklyandeffectivelyrecognizehandwrittennumeral.[Keywords】handwrittennumeralrecognition;textclassification;patternrecognition;KNNO引言模式識(shí)別(PatternRecognition)的目的是讓機(jī)器自動(dòng)識(shí)別事物?。手寫數(shù)字識(shí)別fHandwrittenNumeralRecog
5、nition)是光學(xué)字符識(shí)別技術(shù)(OpticalCharacterRecognition,簡稱OCR)的一個(gè)分支,它研究的對(duì)象是如何利用電子計(jì)算機(jī)自動(dòng)辨認(rèn)人手寫在紙張上的阿拉伯?dāng)?shù)字口】。手寫數(shù)字識(shí)別有著極為廣泛的應(yīng)用前景,可以應(yīng)用于大規(guī)模數(shù)據(jù)統(tǒng)計(jì)、財(cái)務(wù)、稅務(wù)、金融、郵件分揀等方面,這也正是它受到世界各國的研究工作者重視的一個(gè)主要原因。到目前為止,盡管人們?cè)诿摍C(jī)手寫英文、漢字識(shí)別的研究中已取得很多可喜成就,但距實(shí)用還有一定距離。而在手寫數(shù)字識(shí)別方面,經(jīng)過多年研究,研究者們已經(jīng)開始把它向各種實(shí)際應(yīng)用推廣,為手寫數(shù)據(jù)的高速自動(dòng)輸入提供了一種解
6、決方案。已經(jīng)研究并應(yīng)用的方法有:組合式神經(jīng)網(wǎng)絡(luò)舊‘31、模板匹配㈣、紋理識(shí)別[51。本文提出一種基于KNN算法的手寫數(shù)字識(shí)別方法,該方法通過提取基于相似度的特征,通收稿13期:2017-02—28修回13期:2017-03—07過訓(xùn)練得到一個(gè)KNN分類模型,進(jìn)而進(jìn)行手寫數(shù)字的識(shí)別。實(shí)驗(yàn)證明該方法能夠快速有效地進(jìn)行手寫數(shù)字的識(shí)別。1KNN算法K近鄰法(K—NearestNeighbor,KNN)是一種基本分類與回歸方法【6】。K近鄰法的輸人為實(shí)例的特征向量,對(duì)應(yīng)于特征空間的點(diǎn);輸出為實(shí)例的類別,可以取類。K近鄰法假設(shè)給定一個(gè)訓(xùn)練數(shù)據(jù)集,其
7、中的實(shí)例類別已定。分類時(shí),對(duì)新的實(shí)例,根據(jù)k個(gè)最近鄰的訓(xùn)練實(shí)例的類別,通過多數(shù)表決等方式進(jìn)行預(yù)測(cè)。因此,K近鄰法不具有顯示的學(xué)習(xí)過程。K近鄰法實(shí)際上利用訓(xùn)練數(shù)據(jù)集對(duì)特征空間進(jìn)行劃分,并作為其分類的“模型”。K值的選擇、距離度量及分類決策規(guī)則是K近鄰法的三個(gè)基本元素。K近鄰法1968年由Cover和Hart提出【_”。算法過程:假設(shè)輸入訓(xùn)練數(shù)據(jù)集:T={(丑,3^),(勛,弘),...,(斯,射))(1)式中:五∈霉£Rn——實(shí)例的特征向量;弘∈∥=el,c2,...,婦)_一實(shí)例類別,i=1,2?,Ⅳ;實(shí)例特征向量為了。第55卷第10期
8、田紹興等:基于KNN的手寫數(shù)字的識(shí)別97輸出:實(shí)例菇所屬的類Y。(1)根據(jù)給定的距離度量,在訓(xùn)練集T中找出與石最近鄰的k個(gè)點(diǎn),涵蓋這k個(gè)點(diǎn)的菇的領(lǐng)域記作肌(z);(2)在M(z)中根據(jù)分類決策規(guī)則(如多數(shù)表