資源描述:
《手寫數(shù)字識(shí)別-文成-2150230509》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫(kù)。
1、基于SVM的手寫數(shù)字識(shí)別系統(tǒng)--軟件工程--文成--2150230509深圳大學(xué)研究生課程論文題目基于SVM的手寫數(shù)字識(shí)別系統(tǒng)成績(jī)專業(yè)軟件工程課程名稱、代碼神經(jīng)網(wǎng)絡(luò)與進(jìn)化算法(162023050014)年級(jí)2015級(jí)姓名文成學(xué)號(hào)2150230509時(shí)間2016年6月任課教師朱安民13/13基于SVM的手寫數(shù)字識(shí)別系統(tǒng)--軟件工程--文成--2150230509基于SVM的手寫數(shù)字識(shí)別系統(tǒng)目錄[摘要]3一、簡(jiǎn)介31.引言32.研究背景33.研究的理論意義34.手寫數(shù)字識(shí)別技術(shù)展望4二、OPENCV+SVM簡(jiǎn)介41.支持向量機(jī)簡(jiǎn)介4
2、2.如何計(jì)算超平面53.SVM的特點(diǎn)64.SVM的缺點(diǎn)65.OPENCV6三、主要流程71.手寫數(shù)字識(shí)別主要流程72.訓(xùn)練樣本72.訓(xùn)練樣本圖像預(yù)處理84.SVM訓(xùn)練95.測(cè)試樣本圖像預(yù)處理9四、手寫數(shù)字識(shí)別系統(tǒng)的實(shí)現(xiàn)101.Windows下C++實(shí)現(xiàn)102.安卓應(yīng)用實(shí)現(xiàn)11五、實(shí)驗(yàn)結(jié)果與分析11六、未來的工作12參考文獻(xiàn)1313/13基于SVM的手寫數(shù)字識(shí)別系統(tǒng)--軟件工程--文成--2150230509[摘要]手寫數(shù)字識(shí)別是符號(hào)識(shí)別的一個(gè)分支,雖然只是識(shí)別簡(jiǎn)單的10個(gè)數(shù)字,但卻有著非常大的實(shí)用價(jià)值。在我們的日常生活中,每天都
3、要進(jìn)行大量的文檔處理工作,稅單、銀行支票、匯款單、信用卡賬單的處理,以及郵局信函的分檢等等,如何利用計(jì)算機(jī)字符識(shí)別和文檔處理技術(shù),使人們從這些繁重的手工勞動(dòng)中解放出來已成為一個(gè)迫切需要解決的問題。另外隨著平板電腦和觸摸屏手機(jī)的普及,手寫輸入成為了很多人的主要輸入方式。手寫數(shù)字雖然只有10個(gè)種類,但很多情況下對(duì)識(shí)別的精度要求非常高,而且每個(gè)人都有不同的字跡,要做到準(zhǔn)確地識(shí)別還是有一定難度的。況且在實(shí)際應(yīng)用中,手寫數(shù)字識(shí)別的精確度要求要比漢字[2]嚴(yán)格的多,因?yàn)閿?shù)字識(shí)別經(jīng)常用在財(cái)務(wù)、金融等領(lǐng)域。本文使用支持向量機(jī)的方法實(shí)現(xiàn)了一個(gè)手寫
4、數(shù)字識(shí)別系統(tǒng),采用MINST手寫數(shù)字圖片庫(kù)作為訓(xùn)練集,最終結(jié)果的識(shí)別準(zhǔn)確度非常高。一、簡(jiǎn)介1.引言手寫數(shù)字識(shí)別[1]是“光學(xué)字符識(shí)別技術(shù)”(簡(jiǎn)稱OCR)的一個(gè)分支,它研究的對(duì)象是:如何利用電子計(jì)算機(jī)自動(dòng)辨認(rèn)人手寫在紙張上的阿拉伯?dāng)?shù)字。在整個(gè)OCR領(lǐng)域中,最為困難的就是脫機(jī)手寫字符的識(shí)別。到目前為止,盡管人們?cè)诿摍C(jī)手寫英文、漢字識(shí)別的研究中已取得很多可喜成就,但距實(shí)用還有一定距離。而在手寫數(shù)字識(shí)別這個(gè)方向上,經(jīng)過多年研究,研究工作者已經(jīng)開始把它向各種實(shí)際應(yīng)用推廣,為手寫數(shù)據(jù)的高速自動(dòng)輸入提供了一種解決方案。2.研究背景字符識(shí)別處理
5、[4]的信息可分為兩大類:一類是文字信息,處理的主要是用各國(guó)家、各民族的文字(如:漢字、英文等)書寫或印刷的文本信息,目前在印刷體和聯(lián)機(jī)手寫方面技術(shù)已趨向成熟,并推出了很多應(yīng)用系統(tǒng);另一類是數(shù)據(jù)信息,主要是由阿拉伯?dāng)?shù)字及少量特殊符號(hào)組成的各種編號(hào)和統(tǒng)計(jì)數(shù)據(jù),如:郵政編碼、統(tǒng)計(jì)報(bào)表、財(cái)務(wù)報(bào)表、銀行票據(jù)等等,處理這類信息的核心技術(shù)是手寫數(shù)字識(shí)別。這幾年來我國(guó)開始大力推廣的“三金”工程在很大程度上要依賴數(shù)據(jù)信息的輸入,如果能通過手寫數(shù)字識(shí)別技術(shù)實(shí)現(xiàn)信息的自動(dòng)錄入,無疑會(huì)促進(jìn)這一事業(yè)的進(jìn)展。因此,手寫數(shù)字的識(shí)別研究有著重大的現(xiàn)實(shí)意義,一
6、旦研究成功并投入應(yīng)用,將產(chǎn)生巨大的社會(huì)和經(jīng)濟(jì)效益。3.研究的理論意義手寫數(shù)字識(shí)別作為模式識(shí)別領(lǐng)域的一個(gè)重要問題,也有著重要的理論價(jià)值:1、阿拉伯?dāng)?shù)字是唯一的被世界各國(guó)通用的符號(hào),對(duì)手寫數(shù)字識(shí)別的研究基本上與文化背景無關(guān),這樣就為各國(guó)、各地區(qū)的研究工作者提供了一個(gè)施展才智的大舞臺(tái)。在這一領(lǐng)域大家可以探討,比較各種研究方法。13/13基于SVM的手寫數(shù)字識(shí)別系統(tǒng)--軟件工程--文成--21502305092、由于數(shù)字識(shí)別的類別數(shù)較小,有助于做深入分析及驗(yàn)證一些新的理論。這方面最明顯的例子就是人工神經(jīng)網(wǎng)絡(luò),相當(dāng)一部分的人工神經(jīng)網(wǎng)絡(luò)模型
7、都以手寫數(shù)字識(shí)別作為具體的實(shí)驗(yàn)平臺(tái),驗(yàn)證理論的有效性,評(píng)價(jià)各種方法的優(yōu)缺點(diǎn)。3、盡管人們對(duì)手寫數(shù)字的識(shí)別已從事了很長(zhǎng)時(shí)間的研究,并已取得了很多成果,但到目前為止機(jī)器的識(shí)別本領(lǐng)還無法與人的認(rèn)知能力相比,這仍是一個(gè)有難度的開放問題。4、手寫數(shù)字的識(shí)別方法很容易推廣到其它一些相關(guān)問題,一個(gè)直接的應(yīng)用是對(duì)英文這樣的拼音文字的識(shí)別。事實(shí)上,很多學(xué)者就是把數(shù)字和英文字母的識(shí)別放在一塊兒研究的。4.手寫數(shù)字識(shí)別技術(shù)展望隨著國(guó)家信息化進(jìn)程的加快,手寫數(shù)字識(shí)別的應(yīng)用需求將越來越廣泛,因此應(yīng)當(dāng)加強(qiáng)這方面的研究工作。作者認(rèn)為,應(yīng)用系統(tǒng)的性能的關(guān)鍵與瓶
8、頸仍然在于手寫數(shù)字識(shí)別核心算法性能上,最終目標(biāo)是研究零誤識(shí)率和低拒識(shí)率的高速識(shí)別算法。此外,盡早建立反映中國(guó)人書寫習(xí)慣的、具有國(guó)家標(biāo)準(zhǔn)性質(zhì)的手寫數(shù)字樣本庫(kù)也是當(dāng)務(wù)之急。二、OPENCV+SVM簡(jiǎn)介1.支持向量機(jī)簡(jiǎn)介支持向量機(jī)(SVM)是一個(gè)類分類器,正式的定義是