資源描述:
《數(shù)字圖像處理作業(yè)-數(shù)字識(shí)別.doc》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、數(shù)字識(shí)別摘要介紹了一種簡(jiǎn)易的標(biāo)準(zhǔn)數(shù)字識(shí)別的方法,與傳統(tǒng)的方法比較,算法簡(jiǎn)易了許多,識(shí)別的速度較快,本文主要從圖像的預(yù)處理,數(shù)字圖像分割以及數(shù)字識(shí)別三個(gè)方面設(shè)計(jì)思想進(jìn)行簡(jiǎn)單的討論,實(shí)際對(duì)一串?dāng)?shù)字的圖像進(jìn)行處理,并且得到了正確的識(shí)別結(jié)果。關(guān)鍵詞圖像處理,數(shù)字識(shí)別,圖像分割引言數(shù)字識(shí)別是模式識(shí)別中的一個(gè)代表性問題,而是該問題在現(xiàn)實(shí)生活中也具有顯著地應(yīng)用價(jià)值,所以,它理論研究一直受到人們的青睞。數(shù)字識(shí)別系統(tǒng)在多個(gè)方面有應(yīng)用價(jià)值,比如:大型的數(shù)據(jù)統(tǒng)計(jì)(人口,工農(nóng)業(yè)普查),大量的金融相關(guān)票據(jù),身份證號(hào)碼識(shí)別,甚至是郵件的分揀中都發(fā)揮了
2、很大的作用。數(shù)字識(shí)別系統(tǒng)的理論價(jià)值,首先,阿拉伯?dāng)?shù)字有明顯優(yōu)越性,類別不大,而且不受國界影;其次,雖然國內(nèi)外對(duì)數(shù)字識(shí)別的研究很多,但是其系統(tǒng)的判斷能力還遠(yuǎn)遠(yuǎn)不及大腦;最后,數(shù)字識(shí)別研究理論還可以延生應(yīng)用到字母識(shí)別中去,對(duì)二十六個(gè)字母組成的英文識(shí)別帶來可能,此外,還可以將之應(yīng)用到其他一些問題。本文主要內(nèi)容:一是介紹數(shù)字識(shí)別的研究?jī)?nèi)容和發(fā)展?fàn)顩r,二是數(shù)字識(shí)別過程中的預(yù)處理,分割,以及識(shí)別等方法;三是數(shù)字識(shí)別的發(fā)展前景。正文1.1設(shè)計(jì)思想把要識(shí)別的圖片讀入,分三步處理,第一,進(jìn)行預(yù)處理,主要包括濾波處理和二值化處理;第二,數(shù)字分
3、割,把處理好的數(shù)字圖片中的每個(gè)數(shù)字分割處理;第三,數(shù)字識(shí)別,把分割出來的數(shù)字與與模板數(shù)字一一對(duì)比,并識(shí)別出圖片上的數(shù)字。1.2實(shí)現(xiàn)過程(一)圖像預(yù)處理(1)把原圖(彩圖)用imread語句讀入系統(tǒng)(2)彩圖分層處理將彩圖分成R,B,G三個(gè)圖層,分別對(duì)三個(gè)圖層進(jìn)行濾波(中值濾波)和二值化,可以得到以下圖樣:(3)三層圖像合并(4)上圖中有依然有許多椒鹽噪聲,可使用中值濾波濾去椒鹽噪聲,并且將圖片二值化。(二)圖像分割(1)確定圖像中數(shù)字的大致高度:先自上而下對(duì)圖像進(jìn)行逐行掃描,并且計(jì)算黑色像素點(diǎn)的總個(gè)數(shù),當(dāng)黑色像素點(diǎn)的數(shù)目大
4、于某個(gè)數(shù)值(避免有一些“椒噪聲”出現(xiàn)誤判),記錄下行數(shù);然再自下而上進(jìn)行逐行掃描,并且計(jì)算每行黑色像素點(diǎn)的總個(gè)數(shù),當(dāng)黑色像素點(diǎn)的數(shù)目大于某個(gè)數(shù)值(這個(gè)要視情況設(shè)定),記錄下行數(shù)。這兩個(gè)行號(hào)就是數(shù)字大致的高度范圍。結(jié)果如下圖所示。(2)確定每個(gè)數(shù)字的左右起始位置:與第(1)步相似,在上一步得到圖像中,從左向右逐列掃描,并且計(jì)算黑色像素點(diǎn)的總個(gè)數(shù),當(dāng)黑色像素點(diǎn)的數(shù)目大于某個(gè)數(shù)值(避免有一些“椒噪聲”出現(xiàn)誤判),記錄下列數(shù),認(rèn)為是該數(shù)字分割的起始位;然后繼續(xù)從左向右逐列掃描,并且計(jì)算每行黑色像素點(diǎn)的總個(gè)數(shù),當(dāng)色像素點(diǎn)的數(shù)目小于某
5、個(gè)數(shù)值,記錄下列數(shù),認(rèn)為是該數(shù)字分割的右終止位。準(zhǔn)備開始下一個(gè)數(shù)字的分割,按照上述的方法繼續(xù)掃描,知道掃描到圖像的最右端,這樣便得到每一個(gè)數(shù)字的大致寬度范圍,執(zhí)行結(jié)果如下圖:(三)數(shù)字識(shí)別(1)像素點(diǎn)陣標(biāo)準(zhǔn)化分別對(duì)每個(gè)分割出來的數(shù)字進(jìn)行識(shí)別,由于分割出來的數(shù)字圖像與標(biāo)準(zhǔn)模板的大小(像素點(diǎn)陣規(guī)格)并不相同,所以必須對(duì)他們統(tǒng)一成一樣大小的點(diǎn)陣(比如:m*n),下圖是數(shù)字模板圖像。(2)對(duì)比識(shí)別先給出一個(gè)計(jì)數(shù)器sum,且將之置sum=0.將要識(shí)別的圖像與每個(gè)模板圖像一一比較,每?jī)蓮垐D像比較過程是將對(duì)應(yīng)像素點(diǎn)(只有0或1)一一對(duì)比
6、,如果像素點(diǎn)的灰度值相同(同為0或同為1),計(jì)數(shù)器加1,如果灰度值不同則不加,比較結(jié)束后算出相同像素點(diǎn)的比例,即相似度P=sum/(m*n)。相似度最大的那個(gè)模板的數(shù)字就是要識(shí)別的圖像上的數(shù)字了。將分割完數(shù)字進(jìn)行識(shí)別可以得到以下結(jié)果:y=3218076459識(shí)別正確。結(jié)論本文的數(shù)字識(shí)別方法與傳統(tǒng)的方法比較,圖像的預(yù)處理,數(shù)字圖像分割以及數(shù)字識(shí)別三個(gè)方面設(shè)計(jì)思想比較簡(jiǎn)單,算法也簡(jiǎn)易了許多,識(shí)別的速度較快,但是依然存在一些問題,在數(shù)字的字跡比較模糊的時(shí)候會(huì)出現(xiàn)誤判的情況,所以在算法還好改進(jìn)的空間。參考文獻(xiàn)[1]鄔建瓴數(shù)字識(shí)別及
7、其應(yīng)用華中科技大學(xué)2006年5月10日[2]陳展東,白寶興數(shù)字識(shí)別算法研究長(zhǎng)春理工大學(xué)學(xué)報(bào)2010年3月第33卷第1期[3]陳明華印刷體數(shù)字識(shí)別算法研究華中科技大學(xué)2012年1月[4]張珍榮印刷體數(shù)字識(shí)別系統(tǒng)研究與設(shè)計(jì)江西理工大學(xué)2012年6月[5]王亞坤曾德良李向菊一種新穎的數(shù)字識(shí)別算法電力科學(xué)與工程2009年1月第25卷第1期附錄:1、圖像預(yù)處理程序:clcI=imread('3.png');figure;imshow(I);imwrite(I,'000.png');%輸出原圖PR=I(:,:,1);PR=im2bw(
8、PR,0.5);PR=medfilt2(PR,[4,4]);PG=I(:,:,2);PG=im2bw(PG,0.5);PG=medfilt2(PG,[4,4]);PB=I(:,:,3);PB=im2bw(PB,0.5);PB=medfilt2(PB,[4,4]);P=cat(2,PR,PG,PB);fi