資源描述:
《基于Radon變換的文本圖像傾斜校正.pdf》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在行業(yè)資料-天天文庫。
1、電信息技術(shù)基于Radon變換的文本圖像傾斜校正木吳坤黃道平劉少君(華南理工大學自動化科學與工程學院)摘要:歸納現(xiàn)有的多種傾斜字符校正方法,提出一種基于Radon變換用于一般字符校正的方法。該方法對文本圖像做簡單的數(shù)學形態(tài)學處理,利用Radon變換求出文本傾斜的角度。實驗結(jié)果表明:與傳統(tǒng)方法相比,本算法減少了計算量,提高了校正效率,且具有較強的適用性和魯棒性。關鍵詞:OCR系統(tǒng);圖像處理;傾斜校正;Radon變換componentanalysis,PCA)[6];3)相連分量聚類法。O引言1.1投影特征法模式識別已經(jīng)成為一個熱門的研究領域,其最終對于投影特征算
2、法,輸入圖像在一定范圍的角度目的在于有效地模仿人類視覺。隨著計算機和互聯(lián)網(wǎng)內(nèi)旋轉(zhuǎn),然后分別計算出每個旋轉(zhuǎn)角度的投影,再從技術(shù)的發(fā)展,更多的信息以數(shù)字化的方式存儲、使用投影中提取旋轉(zhuǎn)圖像的特征,進而判斷出它的傾斜角和傳遞。光學字符識別(opticalcharacterrecognition,度。由于該算法直接在原始圖像上運算,導致其計算OCR)系統(tǒng)作為模式識別領域中的一個應用,越來越量非常大。并且當圖像含有較多噪音時,其計算準確受到關注和重視。OCR系統(tǒng)主要是將文本文件轉(zhuǎn)化度降低。為相應的數(shù)字形式,進而可以被計算機處理[1】。1.2PCA在典型的光學字符識別過
3、程中,預處理作為不可PCA算法需要計算對傾斜角度的分布具有最大或缺的步驟,著重于對圖像進行增強和補償處理以簡影響的特征向量。這些特征向量,被稱為該分布的主化特征的提取過程【2J。然而,由于掃描質(zhì)量低或人為分量。為此,需要構(gòu)造出文本圖像前景像素點的二維等因素的影響,文本圖像不可避免地出現(xiàn)一定角度的向量集合,使每個像素點與相同坐標的二維向量相匹傾斜。這給后續(xù)識別引入誤差,降低字符識別的準確配。然后找出向量集合的協(xié)方差矩陣,計算其特征值率。因此,在圖像的預處理過程中,傾斜角度的檢測及相應的特征向量,選出絕對值最大的特征值所對應和校正是非常有必要的,其目的在于檢測文
4、本行與水的特征向量。研究發(fā)現(xiàn),用背景像素作為計算量的平或者豎直方向所成夾角的角度【2】。PCA算法比用前景像素計算的PCA算法性能好得多,為了解決這一問題,提出許多算法,并應用于檢這是因為,在大量增加采樣點之后,對不同字體和非測和校正文本圖像的傾斜角。本文在對這些算法歸文字區(qū)域的敏感度大大降低[8】。然而主分量分析法所類,分析其特點的基礎上,提出一種基于Radon變換用到的最小二乘估計法會使其難以表達圖像中常見應用于一般傾斜字符校正的方法。該方法主要借鑒相的離群點。與此同時,PCA算法的運算開銷也很大。連分量的思想,對文本圖像做一系列形態(tài)學處理,然1-3相連
5、分量聚類法后利用Radon變換求出文本中字符傾斜的角度。相連分量聚類法是最鄰近聚類算法的核心。此類l現(xiàn)有文本圖像校正算法算法是基于對同一行文字進行識別的一種算法,主要文獻[3_4】介紹了字符傾斜校正的傳統(tǒng)算法。根據(jù)分為尋找相連分量和估計分量的最優(yōu)傾斜角度兩個其基本原理不同,主要的傾斜角度估測算法可分為3步驟。其主要思想是,同一行中連續(xù)字符的距離比兩類:1)投影特征法【5】;2)主分量分法(principal行中字符的距離相對較/jx[9l。因此,如果能夠使同一爿c基金項目:教育部高等學校博士學科點專項科研基金項2013年第34卷第5期自動化與信息工程l1目資
6、助(20120172110026)吳砷黃道平劉少君:基于Radon變換的文本圖像傾斜校正從表1數(shù)據(jù)中可以看出,各個方法的準確率相差37(5):977—997.[5】方承志,申繼龍,周品,等.基于變步長的旋轉(zhuǎn)投影變換法[J].不多,且在誤差允許范圍內(nèi)的傾斜角度,對字符的識計算機技術(shù)與發(fā)展,2013,23(9):107.109,118.別不會造成太大的影響。投影特征法雖然準確率較[6】OkunO,PietikainenM,SauvolaJ.Robustskewestimationon高,但是處理時間最長?;赗adon變換的新方法,low-resolutiond
7、ocumentimages.DocumentAnalysisand在不降低準確率的前提下,計算時間更快,在實際生Recognition[C].India:IEEE,1999:621—624.產(chǎn)中具有重要意義。[7】吳冰,秦志遠.自動確定圖像二值化最佳閾值的新方法[J].測繪學院學報,2001,18(4):283.286.4結(jié)論[8]SteinherzT,IntratorN,VlinE.Skewdetectionviaprincipal本文對文本傾斜角度的檢測和校正進行了討論componentsanalysis.DocumentAnalysisandRecog
8、nition[C].Bangalore:IEEE,1