資源描述:
《文獻(xiàn)綜述-李娜》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、文獻(xiàn)綜述圖像處理包含了一個人的許多有用信息,其作為一種簡明美觀的信息載體在現(xiàn)代商務(wù)活動中扮演著重要的角色。大量圖像信息給人們帶來方便的同時也帶來了口常管理的麻煩,很多手機(jī)和PDA可用于名片管理,但能實現(xiàn)名片的自動化輸入的并不多,或者效果還不英理想。本文以名片的識別和信息提取為課題,主要研究了圖像的分割、識別和信息提取及理解的相關(guān)算法和實現(xiàn)。本文首先介紹名片識別系統(tǒng)的總體系統(tǒng),包括圖像的預(yù)處理、圖像版而的分析、圖像的字符分割、字符的識別、內(nèi)容信息的理解。然后在對組成框架的各個模塊和過程進(jìn)行介紹和說明,并且對涉及到的相關(guān)算法進(jìn)行闡述和比較,其屮重點介紹圖
2、像屮文字區(qū)塊的分制和名片內(nèi)容的理解。1,研究背景近年來,隨著信息技術(shù)的進(jìn)步,尤其是人工智能的£速發(fā)展,在字符識別領(lǐng)域已取得了對觀的成就,進(jìn)入實用化階段。OCR是OpticalCharacterRecognition的簡稱,指光學(xué)字符識別技術(shù),是機(jī)器視覺技術(shù)研究和應(yīng)用中的一個重要領(lǐng)域。光學(xué)字符識別技術(shù)的工作原理是通過掃描儀、數(shù)碼相機(jī)或手機(jī)等光學(xué)輸入設(shè)備獲取紙張上的文字圖片信息,采用光學(xué)的方式將文檔資料轉(zhuǎn)換成原始黑口點陣的圖像文件,利用各種模式識別算法分析文字形態(tài)特征,判斷和識別出字符文字,通過識別軟件將圖像中的文字轉(zhuǎn)換成文木格式,并按通用格式存儲在文本
3、文件或者數(shù)據(jù)庫當(dāng)中,還可以利用文字處理或者編輯軟件等進(jìn)一步加工。OCR技術(shù)是一種圖像信息數(shù)字化的過程,這個過程幫助人們以低成木、快速度、高質(zhì)量地將文檔資料和各類紙介信息進(jìn)行數(shù)字化,推進(jìn)信息資源的開發(fā)和利用,進(jìn)一步方便人們的生活、學(xué)習(xí)和工作。文本的名片圖像的識別是OCR研究中的一個例子,OCR的研究成果使得名片識別系統(tǒng)的自動登陸成為可能。2,研究思路數(shù)字圖像處理技術(shù)主要包括三個方面,一是前期的預(yù)處理,二是對處理后的結(jié)果進(jìn)行識別,三是對識別后的結(jié)果進(jìn)行信息提取。通常一個名片識別系統(tǒng)由以下幾個部分組成;預(yù)處理只是為了去除噪聲,加強(qiáng)有用的信息,并對輸入測量儀
4、器或其他因索所引起的退化現(xiàn)象進(jìn)行修復(fù)。通常,它包括對原始圖像的去噪、傾斜校正,二值化等。預(yù)處理的方法也是因噪聲的不同會稍有區(qū)別。比如字符分割和特征提取兩部分都有較好的抗噪聲能力,這一部分并不是必需的。版面分析主要是把文字和圖像部分分開,它是對名片圖像總體分析,識別出文本段落,圖像,表格等。在名片識別系統(tǒng)屮,只是識別出文本區(qū)域,為接下來的文字識別作準(zhǔn)備。字符分割是字符識別技術(shù)的一個難點也是關(guān)鍵技術(shù)之一。它是字符識別的前提,字符分割的好壞直接影響到字符的識別率。它是在行分割的詢提下繼續(xù)識別一個一個字,因為名片識別主要針對的是印刷體文字,所以這一塊也是采用
5、通用的OCR印刷體字符識別方法。特征提取部分是名片識別系統(tǒng)的關(guān)鍵部分,特征圖區(qū)的好壞,是決定字符識別率高低的最關(guān)鍵的要素。這是任何一個識別系統(tǒng)成功與否的關(guān)鍵,也是模式識別領(lǐng)域屮人們研究的熱點。2,本文的優(yōu)化處理傳統(tǒng)的圖像識別都是先對彩色圖像進(jìn)行灰度化、二值化、平滑、去噪聲等一些預(yù)處理,然后再對得到的二值圖像進(jìn)行版面分析、分割和識別,1血對版面復(fù)雜的名片圖像進(jìn)行了版面分析和研究,卻是針對掃描儀獲取的名片圖像。而在手機(jī)拍攝圖像的過程屮,由于光照、背景和拍攝本身的原因,可能會使名片圖像產(chǎn)生幾何變形,名片的矩形邊框在拍攝獲得圖像中不再是矩形,變成了不規(guī)則的四
6、邊形,有的甚至產(chǎn)牛扭曲;另外,名片圖形中的背景顏色不一,圖形、文字、線條交錯,使得直接對名片圖像進(jìn)行二值化處理的效果并不理想,甚至無法處理,既可能丟失一些冇用信息,也給后面的分割和識別工作帶來了很多困難。分析樣木圖像可以看出,由于無法保證攝像頭與名片平面相平行,使得名片圖像發(fā)生了形變,其小名片的外圍矩形邊框發(fā)牛形變比較明顯,變成了非常不規(guī)則的四邊形,有的邊框甚至不再是總線,但從局部看,名片圖像中的字符塊圖像和圖形(LOGO等)塊等關(guān)鍵信息局部圖像發(fā)生的形變卻不是太明顯,許多識別算法町以進(jìn)行有效處理。本文主耍針對文字區(qū)塊的分割問題介紹一種方法,直接在手
7、機(jī)攝像頭獲取的彩色名片圖像的棊礎(chǔ)匕利用四個方向的sobel算子進(jìn)行邊緣檢測,得到四個方向的邊緣圖像,再在二值化的邊緣圖上求連通元索,然后根據(jù)連通元素的特征提找出文字區(qū)塊的位置,最后在原彩色名片圖像小提取出文字區(qū)塊。山于利用的是彩色圖像的邊緣特征,因而可以在多背景的情況下,從名片圖像中捉取出文字區(qū)塊,包括了不同顏色、不同字體或者不同種語言的文字。該方法很好的保簾了文字的顏色信息,避免了信息的丟失。3,參考書目[1]丁曉青?漢字識別研究的回顧[J]?電子學(xué)報,2002,30(9).⑵章毓晉.圖像處理和分析基礎(chǔ)[M]?北京:高等教育出版社,2002.[3]
8、王普.圖像處理中關(guān)于漢字粘連字符的分割和背景算法[J].2008(01).[4]KatherineDonal