文獻(xiàn)綜述-李娜

ID：35506908

大小：56.91 KB

頁數(shù)：3頁

時間：2019-03-25

資源描述：

《文獻(xiàn)綜述-李娜》由會員上傳分享，免費在線閱讀，更多相關(guān)內(nèi)容在工程資料-天天文庫。

1、文獻(xiàn)綜述圖像處理包含了一個人的許多有用信息，其作為一種簡明美觀的信息載體在現(xiàn)代商務(wù)活動中扮演著重要的角色。大量圖像信息給人們帶來方便的同時也帶來了口常管理的麻煩，很多手機(jī)和PDA可用于名片管理，但能實現(xiàn)名片的自動化輸入的并不多，或者效果還不英理想。本文以名片的識別和信息提取為課題，主要研究了圖像的分割、識別和信息提取及理解的相關(guān)算法和實現(xiàn)。本文首先介紹名片識別系統(tǒng)的總體系統(tǒng)，包括圖像的預(yù)處理、圖像版而的分析、圖像的字符分割、字符的識別、內(nèi)容信息的理解。然后在對組成框架的各個模塊和過程進(jìn)行介紹和說明，并且對涉及到的相關(guān)算法進(jìn)行闡述和比較，其屮重點介紹圖

2、像屮文字區(qū)塊的分制和名片內(nèi)容的理解。1，研究背景近年來，隨著信息技術(shù)的進(jìn)步，尤其是人工智能的￡速發(fā)展，在字符識別領(lǐng)域已取得了對觀的成就，進(jìn)入實用化階段。OCR是OpticalCharacterRecognition的簡稱，指光學(xué)字符識別技術(shù)，是機(jī)器視覺技術(shù)研究和應(yīng)用中的一個重要領(lǐng)域。光學(xué)字符識別技術(shù)的工作原理是通過掃描儀、數(shù)碼相機(jī)或手機(jī)等光學(xué)輸入設(shè)備獲取紙張上的文字圖片信息，采用光學(xué)的方式將文檔資料轉(zhuǎn)換成原始黑口點陣的圖像文件，利用各種模式識別算法分析文字形態(tài)特征,判斷和識別出字符文字，通過識別軟件將圖像中的文字轉(zhuǎn)換成文木格式，并按通用格式存儲在文本

3、文件或者數(shù)據(jù)庫當(dāng)中，還可以利用文字處理或者編輯軟件等進(jìn)一步加工。OCR技術(shù)是一種圖像信息數(shù)字化的過程，這個過程幫助人們以低成木、快速度、高質(zhì)量地將文檔資料和各類紙介信息進(jìn)行數(shù)字化，推進(jìn)信息資源的開發(fā)和利用，進(jìn)一步方便人們的生活、學(xué)習(xí)和工作。文本的名片圖像的識別是OCR研究中的一個例子，OCR的研究成果使得名片識別系統(tǒng)的自動登陸成為可能。2,研究思路數(shù)字圖像處理技術(shù)主要包括三個方面，一是前期的預(yù)處理，二是對處理后的結(jié)果進(jìn)行識別，三是對識別后的結(jié)果進(jìn)行信息提取。通常一個名片識別系統(tǒng)由以下幾個部分組成；預(yù)處理只是為了去除噪聲，加強(qiáng)有用的信息，并對輸入測量儀

4、器或其他因索所引起的退化現(xiàn)象進(jìn)行修復(fù)。通常，它包括對原始圖像的去噪、傾斜校正，二值化等。預(yù)處理的方法也是因噪聲的不同會稍有區(qū)別。比如字符分割和特征提取兩部分都有較好的抗噪聲能力，這一部分并不是必需的。版面分析主要是把文字和圖像部分分開，它是對名片圖像總體分析，識別出文本段落,圖像，表格等。在名片識別系統(tǒng)屮，只是識別出文本區(qū)域，為接下來的文字識別作準(zhǔn)備。字符分割是字符識別技術(shù)的一個難點也是關(guān)鍵技術(shù)之一。它是字符識別的前提，字符分割的好壞直接影響到字符的識別率。它是在行分割的詢提下繼續(xù)識別一個一個字，因為名片識別主要針對的是印刷體文字，所以這一塊也是采用

5、通用的OCR印刷體字符識別方法。特征提取部分是名片識別系統(tǒng)的關(guān)鍵部分，特征圖區(qū)的好壞，是決定字符識別率高低的最關(guān)鍵的要素。這是任何一個識別系統(tǒng)成功與否的關(guān)鍵，也是模式識別領(lǐng)域屮人們研究的熱點。2,本文的優(yōu)化處理傳統(tǒng)的圖像識別都是先對彩色圖像進(jìn)行灰度化、二值化、平滑、去噪聲等一些預(yù)處理,然后再對得到的二值圖像進(jìn)行版面分析、分割和識別，1血對版面復(fù)雜的名片圖像進(jìn)行了版面分析和研究，卻是針對掃描儀獲取的名片圖像。而在手機(jī)拍攝圖像的過程屮，由于光照、背景和拍攝本身的原因，可能會使名片圖像產(chǎn)生幾何變形，名片的矩形邊框在拍攝獲得圖像中不再是矩形，變成了不規(guī)則的四

6、邊形，有的甚至產(chǎn)牛扭曲；另外，名片圖形中的背景顏色不一，圖形、文字、線條交錯，使得直接對名片圖像進(jìn)行二值化處理的效果并不理想，甚至無法處理，既可能丟失一些冇用信息，也給后面的分割和識別工作帶來了很多困難。分析樣木圖像可以看出，由于無法保證攝像頭與名片平面相平行，使得名片圖像發(fā)生了形變，其小名片的外圍矩形邊框發(fā)牛形變比較明顯，變成了非常不規(guī)則的四邊形，有的邊框甚至不再是總線，但從局部看，名片圖像中的字符塊圖像和圖形(LOGO等)塊等關(guān)鍵信息局部圖像發(fā)生的形變卻不是太明顯，許多識別算法町以進(jìn)行有效處理。本文主耍針對文字區(qū)塊的分割問題介紹一種方法，直接在手

7、機(jī)攝像頭獲取的彩色名片圖像的棊礎(chǔ)匕利用四個方向的sobel算子進(jìn)行邊緣檢測，得到四個方向的邊緣圖像，再在二值化的邊緣圖上求連通元索，然后根據(jù)連通元素的特征提找出文字區(qū)塊的位置，最后在原彩色名片圖像小提取出文字區(qū)塊。山于利用的是彩色圖像的邊緣特征，因而可以在多背景的情況下，從名片圖像中捉取出文字區(qū)塊，包括了不同顏色、不同字體或者不同種語言的文字。該方法很好的保簾了文字的顏色信息，避免了信息的丟失。3,參考書目[1]丁曉青?漢字識別研究的回顧[J]?電子學(xué)報,2002,30(9).⑵章毓晉.圖像處理和分析基礎(chǔ)[M]?北京：高等教育出版社，2002.[3]

8、王普.圖像處理中關(guān)于漢字粘連字符的分割和背景算法[J].2008(01).[4]KatherineDonal

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 / 3



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件，查看預(yù)覽時可能會顯示錯亂或異常，文件下載后無此問題，請放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤，付費完成后未能成功下載的用戶請聯(lián)系客服處理。

文獻(xiàn)綜述-李娜

文獻(xiàn)綜述-李娜

相關(guān)文章

相關(guān)標(biāo)簽