資源描述:
《手寫數(shù)字識(shí)別.doc》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、1.1字符識(shí)別概述OCR(OpticalCharacterRecognition)即光學(xué)字符識(shí)別技術(shù),是通過掃描儀把印刷體或手寫體文稿掃描成圖像,然后識(shí)別成相應(yīng)的計(jì)算機(jī)可直接處理的字符。OCR是模式識(shí)別的一個(gè)分支,按字體分類主要分為印刷體識(shí)別和手寫體識(shí)別兩大類。對(duì)于印刷體識(shí)別又可以分成單一字體單一字號(hào)和多種字體多種字號(hào)幾類。而手寫體識(shí)別又可分為受限手寫體和不受限手寫體兩類;按識(shí)別方式可分為在線識(shí)別和脫機(jī)識(shí)別兩類。字符識(shí)別處理的信息可分為兩大類:一類是文字信息,處理的主要是用各國(guó)家、各民族的文字(如:漢字,英文等)書寫或印刷
2、的文本信息,目前在印刷體和聯(lián)機(jī)手寫方面技術(shù)已趨向成熟,并推出了很多應(yīng)用系統(tǒng);另一類是數(shù)據(jù)信息,主要是由阿拉伯?dāng)?shù)字及少量特殊符號(hào)組成的各種編號(hào)和統(tǒng)計(jì)數(shù)據(jù),如:郵政編碼、統(tǒng)計(jì)報(bào)表、財(cái)務(wù)報(bào)表、銀行票據(jù)等等,處理這類信息的核心技術(shù)是手寫數(shù)字識(shí)別。在整個(gè)OCR領(lǐng)域中,最為困難的就是脫機(jī)自由手寫字符的識(shí)別。到目前為止,盡管人們?cè)诿摍C(jī)手寫英文、漢字識(shí)別的研究中已取得很多可喜成就,但距離實(shí)用還有一定距離。而在手寫數(shù)字識(shí)別這個(gè)方向上,經(jīng)過多年研究,研究工作者已經(jīng)開始把它向各種實(shí)際應(yīng)用推廣,為手寫數(shù)據(jù)的高速自動(dòng)輸入提供了一種解決方案。1.2數(shù)
3、字識(shí)別研究的目的及意義人類社會(huì)己開始進(jìn)入信息時(shí)代,信息產(chǎn)業(yè)的發(fā)展將對(duì)國(guó)家的發(fā)達(dá)和民族的興旺產(chǎn)生重大的影響。因此,世界各國(guó)對(duì)信息產(chǎn)業(yè)的發(fā)展都給予了極大的關(guān)注和重視。人類社會(huì)的不斷進(jìn)步帶來了信息空間的增長(zhǎng)和積累,而計(jì)算機(jī)的出現(xiàn)為現(xiàn)代化信息處理提供了有效的手段。但是,在信息技術(shù)高速發(fā)展的同時(shí),一個(gè)難題也擺在我們面前,那就是計(jì)算機(jī)數(shù)據(jù)處理和網(wǎng)絡(luò)傳輸?shù)母咚俣扰c數(shù)據(jù)輸入的低速度之間的矛盾。目前,人類的許多信息是記錄在紙上的文字圖像,將這些信息輸入計(jì)算機(jī)是非常繁瑣而低效率的工作,這在一定的程度上減緩了社會(huì)信息化的進(jìn)程。因而,作為信息化基
4、礎(chǔ)的數(shù)據(jù)輸入成了計(jì)算機(jī)應(yīng)用中的瓶頸問題。人們接受信息最頻繁的是視覺通道.在日常學(xué)習(xí)和生活中,所處理的信息有75%—85%是視覺信息,其中文字信息愈來愈占重要地位.比如對(duì)各種期刊文獻(xiàn)的閱讀、查找、翻譯:對(duì)各種統(tǒng)計(jì)報(bào)表的匯總、計(jì)算、分析;對(duì)各種函件票證的分揀、傳送、驗(yàn)核等。要實(shí)現(xiàn)對(duì)這些文字信息處理過程的機(jī)械化、自動(dòng)化,其先決條件就是利用計(jì)算機(jī)對(duì)這些文字信息進(jìn)行識(shí)別。字符識(shí)別是利用計(jì)算機(jī)自動(dòng)辨識(shí)印刷在紙上或人寫在紙上的漢字,是模式識(shí)別的一個(gè)重要分支,也是文字識(shí)別領(lǐng)域較為困難的問題之一。本技術(shù)涉及模式識(shí)別、圖像處理、數(shù)字信號(hào)處理、
5、自然語言理解、人工智能、模糊數(shù)學(xué)、信息論、計(jì)算機(jī)、中文信息處理等學(xué)科,是一門綜合性技術(shù),在中文信息處理、辦公室自動(dòng)化、機(jī)器翻譯、人工智能等高技術(shù)領(lǐng)域,都有著重要的實(shí)用價(jià)值和理論意義。因此,手寫數(shù)字的識(shí)別研究有著重大的現(xiàn)實(shí)意義,一旦研究成功并投入應(yīng)用,將產(chǎn)生巨大的社會(huì)和經(jīng)濟(jì)效益。1.3手寫數(shù)字識(shí)別的典型應(yīng)用手寫數(shù)字識(shí)別有著極為廣泛的應(yīng)用前景,這也正是它受到世界各國(guó)的研究工作者重視的一個(gè)主要原因。下面將介紹一些以手寫數(shù)字識(shí)別技術(shù)為基礎(chǔ)的典型應(yīng)用。(一)手寫數(shù)字識(shí)別在大規(guī)模數(shù)據(jù)統(tǒng)計(jì)中的應(yīng)用在大規(guī)模的數(shù)據(jù)統(tǒng)計(jì)[12](如:行業(yè)年鑒
6、、人口普查等)中,需要輸入大量的數(shù)據(jù),以前需要手工輸入,需要耗費(fèi)大量的人力和物力。近年來在這類工作中采用OCR技術(shù)已成為一種趨勢(shì)。因?yàn)樵谶@種應(yīng)用中,數(shù)據(jù)的錄入是集中組織的,所以往往可以通過專門設(shè)計(jì)表格和對(duì)書寫施加限制以便于機(jī)器的自動(dòng)識(shí)別。目前國(guó)內(nèi)的大多數(shù)實(shí)用系統(tǒng)都要求用戶按指定規(guī)范在方格內(nèi)填寫。另外,這些系統(tǒng)往往采用合適的用戶界面對(duì)識(shí)別結(jié)果做全面的檢查,最終保證結(jié)果正確無誤[4]??梢钥闯?,這是一類相對(duì)容易的應(yīng)用,對(duì)識(shí)別核心算法的要求比較低,是目前國(guó)內(nèi)很多單位應(yīng)用開發(fā)的熱點(diǎn)。(二)手寫數(shù)字識(shí)別在財(cái)務(wù)、稅務(wù)、金融領(lǐng)域中的應(yīng)用
7、財(cái)務(wù)、稅務(wù)、金融是手寫數(shù)字識(shí)別大有可為的又一領(lǐng)域。隨著我國(guó)經(jīng)濟(jì)的迅速發(fā)展,每天等待處理的財(cái)務(wù)、稅務(wù)報(bào)表、支票、付款單等越來越多。如果能把它們用計(jì)算機(jī)自動(dòng)處理,無疑可以節(jié)約大量的時(shí)間、金錢和勞力。與上面提到的大規(guī)模數(shù)據(jù)統(tǒng)計(jì)處理相比,在這個(gè)領(lǐng)域的應(yīng)用難度更大,原因有:1、對(duì)識(shí)別的精度要求更高;2、處理的表格通常不止一種,所以一個(gè)系統(tǒng)應(yīng)具有智能地同時(shí)處理若干種表格的能力;3、由于處理貫穿于整個(gè)日常工作之中,書寫應(yīng)盡量按一般習(xí)慣(如:不對(duì)書寫者的寫法做限定,書寫時(shí)允許寫連續(xù)的字串,而不是在固定的方格內(nèi)書寫),這樣對(duì)識(shí)別及預(yù)處理的核
8、心算法要求也提高了。1.4國(guó)內(nèi)外研究現(xiàn)狀手寫體數(shù)字識(shí)別在學(xué)科上屬于模式識(shí)別和人工智能的范疇。在過去的數(shù)十年中,研究者提出了許多識(shí)別方法,目前手寫體數(shù)字識(shí)別方法可以分為兩類:基于結(jié)構(gòu)特征的方法和基于統(tǒng)計(jì)特征的方法。通過幾十年來各國(guó)研究學(xué)者得對(duì)數(shù)字識(shí)別的研究,國(guó)內(nèi)外在手寫識(shí)別上也取得了一定的成就。在我國(guó)郵電