資源描述:
《基于vc++的數(shù)字識(shí)別系統(tǒng)的論文》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、基于VC++的數(shù)字識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)第1章緒論1.1數(shù)字識(shí)別概述模式識(shí)別是六十年代初迅速發(fā)展起來的一門學(xué)科。由于它研究的是如何用機(jī)器來實(shí)現(xiàn)人(及某些動(dòng)物)對(duì)事物的學(xué)習(xí)、識(shí)別和判斷能力,因而受到了很多科技領(lǐng)域研究人員的注意,成為人工智能研究的一個(gè)重要方面。字符識(shí)別是模式識(shí)別的一個(gè)傳統(tǒng)研究領(lǐng)域。從50年代開始,許多的研究者就在這一研究領(lǐng)域開展了廣泛的探索,并為模式識(shí)別的發(fā)展產(chǎn)生了積極的影響。字符識(shí)別一般可以分為兩類:1.聯(lián)機(jī)字符識(shí)別;2.光學(xué)字符識(shí)別(OpticalChara-cterRecognition,OCR)或
2、稱離線字符識(shí)別。在聯(lián)機(jī)字符識(shí)別中,計(jì)算機(jī)能夠通過與計(jì)算機(jī)相連的輸入設(shè)備獲得輸入字符筆劃的順序、筆劃的方向以及字符的形狀,所以相對(duì)OCR來說它更容易識(shí)別一些。但聯(lián)機(jī)字符識(shí)別有一個(gè)重要的不足就是要求輸入者必須在指定的設(shè)備上書寫,然而人們?cè)谏钪写蟛糠值臅鴮懬闆r是不滿足這一要求的,比如人們填寫各種表格資料,開具支票等。如果需要計(jì)算機(jī)去認(rèn)識(shí)這些己經(jīng)成為文字的東西,就需要OCR技術(shù)。比起聯(lián)機(jī)字符識(shí)別來,OCR不要求書寫者在特定輸入設(shè)備上書寫,它可以與平常一樣書寫,所以O(shè)CR的應(yīng)用更為廣泛。OCR所使用的輸入設(shè)備可以是任何一種圖
3、像采集設(shè)備,如CCD、掃描儀、數(shù)字相機(jī)等。通過使用這類采集設(shè)備,OCR系統(tǒng)將書寫者已寫好的文字作為圖像輸入到計(jì)算機(jī)中,然后由計(jì)算機(jī)去識(shí)別。由于OCR的輸入只是簡(jiǎn)單的一副圖像,它就不能像聯(lián)機(jī)輸入那樣比較容易的從物理特性上獲得字符筆劃的順序信息,因此OCR是一個(gè)更具挑戰(zhàn)性的問題。數(shù)字識(shí)別是多年來的研究熱點(diǎn),也是字符識(shí)別中的一個(gè)特別問題,它是本文研究的重點(diǎn)。數(shù)字識(shí)別在特定的環(huán)境下應(yīng)用特別廣泛,如郵政編碼自動(dòng)識(shí)別系統(tǒng),稅表和銀行支票自動(dòng)處理系統(tǒng)等。一般情況下,當(dāng)涉及到數(shù)字識(shí)別時(shí),人們往往要求識(shí)別器有很高的識(shí)別可靠性,特別是有
4、關(guān)金額的數(shù)字識(shí)別時(shí),如支票中填寫的金額部分,更是如此。因此針對(duì)這類問題的處理系統(tǒng)設(shè)計(jì)的關(guān)鍵環(huán)節(jié)之一就是設(shè)計(jì)出高可靠性和高識(shí)別率的數(shù)字識(shí)別方法。然而可以說還沒有哪個(gè)數(shù)字識(shí)別器達(dá)到完美的識(shí)別效果。在過去的數(shù)十年中,研究者們提出了許許多多的識(shí)別方法。按使用的特征不同,這些方法可以分為兩類:42基于VC++的數(shù)字識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)基于結(jié)構(gòu)特征的方法和基于統(tǒng)計(jì)特征的方法。結(jié)構(gòu)特征通常包括圓、端點(diǎn)、交叉點(diǎn)、筆劃、輪廓等,統(tǒng)計(jì)特征通常包括點(diǎn)密度的測(cè)量、矩、特征區(qū)域等,一般來說,兩類特征各有優(yōu)勢(shì)。例如,使用統(tǒng)計(jì)特征的分類器易于訓(xùn)練
5、,而且對(duì)于使用統(tǒng)計(jì)特征的分類器,在給定的訓(xùn)練集上能夠得到相對(duì)較高的識(shí)別率,而結(jié)構(gòu)特征的主要優(yōu)點(diǎn)之一是能描述字符的結(jié)構(gòu),在識(shí)別過程中能有效地結(jié)合幾何和結(jié)構(gòu)的知識(shí),因此能夠得到可靠性較高的識(shí)別結(jié)果。1.2神經(jīng)網(wǎng)絡(luò)在數(shù)字識(shí)別中的應(yīng)用神經(jīng)網(wǎng)絡(luò)模型用于模擬人腦神經(jīng)元活動(dòng)的過程。其中包括對(duì)信息的加工、處理、存儲(chǔ)和搜索等過程,它具有如下基本特點(diǎn):1、神經(jīng)網(wǎng)絡(luò)具有分布式存儲(chǔ)信息的特點(diǎn)。它存儲(chǔ)信息的方式與傳統(tǒng)的計(jì)算機(jī)的思維方式是不同的,一個(gè)信息不是存在一個(gè)地方,而是分布在不同的位置。網(wǎng)絡(luò)的某一部分也不只存儲(chǔ)一個(gè)信息,它的信息是分布式存
6、儲(chǔ)的。神經(jīng)網(wǎng)絡(luò)是用大量神經(jīng)元之間的連接及對(duì)各連接權(quán)值的分布來表示特定的信息。因此,這種分布式存儲(chǔ)方式即使當(dāng)局部網(wǎng)絡(luò)受損時(shí),仍具有能夠恢復(fù)原來信息的優(yōu)點(diǎn)。2、神經(jīng)網(wǎng)絡(luò)對(duì)信息的處理及推理的過程具有并行的特點(diǎn)。每個(gè)神經(jīng)元都可以根據(jù)接收到的信息作獨(dú)立的運(yùn)算和處理,然后將結(jié)果傳輸出去,這體現(xiàn)了一種并行處理。神經(jīng)網(wǎng)絡(luò)對(duì)于一個(gè)特定的輸入模式,通過前向計(jì)算產(chǎn)生一個(gè)輸出模式,各個(gè)輸出節(jié)點(diǎn)代表的邏輯概念被同時(shí)計(jì)算出來。在輸出模式中,通過輸出節(jié)點(diǎn)的比較和本身信號(hào)的強(qiáng)弱而得到特定的解,同時(shí)排出其余的解。這體現(xiàn)了神經(jīng)網(wǎng)絡(luò)并行推理的特點(diǎn)。3、神
7、經(jīng)網(wǎng)絡(luò)對(duì)信息的處理具有自組織、自學(xué)習(xí)的特點(diǎn)。神經(jīng)網(wǎng)絡(luò)中各神經(jīng)元之間的連接強(qiáng)度用權(quán)值大小來表示,這種權(quán)值可以事先定出,也可以為適應(yīng)周圍環(huán)境而不斷地變化,這種過程稱為神經(jīng)元的學(xué)習(xí)過程。神經(jīng)網(wǎng)絡(luò)所具有的自學(xué)習(xí)過程模擬了人的形象思維方法,這是與傳統(tǒng)符號(hào)邏輯完全不同的一種非邏輯非語言的方法。在神經(jīng)網(wǎng)絡(luò)研究的歷史進(jìn)程中,它在模式識(shí)別方面的應(yīng)用一直是最活躍和最成功的領(lǐng)域。神經(jīng)網(wǎng)絡(luò)與它在模式識(shí)別中的應(yīng)用是息息相關(guān),密不可分的。幾乎可以說,神經(jīng)網(wǎng)絡(luò)模式識(shí)別研究的發(fā)展史貫穿了整個(gè)神經(jīng)網(wǎng)絡(luò)的研究歷程。目前,隨著計(jì)算機(jī)的迅速發(fā)展,性能價(jià)格比
8、的不斷提高,模式識(shí)別技術(shù)己經(jīng)從理論探討為主發(fā)展到大量的實(shí)際應(yīng)用,人們將更多的注意力開始轉(zhuǎn)向那些用于語音,圖像、機(jī)器人以及人工智能等的模式識(shí)別實(shí)際問題。解決這些問題的關(guān)鍵是需要進(jìn)行復(fù)雜而龐大的實(shí)時(shí)數(shù)據(jù)處理,而現(xiàn)有計(jì)算機(jī)的存貯容量及計(jì)算復(fù)雜性的局限,使得真正實(shí)時(shí)化的應(yīng)用受阻。這種面向?qū)崟r(shí)應(yīng)用的模式識(shí)別問題促使人們開始將并行處理的神經(jīng)網(wǎng)絡(luò)應(yīng)到模式識(shí)別