資源描述:
《畢業(yè)設(shè)計基于matlab的數(shù)字識別系統(tǒng)設(shè)計.doc》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、基于matlab的數(shù)字識別系統(tǒng)設(shè)計論文1.緒論1.1研究背景1.1.1索書號的簡介索書號是圖書館賦予每一種館藏圖書的號碼,這種號碼具有一定結(jié)構(gòu)并帶有特定的意義。在館藏系中,每種書的索書號是唯一的,可準確地確定館藏圖書在書架上的排列位置,它是讀者查找圖書必要的代碼信息。索書號通常是根據(jù)中國圖書資料分類法編排的【1】——簡稱《中圖法》?!吨袌D法》采拉丁字母和阿拉伯數(shù)字相結(jié)合的混合標記符號。根據(jù)圖書的學科主題,以拉丁字母標記并順序展列出22個基本大類,其中沒有L、M和Y開頭的——參考附錄1中圖法簡表。由于“T工業(yè)技術(shù)”的大類范圍廣泛、內(nèi)容繁多,故又在該類基礎(chǔ)上采用雙位拉丁字
2、母標記出16個二級類目,如TK、TL、TM和TN等。字母之后再用阿拉伯數(shù)字對大類進行細分。如B表示哲學、宗教一大類;B020則表示宗教理論。有的圖書館如清華大學還在圖書分類號碼后添加按照圖書作者姓名所編排的著者號碼,或者是按照圖書進館時間的先后所取用的順序號碼。不同索書號確定排列先后順序的步驟是,先比較分類號碼:如分類號碼相同再比較著者號碼或順序號碼。最后按照字母表和數(shù)字大小的順序排列。1.1.2書庫中圖書查找存在的問題隨著電子計算機和網(wǎng)絡(luò)技術(shù)的發(fā)展,現(xiàn)代圖書館都已經(jīng)廣泛建立電子數(shù)據(jù)庫圖書管理系統(tǒng),方便用戶查找、閱覽書籍。讀者借圖書的流程如圖2所示,一般利用書目查詢系
3、統(tǒng),根據(jù)圖書的書名,出版社,作者以及書的內(nèi)容等在電子數(shù)據(jù)庫中檢索自己需要的圖書,記錄圖書相關(guān)信息。最后,根據(jù)圖書的索書號,快速方便地在書庫中找到相應(yīng)的圖書。但是,經(jīng)常會遇到下列問題:電子數(shù)據(jù)庫系統(tǒng)顯示圖書狀態(tài)為“歸還”,利用檢索到號,卻無法在書庫找到此書。出現(xiàn)這種情況主要有兩個原因:(1)圖書錯位放置,即圖書在書庫中擺放的位置與索書號不一致。(2)圖書已經(jīng)丟失,即雖然電子數(shù)據(jù)庫中顯示圖書狀態(tài)為“歸還”,但實質(zhì)圖書已經(jīng)丟失,并不在書庫中。隨著圖書館藏書數(shù)目的不斷增加,每天借閱的人數(shù)增多,而且有的圖書館發(fā)展成擁有幾個分館,上述問題越來越嚴重。這一方面嚴重降低了圖書館的資源
4、的利用率;另一方面,浪費了讀者的時間,造成了很大麻煩。目前,圖書館主要通過定期的人工檢查發(fā)現(xiàn)書庫中錯位和丟失的圖書。但是,由丁館藏圖書多達上萬,甚至幾十萬,而且每天又都有大量圖書的借出和還入,人工檢查工作量很大,單調(diào)、31重復的工作容易使工作員疲勞,檢查速度比較慢,無法滿足實際的需要。因此,迫切希望開發(fā)索書號自動識別系統(tǒng),實現(xiàn)對書庫中圖書放置位置的自動檢查,并通過索書號識別結(jié)果與電子數(shù)據(jù)庫中圖書信息的比較,找出已經(jīng)丟失的圖書。確保電子數(shù)據(jù)庫中的圖書狀態(tài)與書庫中的一致,以及書庫中的圖書準確排放,從而有效解決上述“用索書號找不到圖書”的問題。1.2.索書號自動識別系統(tǒng)近年
5、來,隨著電子計算機技術(shù)、圖像處理技術(shù)和攝像技術(shù)的迅速發(fā)展,圖像中的文字信息提取系統(tǒng)已經(jīng)成功地應(yīng)用于各個領(lǐng)域。因此,借助其經(jīng)驗,本文研究采用圖像處理和識別技術(shù)實現(xiàn)索書號的自動識別。1.2.1索書號自動識別系統(tǒng)概述系統(tǒng)的硬件由彩色CCD攝像頭,8位圖像采集卡和計算機組成,拍攝的圖像為8位RGB彩色數(shù)字圖像。如圖1-1所示CCD攝像索書號文字圖像分割文字圖像二值化單個字符切分索書號識別圖書排放位置判斷CCD攝像機拍攝排放在書架上的圖書圖像,圖書的圖像出索書號外還有其他內(nèi)容,如出版社的標志,其他文字甚至大塊的污漬等,必須從中分割出僅包含索書號的文字圖像?;叶鹊奈淖謭D像難以直接
6、用于識別,所以講灰度的文字圖像裝換為二值圖像。由于噪聲和五點的干擾,以及光照不均勻的影響,二值化后的文字會發(fā)生粘連,嚴重改變文字的自營。字符切分成單個字符后才進行文字識別。按照上述流程,具體介紹索書號識別的整個過程。1.2.2索書號識別存在的問題及關(guān)鍵技術(shù)索書號識別所涉及的攝像技術(shù),無線通訊技術(shù),電子數(shù)據(jù)庫圖書管理技術(shù),AGV自動導引技術(shù)和圖像處理技術(shù)都已經(jīng)在其他領(lǐng)域有成功應(yīng)用的實例。圖像處理技術(shù)是索書號識別的核心技術(shù),而與相類似的應(yīng)用相比,索書號圖像處理與識別又有其自身顯著的特點和難點。圖書館收集了近幾十年的藏書,不同時代的索書號編寫風格大不相同。本論文選取圖書館的
7、主要類別圖書——印刷體索書號,從圖書館的書架上隨即抽取樣本進行研究。如圖7所示,CCD31攝像頭拍攝的索書號圖像,由于光照不均勻、退色、污跡、噪聲以及其他非索書號文字的存在,大大增加了索書號識別的困難。為了能夠解決上述問題,索書號圖像識別主要由以下4個模塊組成:索書號定位,索書號提取,索書號字符切分和索書號單字識別。第一階段:索書號定位是在圖像中找到包含索書號的圖像區(qū)域,要求該區(qū)域盡可能包含完整的索書號,同時盡量排除非索書號的圖像區(qū)域。由于該階段是解決索書號的區(qū)域查找問題,而沒有涉及單字切分,因此圖像區(qū)域的估計允許有一定誤差。為了包含完整的索書號以及