資源描述:
《基于MSER的場(chǎng)景文字檢測(cè)方法研究——畢業(yè)論文》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、畢業(yè)設(shè)計(jì)中文題目基于MSER的場(chǎng)景文字檢測(cè)方法研究英文題目ResearchaboutTextdetectionmethodwithMSERTechnique院系:計(jì)算機(jī)與信息工程學(xué)院年級(jí)專(zhuān)業(yè):軟件工程(金融方向)姓名:學(xué)號(hào):指導(dǎo)教師:職稱(chēng):年月摘要摘要隨著信息技術(shù)的發(fā)展,數(shù)碼文字圖像信息隨處可見(jiàn),文字檢測(cè)和文字識(shí)別技術(shù)被廣泛應(yīng)用于各個(gè)領(lǐng)域,具有重要的應(yīng)用價(jià)值和經(jīng)濟(jì)價(jià)值。但由于文字存在的形態(tài)千變?nèi)f化,文字檢測(cè)和文字識(shí)別技術(shù)在現(xiàn)階段效果還不是十分出色,仍然還是難題。本文主要研究基于MSER的場(chǎng)景文字檢測(cè)算法。本文第一章首先介紹文字檢測(cè)與文字識(shí)別技術(shù)發(fā)展現(xiàn)狀,第
2、二章對(duì)現(xiàn)階段文字檢測(cè)主流技術(shù)進(jìn)行概述,分為兩節(jié)內(nèi)容,分別對(duì)候選區(qū)域提取和文字/非文字分類(lèi)進(jìn)行概述,第三章詳細(xì)介紹場(chǎng)景文字檢測(cè)方法的實(shí)現(xiàn)原理,第四章對(duì)該算法進(jìn)行系統(tǒng)結(jié)果評(píng)測(cè),第五章對(duì)全文進(jìn)行總結(jié)。本文基本實(shí)現(xiàn)了基于MSER的場(chǎng)景文本檢測(cè)算法,獲得了初步的結(jié)果。雖然目前結(jié)果還有待提高,但本文的算法為后續(xù)進(jìn)一步的深入研究提供了基礎(chǔ)。關(guān)鍵詞:MSER算法;神經(jīng)網(wǎng)絡(luò);文字檢測(cè)IIIABSTRACTABSTRACTWiththedevelopmentofinformationscience,wearesourroundedbydigitaltextandimage.T
3、extdetectionandtextrecognitionhasbeenwidelyusedinvariouskindsoffield,andtheresearchonthistopicifimportantandvaluable.However,duetothefactthetextinimagesareever-chagning,textdetectionandtextrecognitionarestillverychallenging.Thisthesismainlyfocusesontextdetectionalgorithmsbasedonma
4、ximallystableextremalregions(MSER).Firstpartofthisarticalisintoductingthepriorwork.Secondpartistalkingaboutpo-pulartechnique.Thirdpartisdescriptthetheoryweuse.Fourthistheexaminationresultofourmethod.Thelastpartistheconclusionofthisartical.KeyWords:MSERalgorithm;NeuralNetworks;Text
5、detectionIII目錄目錄第1章引言11.1研究背景11.2研究意義21.3難點(diǎn)分析2第2章場(chǎng)景文字檢測(cè)方法概述62.1候選文字區(qū)域提取技術(shù)概述62.2文字與非文字分類(lèi)技術(shù)概述7第3章場(chǎng)景文字檢測(cè)93.1系統(tǒng)概述93.2MSER算法提取原理103.2.1MSER算法概述103.2.2組建樹(shù)算法概述113.2.3組建樹(shù)算法實(shí)現(xiàn)原理123.2.4MSER提取153.3文字與非文字分類(lèi)163.4濾除重復(fù)連通區(qū)域203.5生成候選文本行233.6后處理24第4章系統(tǒng)結(jié)果評(píng)測(cè)274.1評(píng)測(cè)274.2評(píng)測(cè)結(jié)果分析28第5章結(jié)論與展望325.1結(jié)論325.2展望3
6、2參考文獻(xiàn)33致謝1III第1章引言第1章引言1.1研究背景近年來(lái),隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,人類(lèi)進(jìn)入高度信息化的時(shí)代,生活中充滿(mǎn)著大量的數(shù)碼圖像。文字信息普遍存在于我們生活和工作中的每個(gè)角落,是人類(lèi)重要的信息知識(shí)的載體?,F(xiàn)在,數(shù)碼采集設(shè)備普及,使得文字檢測(cè)識(shí)別技術(shù)越來(lái)越具有應(yīng)用價(jià)值。文字檢測(cè)識(shí)別技術(shù)在圖像搜索[1],輔助盲人閱讀[2],AR(AugmentedReality)技術(shù)[3][4],HCI(Human–ComputerInteraction)技術(shù)[5]等情況下有著諸多應(yīng)用。而作為這些應(yīng)用的基礎(chǔ),文字識(shí)別檢測(cè)技術(shù)變得越來(lái)越重要。場(chǎng)景文字提取識(shí)別技
7、術(shù)受到國(guó)內(nèi)外眾多學(xué)者關(guān)注,國(guó)際主流會(huì)議ICDAR(InternationalConferenceonDocumentAnalysisandRecognition)定期舉辦文字提取技術(shù)的競(jìng)賽。許多國(guó)內(nèi)外的企業(yè)巨頭也在該領(lǐng)域投入巨大的人力物力,如:國(guó)外的谷歌、微軟,國(guó)內(nèi)的百度、騰訊、阿里巴巴等知名企業(yè),圖1.1文字檢測(cè)與識(shí)別技術(shù)的系統(tǒng)流程圖1第1章引言1.1研究意義由于文字提取技術(shù)有著諸多應(yīng)用場(chǎng)景,所以該技術(shù)受到工業(yè)界的極大關(guān)注與支持。而文字提取技術(shù)分為以下五個(gè)步驟,如圖1.1。首先輸入一副帶有文字信息的圖像,將文字信息檢測(cè)出來(lái),并標(biāo)記位置,注意這步僅僅檢測(cè)出
8、文字信息的位置,并不判定文字信息內(nèi)容。這里的文字信息很可能是一個(gè)句