基于筆畫識別的視頻圖片文字提取方法.pdf

基于筆畫識別的視頻圖片文字提取方法.pdf

ID:55809359

大?。?18.08 KB

頁數(shù):5頁

時間:2020-06-03

基于筆畫識別的視頻圖片文字提取方法.pdf_第1頁
基于筆畫識別的視頻圖片文字提取方法.pdf_第2頁
基于筆畫識別的視頻圖片文字提取方法.pdf_第3頁
基于筆畫識別的視頻圖片文字提取方法.pdf_第4頁
基于筆畫識別的視頻圖片文字提取方法.pdf_第5頁
資源描述:

《基于筆畫識別的視頻圖片文字提取方法.pdf》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。

1、第47卷第3期天津大學(xué)學(xué)報(自然科學(xué)與工程技術(shù)版)V_01.47NO.32014年3月Journ~ofTianjinUniversity(ScienceandTechnology)Mat.2014D0I:10.11784/tdxbz201208001基于筆畫識別的視頻圖片文字提取方法王萍,徐鵬,張藝凡(天津大學(xué)電氣與自動化工程學(xué)院,天津300072)摘要:通過對筆畫的對稱邊緣特點與文字幾何特征的認(rèn)識,根據(jù)二階邊緣檢測算子捕捉邊緣點亮暗變化趨勢的能力,使用高斯型拉普拉斯算子尋找“邊緣點對”,并構(gòu)建來自筆畫等窄帶區(qū)域的“對稱邊緣

2、點對”樣本集.從樣本集的分布規(guī)律中自適應(yīng)地定出文字筆畫搜索窗的尺度及方向.利用最小生成樹算法實現(xiàn)由系列搜索窗得到的所有筆畫子區(qū)域的關(guān)聯(lián)聚類,通過剪枝、偽區(qū)域鑒別和閡值分割,將文字以行(含非水平行)或列的形式提取出來.實驗表明,該方法對復(fù)雜背景下不同的語言類型、亮暗類型、文字行方向及文字尺度具有適應(yīng)性,在ICDAR數(shù)據(jù)集上的查準(zhǔn)率和查全率分別達(dá)到76%和75%.關(guān)鍵詞:基于內(nèi)容圖像檢索;文字筆畫提取;高斯型拉普拉斯變換;最小生成樹中圖分類號:TP391文獻(xiàn)標(biāo)志碼:A文章編號:0493—2137(2014)03.0200—05T

3、extExtractionBasedonStrokeRecognitioninVideoWangPing,XuPeng,ZhangYifan(SchoolofElectricalEngineeringandAutomation,TianjinUniversity,Tianjin300072,China)Abstract.Accordingtogeometricfeaturesoftextsandthefactthatcharacterstrokeshavesymmetricaledges,LaplacianofaGaussi

4、an(LoG)wasemployedforfindingthe‘symmetricaledge—pointpair’.thenthe‘symmetricaledge—pointpairs’samplesetwasconstructed,thereforethescaleandorientationofthedetectwindowweredeter·minedbyanalyzingthesampledistribution.Therelationalclusterofallcharactersub—regionswasobt

5、ainedbyusingtheminimumspanningtree(MST)algorithm,thenthetextlines(includingnon-horizonta1)wereextractedintheformoflinesorrowsafterpruning,falsepositiveelimination,andthresholdsegmentation.Experimentsshowthattheproposedmethodiscapableofhandlingmultilingual,different

6、orientationandmulti—scaleimagesundercomplexbackgroundwitha76%precisionrateanda75%recallrateonICDARdataset.Keywords:content—basedimageretrieval;textextraction;LaplacianofaGaussian;minimalspanningtree近些年,Et益增長的多媒體視頻引起了人們對于通過分析容易發(fā)現(xiàn),文字筆畫具有寬度的相對視頻信息自動檢索問題的關(guān)注?.視頻圖像文字提取平穩(wěn)

7、性、其雙邊緣的平行性和多方向性,這3個I生質(zhì)首先定位出文字區(qū)域的位置,再通過分割的方法提取幾乎不隨語種、文字的排列方向以及文字尺度發(fā)生變出文字進(jìn)而進(jìn)行文字識別【2J.就視頻圖像中文字區(qū)域化.筆者從這一特點出發(fā),結(jié)合關(guān)聯(lián)聚類和局部區(qū)域的定位問題而言,一般有基于邊緣的方法、基于紋理的自適應(yīng)分割技術(shù)實現(xiàn)視頻圖像中的文字提?。姆椒ê突谶B通區(qū)域的方法_jJ.更一般地,視頻圖像中的文字在語種、字體、尺1文字筆畫識別度、顏色、文字的間距、分布等方面差異較大,分辨率不一定很高,因而許多研究者為此做了大量工作【4],1.1筆畫的雙邊緣特點

8、并在提高對多方向、多尺度及復(fù)雜場景的文字區(qū)域定在掃描圖像時,一旦遇到亮背景下的暗文字筆位的適用性方面取得進(jìn)展L5培】.畫,均將歷經(jīng)一個由亮_+暗一亮的過程.如果將由亮收稿日期:2012.08—01;修回日期:2012.10—22.基金項目:國家自然科學(xué)基金資助項目(60865001).作者

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。