基于筆畫識別的視頻圖片文字提取方法.pdf

ID：55809359

大?。?18.08 KB

頁數(shù)：5頁

時間：2020-06-03

資源描述：

《基于筆畫識別的視頻圖片文字提取方法.pdf》由會員上傳分享，免費(fèi)在線閱讀，更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。

1、第47卷第3期天津大學(xué)學(xué)報(自然科學(xué)與工程技術(shù)版)V_01．47NO．32014年3月Journ~ofTianjinUniversity(ScienceandTechnology)Mat．2014D0I：10．11784／tdxbz201208001基于筆畫識別的視頻圖片文字提取方法王萍，徐鵬，張藝凡(天津大學(xué)電氣與自動化工程學(xué)院，天津300072)摘要：通過對筆畫的對稱邊緣特點與文字幾何特征的認(rèn)識，根據(jù)二階邊緣檢測算子捕捉邊緣點亮暗變化趨勢的能力，使用高斯型拉普拉斯算子尋找“邊緣點對”，并構(gòu)建來自筆畫等窄帶區(qū)域的“對稱邊緣

2、點對”樣本集．從樣本集的分布規(guī)律中自適應(yīng)地定出文字筆畫搜索窗的尺度及方向．利用最小生成樹算法實現(xiàn)由系列搜索窗得到的所有筆畫子區(qū)域的關(guān)聯(lián)聚類，通過剪枝、偽區(qū)域鑒別和閡值分割，將文字以行(含非水平行)或列的形式提取出來．實驗表明，該方法對復(fù)雜背景下不同的語言類型、亮暗類型、文字行方向及文字尺度具有適應(yīng)性，在ICDAR數(shù)據(jù)集上的查準(zhǔn)率和查全率分別達(dá)到76％和75％．關(guān)鍵詞：基于內(nèi)容圖像檢索；文字筆畫提取；高斯型拉普拉斯變換；最小生成樹中圖分類號：TP391文獻(xiàn)標(biāo)志碼：A文章編號：0493—2137(2014)03．0200—05T

3、extExtractionBasedonStrokeRecognitioninVideoWangPing，XuPeng，ZhangYifan(SchoolofElectricalEngineeringandAutomation，TianjinUniversity，Tianjin300072，China)Abstract．Accordingtogeometricfeaturesoftextsandthefactthatcharacterstrokeshavesymmetricaledges，LaplacianofaGaussi

4、an(LoG)wasemployedforfindingthe‘symmetricaledge—pointpair’．thenthe‘symmetricaledge—pointpairs’samplesetwasconstructed，thereforethescaleandorientationofthedetectwindowweredeter·minedbyanalyzingthesampledistribution．Therelationalclusterofallcharactersub—regionswasobt

5、ainedbyusingtheminimumspanningtree(MST)algorithm，thenthetextlines(includingnon-horizonta1)wereextractedintheformoflinesorrowsafterpruning，falsepositiveelimination，andthresholdsegmentation．Experimentsshowthattheproposedmethodiscapableofhandlingmultilingual，different

6、orientationandmulti—scaleimagesundercomplexbackgroundwitha76％precisionrateanda75％recallrateonICDARdataset．Keywords：content—basedimageretrieval；textextraction；LaplacianofaGaussian；minimalspanningtree近些年，Et益增長的多媒體視頻引起了人們對于通過分析容易發(fā)現(xiàn)，文字筆畫具有寬度的相對視頻信息自動檢索問題的關(guān)注?．視頻圖像文字提取平穩(wěn)

7、性、其雙邊緣的平行性和多方向性，這3個I生質(zhì)首先定位出文字區(qū)域的位置，再通過分割的方法提取幾乎不隨語種、文字的排列方向以及文字尺度發(fā)生變出文字進(jìn)而進(jìn)行文字識別【2J．就視頻圖像中文字區(qū)域化．筆者從這一特點出發(fā)，結(jié)合關(guān)聯(lián)聚類和局部區(qū)域的定位問題而言，一般有基于邊緣的方法、基于紋理的自適應(yīng)分割技術(shù)實現(xiàn)視頻圖像中的文字提?。姆椒ê突谶B通區(qū)域的方法_jJ．更一般地，視頻圖像中的文字在語種、字體、尺1文字筆畫識別度、顏色、文字的間距、分布等方面差異較大，分辨率不一定很高，因而許多研究者為此做了大量工作【4]，1．1筆畫的雙邊緣特點

8、并在提高對多方向、多尺度及復(fù)雜場景的文字區(qū)域定在掃描圖像時，一旦遇到亮背景下的暗文字筆位的適用性方面取得進(jìn)展L5培】．畫，均將歷經(jīng)一個由亮_+暗一亮的過程．如果將由亮收稿日期：2012．08—01；修回日期：2012．10—22．基金項目：國家自然科學(xué)基金資助項目(60865001)．作者

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 5



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件，查看預(yù)覽時可能會顯示錯亂或異常，文件下載后無此問題，請放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤，付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。

基于筆畫識別的視頻圖片文字提取方法.pdf

基于筆畫識別的視頻圖片文字提取方法.pdf

相關(guān)文章

相關(guān)標(biāo)簽