新聞視頻圖像文字定位與切分方法研究

新聞視頻圖像文字定位與切分方法研究

ID:35183055

大?。?.34 MB

頁數(shù):59頁

時間:2019-03-21

新聞視頻圖像文字定位與切分方法研究_第1頁
新聞視頻圖像文字定位與切分方法研究_第2頁
新聞視頻圖像文字定位與切分方法研究_第3頁
新聞視頻圖像文字定位與切分方法研究_第4頁
新聞視頻圖像文字定位與切分方法研究_第5頁
資源描述:

《新聞視頻圖像文字定位與切分方法研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、全日制碩士學(xué)位論文新聞視頻圖像文字定位與切分方法研究申請人姓名:郭超指導(dǎo)教師:王志衡學(xué)位類別:工學(xué)碩士專業(yè)名稱:計算機(jī)科學(xué)與技術(shù)研究方向:圖像處理與模式識別河南理工大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院二○一六年六月中圖分類號:TP391密級:公開UDC:004單位代碼:10460新聞視頻圖像文字定位與切分方法研究ResearchonNewsVideoImageTextLocationandSegmentationAlgorithm申請人姓名郭超申請學(xué)位工學(xué)碩士學(xué)科專業(yè)計算機(jī)科學(xué)與技術(shù)研究方向圖像處理與模式識別導(dǎo)師王志衡職稱副教授提交日期2016.04.20答辯日期2016.06

2、.04河南理工大學(xué)致謝轉(zhuǎn)瞬間,三年的研究生生活即將結(jié)束,回首這三年,不禁百感交集。正值論文完成之際,向所有在學(xué)習(xí)、生活和工作中幫助過我的老師、同學(xué)及親人表示最誠摯的謝意。首先,我要衷心地感謝我的導(dǎo)師王志衡副教授。本文是在王老師的嚴(yán)苛要求和悉心指導(dǎo)下完成的,無論從論文的選題、理論研究方法及最后的論文框架形成都傾注了導(dǎo)師大量的心血。王老師嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)態(tài)度,深厚的學(xué)術(shù)功底及忘我的工作精神給我留下了深刻的印象。感謝導(dǎo)師三年來在生活、工作及科研上對我的幫助和指導(dǎo),三年來的辛勤培養(yǎng)不僅使我在科研上取得了進(jìn)步,而且對我今后的生活及工作都有極大的影響。其次,我還要感謝計算機(jī)學(xué)院302

3、實驗室的各位老師,霍占強(qiáng)老師,姜國權(quán)老師,鄧超老師,劉紅敏老師,王靜老師和賈利琴老師等,感謝他們對我學(xué)習(xí)上和生活上的指導(dǎo)和幫助。同時,我要感謝已畢業(yè)的各位師兄師姐和未畢業(yè)的各位師弟師妹,在學(xué)習(xí)和科研上他們曾給我無私的幫助,與他們的學(xué)術(shù)交流豐富了我的視野,增加了自己的科研興趣。另外,我還要感謝我的室友,感謝他們陪伴我度過美好的三年研究生生活,感謝他們在生活和學(xué)習(xí)上給我的幫助。最后,我要感謝我的家人。在我的求學(xué)道路上,他們一直默默地支持著我,為我提供良好的學(xué)習(xí)和生活條件,給予我無私的愛。衷心地感謝在百忙之中為我評審論文的各位專家,謝謝您們提出的寶貴建議,為我指引了繼續(xù)前

4、進(jìn)的方向。摘要近些年,伴隨著計算機(jī)技術(shù)與多媒體信息技術(shù)的快速發(fā)展,視頻和圖像資源日益豐富起來,正逐漸成為人們進(jìn)行信息交互的主流媒體,如何從這些海量的視頻、圖像中獲取人們感興趣的信息也正逐漸成為多媒體技術(shù)研究者們關(guān)注的熱點。相對于顏色、亮度等低層信息,視頻、圖像中的文字信息屬于高層語義信息,是理解視頻和圖像內(nèi)容的重要線索,同時獲取視頻、圖像中的這些文字信息對于建立基于內(nèi)容的視頻與圖像檢索系統(tǒng)也具有極其重要的價值。新聞視頻中的字幕信息屬于高層語義信息,通常是對某一新聞事件的概括總結(jié),為理解新聞視頻內(nèi)容提供了重要的線索。因此,獲取新聞視頻中的字幕信息,有助于對新聞視頻內(nèi)容

5、的自動標(biāo)注,同時也有利于快速建立基于內(nèi)容的新聞視頻索引系統(tǒng)。本文主要面向新聞視頻圖像,針對文字提取的相關(guān)關(guān)鍵技術(shù)展開研究,主要包括新聞視頻圖像中標(biāo)題字幕區(qū)域檢測定位算法研究及文字行切分算法研究,并獲得了一些研究成果,具體工作如下:(1)新聞視頻圖像中,字幕背景通常復(fù)雜多變,造成直接獲取字幕信息具有一定的難度,檢測定位字幕區(qū)域是獲取字幕信息的重要前提。本文主要面向新聞視頻圖像中標(biāo)題字幕,基于圖像中文字豐富的邊緣特性,并結(jié)合新聞視頻圖像中字幕的屬性特征(位置、尺寸等),提出了一種基于最大特征得分區(qū)域(MaximumFeatureScoreRegion,MFSR)的標(biāo)題字

6、幕檢測定位算法。相比于傳統(tǒng)的基于投影直方圖的檢測定位算法,本文算法的檢測定位精度更高,同時該算法可以應(yīng)用于電影、電視劇等視頻圖像對話字幕的檢測定位,且對不同國家的語言文字不敏感。(2)文字識別準(zhǔn)確率對于準(zhǔn)確地獲取文字信息具有極其重要的影響,為了降低視頻圖像文字的識別難度,提高文字識別準(zhǔn)確率,針對文字切分算法進(jìn)行了研究。本文主要以新聞視頻圖像中的標(biāo)題字幕行(以中文漢字為主)為切分對象,結(jié)合字幕行的結(jié)構(gòu)特點,提出了一種基于模板匹配的文字切分算法。該算法以文字整體分布為對象,根據(jù)模板函數(shù)的響應(yīng)值確定合適的切分路徑,有效地克服了傳統(tǒng)算法易分裂漢字的問題。關(guān)鍵詞:新聞視頻,文

7、字定位,文字切分,圖像檢索,最大特征得分區(qū)域,模板匹配。IAbstractInrecentyears,withtherapiddevelopmentofcomputertechnologyandmultimediatechnology,videoandimageresourcesareincreasinglyrichandgraduallybecomethemainstreammediaforinformationexchange.Howtoobtaintheinterestinformationfromthesemassiveamountsofvideosan

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。