ocr：不可忽視的智能基礎(chǔ)

ID：30986359

大?。?3.50 KB

頁數(shù)：3頁

時(shí)間：2019-01-05

資源描述：

《ocr：不可忽視的智能基礎(chǔ)》由會(huì)員上傳分享，免費(fèi)在線閱讀，更多相關(guān)內(nèi)容在工程資料-天天文庫。

1、OCR：不可忽視的智能基礎(chǔ)如今在紛繁復(fù)雜的金融領(lǐng)域，利用各種證件的ecu技術(shù)結(jié)合數(shù)據(jù)分析，對(duì)于提升金融行業(yè)尤其是互聯(lián)網(wǎng)金融整體業(yè)務(wù)流程的效率，降低客戶的人力成本，收效顯著。什么是Ku?如何利用？等一系列：:題隨之浮出水面。如今我們不得不正視這樣一個(gè)事實(shí)：人們每天都被文字包圍，像辦公文件、上課板書、商品介紹等都是由文字組成的，并口這些文字在某一程度上也是語音交互的基礎(chǔ)，而這其屮關(guān)乎一個(gè)關(guān)鍵技術(shù)一一臨亠光學(xué)字符識(shí)別。什么是0?U是指光學(xué)設(shè)備（掃描儀、數(shù)碼相機(jī)等）檢查紙上打印的字符，通過檢測暗、亮的模式確定其形狀，然后用字符識(shí)別方法將形狀翻譯成計(jì)算機(jī)文字的過程，其本質(zhì)就是利用光學(xué)

2、設(shè)備去捕獲圖像并識(shí)別文字，將人眼的能力延伸到機(jī)器上。此概念是在B年由德國科學(xué)家最先提出來的，后來美國科學(xué)家也提出了利用技術(shù)對(duì)文字進(jìn)行識(shí)別的想法。在2?世紀(jì)1?年代，M就開始利用Ku技術(shù)實(shí)現(xiàn)各類文檔的數(shù)字化；到了■?年代，平板掃描儀的誕生更是讓tCu進(jìn)入了商用階段。但不管是哪個(gè)階段，那時(shí)的ecu設(shè)備對(duì)于文字背景的要求非常之高，也需要很好的成像質(zhì)量。?Cu的工作原理一般來講，Ku的工作原理包括四個(gè)部分，分別是：影像輸入，通過光學(xué)設(shè)備將圖片轉(zhuǎn)入計(jì)算機(jī)后，系統(tǒng)會(huì)對(duì)圖片進(jìn)行一些處理，包括字符格式的分離、二值化處理、圖像降噪、傾斜校止、文字特征抽取等，以提升圖片的精確度；對(duì)比識(shí)別，根據(jù)

3、字符的不同特征，將Z與數(shù)據(jù)庫進(jìn)行對(duì)比,并利用對(duì)比后的識(shí)別文字與其可能的相似候選字，根據(jù)前后的識(shí)別文字找出最合乎邏輯的詞，再作出更正，以加強(qiáng)比對(duì)的正確性；人工校正，目前為止還沒有一款軟件的文字識(shí)別是百分之百的，所以還需要用戶親自校止，確保輸出的準(zhǔn)確性；影像輸出到Grl、I”、dll等格式。現(xiàn)實(shí)中，ecu的發(fā)展其實(shí)已經(jīng)相當(dāng)完善，不過隨著人們需求的變更，此種臨已經(jīng)不能滿足人們的要求，而在當(dāng)前自然環(huán)境是人們最為關(guān)注的新點(diǎn)。自然環(huán)境臨進(jìn)展相比于傳統(tǒng)的ecu,自然環(huán)境ecu最難的部分在于文本檢測（將文字從圖片中提取出來），因?yàn)樗哂袠O大的多樣性和明顯的不確定性。例如文字中包含多種語言，

4、每種語言含有多種字母，每個(gè)字母又可以有不同的大小、字體、顏色、亮度、對(duì)比度、排列和對(duì)齊方式等；因拍攝圖像的隨意性，文字區(qū)域還可能會(huì)產(chǎn)生變形、模糊斷裂等現(xiàn)象。另外，背景也是一大干擾因素，例如文字區(qū)域附近有非常復(fù)雜的紋理;非文字區(qū)域有著跟文字區(qū)域非常相似的紋理，比如窗戶、樹葉、柵欄、磚墻等。文本檢測首先要從圖像中切割出可能存在的文字，即候選連通區(qū)域,目前被采取最多的方法是isa（最大平穩(wěn)極值區(qū)域）。當(dāng)然也有團(tuán)隊(duì)在此基礎(chǔ)上開發(fā)出了自己的一套算法，例如微軟研究院在傳統(tǒng)檢測方法a（極值區(qū)域）和ISCU基礎(chǔ)之上采用了對(duì)比極值區(qū)域CEu（3—/IL.叫3）,0是與周圍的背景有一定對(duì)比度的

5、極值區(qū)域，在低對(duì)比度的圖像上比KCu效果更好，而且獲得的候選連通區(qū)域數(shù)量遠(yuǎn)小于提高了算法的效率。并且，為了提高所獲得連通區(qū)域的質(zhì)量，微軟乂增加一個(gè)算法環(huán)節(jié)去增強(qiáng)CCUo最后采取了一套基于淺層神經(jīng)網(wǎng)絡(luò)的文字/非文字分類算法，進(jìn)一步提高了對(duì)于連通區(qū)域字符的辨認(rèn)率。?Cu的應(yīng)用前景不管是傳統(tǒng)臨，還是自然環(huán)境臨，其參與者還是不少的。在國內(nèi),涉足臨的企業(yè)主要有漢王、文通、百度等，國外的像仏、微軟等。此外，市面上也有不少ecu產(chǎn)品，傳統(tǒng)的臨產(chǎn)品有尚書、漢王等，自然環(huán)境0的冇百度翻譯、翻譯，實(shí)用性相當(dāng)不錯(cuò)。論起eu的應(yīng)用前景，僅看其隸屬于計(jì)算機(jī)視覺領(lǐng)域的一個(gè)分支，再聯(lián)系到當(dāng)前人工智能的發(fā)

6、展，其前景可想而知。除了翻譯、智能購物以外,?Cu未來最大的發(fā)展?jié)摿υ谟谌藱C(jī)交互。眾所周知，人機(jī)交互一直是研究者追求的東西，但是目前也僅僅做到了語音交互和肢體交互。文字代表了人類的所有智慧與思想，如果機(jī)器人能夠進(jìn)行文字識(shí)別，那將能夠進(jìn)一步獲取知識(shí)、學(xué)習(xí)人類，進(jìn)而與人類進(jìn)行更為自然的交互，或是協(xié)助人類工作，提高效率。

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 / 3



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件，查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常，文件下載后無此問題，請(qǐng)放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤，付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。

ocr：不可忽視的智能基礎(chǔ)

ocr：不可忽視的智能基礎(chǔ)

相關(guān)文章

相關(guān)標(biāo)簽