ocr:不可忽視的智能基礎

ocr:不可忽視的智能基礎

ID:30986359

大小:63.50 KB

頁數:3頁

時間:2019-01-05

ocr:不可忽視的智能基礎_第1頁
ocr:不可忽視的智能基礎_第2頁
ocr:不可忽視的智能基礎_第3頁
資源描述:

《ocr:不可忽視的智能基礎》由會員上傳分享,免費在線閱讀,更多相關內容在工程資料-天天文庫

1、OCR:不可忽視的智能基礎如今在紛繁復雜的金融領域,利用各種證件的ecu技術結合數據分析,對于提升金融行業(yè)尤其是互聯(lián)網金融整體業(yè)務流程的效率,降低客戶的人力成本,收效顯著。什么是Ku?如何利用?等一系列::題隨之浮出水面。如今我們不得不正視這樣一個事實:人們每天都被文字包圍,像辦公文件、上課板書、商品介紹等都是由文字組成的,并口這些文字在某一程度上也是語音交互的基礎,而這其屮關乎一個關鍵技術一一臨亠光學字符識別。什么是0?U是指光學設備(掃描儀、數碼相機等)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程,其本質就是利用光學

2、設備去捕獲圖像并識別文字,將人眼的能力延伸到機器上。此概念是在B年由德國科學家最先提出來的,后來美國科學家也提出了利用技術對文字進行識別的想法。在2?世紀1?年代,M就開始利用Ku技術實現各類文檔的數字化;到了■?年代,平板掃描儀的誕生更是讓tCu進入了商用階段。但不管是哪個階段,那時的ecu設備對于文字背景的要求非常之高,也需要很好的成像質量。?Cu的工作原理一般來講,Ku的工作原理包括四個部分,分別是:影像輸入,通過光學設備將圖片轉入計算機后,系統(tǒng)會對圖片進行一些處理,包括字符格式的分離、二值化處理、圖像降噪、傾斜校止、文字特征抽取等,以提升圖片的精確度;對比識別,根據

3、字符的不同特征,將Z與數據庫進行對比,并利用對比后的識別文字與其可能的相似候選字,根據前后的識別文字找出最合乎邏輯的詞,再作出更正,以加強比對的正確性;人工校正,目前為止還沒有一款軟件的文字識別是百分之百的,所以還需要用戶親自校止,確保輸出的準確性;影像輸出到Grl、I”、dll等格式?,F實中,ecu的發(fā)展其實已經相當完善,不過隨著人們需求的變更,此種臨已經不能滿足人們的要求,而在當前自然環(huán)境是人們最為關注的新點。自然環(huán)境臨進展相比于傳統(tǒng)的ecu,自然環(huán)境ecu最難的部分在于文本檢測(將文字從圖片中提取出來),因為它具有極大的多樣性和明顯的不確定性。例如文字中包含多種語言,

4、每種語言含有多種字母,每個字母又可以有不同的大小、字體、顏色、亮度、對比度、排列和對齊方式等;因拍攝圖像的隨意性,文字區(qū)域還可能會產生變形、模糊斷裂等現象。另外,背景也是一大干擾因素,例如文字區(qū)域附近有非常復雜的紋理;非文字區(qū)域有著跟文字區(qū)域非常相似的紋理,比如窗戶、樹葉、柵欄、磚墻等。文本檢測首先要從圖像中切割出可能存在的文字,即候選連通區(qū)域,目前被采取最多的方法是isa(最大平穩(wěn)極值區(qū)域)。當然也有團隊在此基礎上開發(fā)出了自己的一套算法,例如微軟研究院在傳統(tǒng)檢測方法a(極值區(qū)域)和ISCU基礎之上采用了對比極值區(qū)域CEu(3—/IL.叫3),0是與周圍的背景有一定對比度的

5、極值區(qū)域,在低對比度的圖像上比KCu效果更好,而且獲得的候選連通區(qū)域數量遠小于提高了算法的效率。并且,為了提高所獲得連通區(qū)域的質量,微軟乂增加一個算法環(huán)節(jié)去增強CCUo最后采取了一套基于淺層神經網絡的文字/非文字分類算法,進一步提高了對于連通區(qū)域字符的辨認率。?Cu的應用前景不管是傳統(tǒng)臨,還是自然環(huán)境臨,其參與者還是不少的。在國內,涉足臨的企業(yè)主要有漢王、文通、百度等,國外的像仏、微軟等。此外,市面上也有不少ecu產品,傳統(tǒng)的臨產品有尚書、漢王等,自然環(huán)境0的冇百度翻譯、翻譯,實用性相當不錯。論起eu的應用前景,僅看其隸屬于計算機視覺領域的一個分支,再聯(lián)系到當前人工智能的發(fā)

6、展,其前景可想而知。除了翻譯、智能購物以外,?Cu未來最大的發(fā)展?jié)摿υ谟谌藱C交互。眾所周知,人機交互一直是研究者追求的東西,但是目前也僅僅做到了語音交互和肢體交互。文字代表了人類的所有智慧與思想,如果機器人能夠進行文字識別,那將能夠進一步獲取知識、學習人類,進而與人類進行更為自然的交互,或是協(xié)助人類工作,提高效率。

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內容,確認文檔內容符合您的需求后進行下載,若出現內容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。