用深度學(xué)習(xí)技術(shù)解決圖像語(yǔ)義分割問(wèn)題

用深度學(xué)習(xí)技術(shù)解決圖像語(yǔ)義分割問(wèn)題

ID:23731160

大?。?8.68 KB

頁(yè)數(shù):5頁(yè)

時(shí)間:2018-11-10

用深度學(xué)習(xí)技術(shù)解決圖像語(yǔ)義分割問(wèn)題_第1頁(yè)
用深度學(xué)習(xí)技術(shù)解決圖像語(yǔ)義分割問(wèn)題_第2頁(yè)
用深度學(xué)習(xí)技術(shù)解決圖像語(yǔ)義分割問(wèn)題_第3頁(yè)
用深度學(xué)習(xí)技術(shù)解決圖像語(yǔ)義分割問(wèn)題_第4頁(yè)
用深度學(xué)習(xí)技術(shù)解決圖像語(yǔ)義分割問(wèn)題_第5頁(yè)
資源描述:

《用深度學(xué)習(xí)技術(shù)解決圖像語(yǔ)義分割問(wèn)題》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、電子制作2017,20,39-40+38用深度學(xué)習(xí)技術(shù)解決圖像語(yǔ)義分割問(wèn)題蔣子源浙江省杭州高級(jí)中學(xué)錢(qián)江校區(qū)導(dǎo)出/參考文獻(xiàn)關(guān)注分享收藏打印摘要:大數(shù)據(jù)技術(shù)的飛速發(fā)展,使計(jì)算機(jī)視覺(jué)領(lǐng)域面臨新的機(jī)遇和挑戰(zhàn)。傳統(tǒng)計(jì)算機(jī)視覺(jué)技術(shù)程序復(fù)雜,且需要專(zhuān)業(yè)知識(shí)背景支撐,嚴(yán)重阻礙了該領(lǐng)域的發(fā)展。祌經(jīng)M絡(luò)技術(shù)的出現(xiàn),人工智能產(chǎn)業(yè)的蓬勃發(fā)展,使得該領(lǐng)域煥然-新。本人在提煉總結(jié)大量參考文獻(xiàn)的棊礎(chǔ)上,對(duì)圖像語(yǔ)義分割技術(shù)進(jìn)行概述,并著重對(duì)卷積神經(jīng)網(wǎng)絡(luò)的的應(yīng)用做深入剖析。首先就閣像語(yǔ)義分割技術(shù)的概念、基本算法和具有應(yīng)用進(jìn)行綜述,然后對(duì)卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展和基礎(chǔ)結(jié)構(gòu)進(jìn)行詳述,之后就卷積神經(jīng)網(wǎng)絡(luò)算法如何應(yīng)

2、用在圖像語(yǔ)義分割技術(shù)上做介紹,最后對(duì)該領(lǐng)域在醫(yī)學(xué)圖像和穿衣搭配領(lǐng)域的應(yīng)用做研究。關(guān)鍵詞:閣像語(yǔ)義分割;卷積神經(jīng)網(wǎng)絡(luò);深度學(xué)習(xí);計(jì)算機(jī)視覺(jué);引言圖像語(yǔ)義分割技術(shù),即將給定圖像的背景和目標(biāo)物體區(qū)分開(kāi)來(lái),并單獨(dú)加上語(yǔ)義標(biāo)簽,這在具體的圖像處理中非常實(shí)用。以往的圖像語(yǔ)義分割技術(shù)原理是U1,先提取圖像本身的特征,之后根據(jù)特征劃分區(qū)域,再在區(qū)域上做特征提取,最后分類(lèi)合并這些區(qū)域。其中研究投入最多的是特征提取,如涌現(xiàn)出的經(jīng)典算法H0G和SIFT,但其處理過(guò)程復(fù)雜,且并不適用于所有圖像問(wèn)題。神經(jīng)網(wǎng)絡(luò)的出現(xiàn),之所以能夠掀起新一波的計(jì)算機(jī)視覺(jué)浪潮,就在于它的“端到端”處理機(jī)制,其無(wú)需再單

3、獨(dú)對(duì)圖像做特征提取操作,多層卷積池化操作模擬人腦,在不斷的抽象和迭代中做高層特征提取,再經(jīng)過(guò)全連接層即可進(jìn)行圖像處理。圖像語(yǔ)義分割作為子領(lǐng)域,將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用到其上,自然成為當(dāng)前的研究熱點(diǎn)。2006年以前,超過(guò)三層的神經(jīng)網(wǎng)絡(luò)模型效率低下,其后,Geoffrey教授在Science上發(fā)表的一篇關(guān)于深度學(xué)習(xí)的論文,再次引發(fā)了祌經(jīng)網(wǎng)絡(luò)的研究熱潮。該文章有兩大觀點(diǎn):一是多隱含層的神經(jīng)網(wǎng)絡(luò)特征學(xué)效果突出,能學(xué)到圖像的本質(zhì)特征;二是多層神經(jīng)網(wǎng)絡(luò)的優(yōu)化復(fù)雜度可以通過(guò)“逐層初始化”得到克服。止是這兩個(gè)核心觀點(diǎn)的出現(xiàn)加之研究學(xué)者的不斷努力,使得神經(jīng)網(wǎng)絡(luò)攻克難以訓(xùn)練的危機(jī),再次成為大數(shù)

4、據(jù)和人工智能時(shí)代的主角。1.像語(yǔ)義分割領(lǐng)域發(fā)展概述圖像語(yǔ)義分割技術(shù)大大提高了圖像檢索的準(zhǔn)確率。如根據(jù)醫(yī)學(xué)影像做疾病檢測(cè)方面,圖像語(yǔ)義分割技術(shù)可以自動(dòng)提取醫(yī)學(xué)領(lǐng)域關(guān)鍵信息,并依賴(lài)分類(lèi)器做病癥預(yù)判,最后再經(jīng)由專(zhuān)業(yè)醫(yī)生做決斷,則一方面節(jié)省了人力物力財(cái)力,另一方面也避免了人為誤判等情況的出現(xiàn)。該技術(shù)目標(biāo)不僅僅在于圖像分割,在此基礎(chǔ)上還增加了新的要求,即語(yǔ)義標(biāo)注,涉及到技術(shù)包括物體邊界識(shí)別與類(lèi)別檢測(cè)。棊于區(qū)域的目標(biāo)檢測(cè)器,經(jīng)典框架如下m:一,分割區(qū)域。依賴(lài)邊界檢測(cè)技術(shù),要求該算法滿足強(qiáng)不變性,即閣像本身的亮度、大小、方位等信息并不影響邊界檢測(cè)結(jié)果;二,區(qū)域描述。依賴(lài)特征提取技術(shù)

5、,需要提取到多方位特征。一是部分特征。如利用姿勢(shì)模型提取目標(biāo)物體形態(tài)特征。二是全局特征。包括紋理、顏色等。三是輪廓信息。四是幾何特征。包括邊界、坐標(biāo)等特征;三,構(gòu)造區(qū)域分類(lèi)器。依賴(lài)SVM技術(shù),計(jì)算各區(qū)域得分;四,轉(zhuǎn)化與整合。將上述得分變?yōu)橄袼氐梅?,并做基于像素的分?lèi)器,整合分割圖。2.卷積神經(jīng)網(wǎng)絡(luò)技術(shù)原理與應(yīng)用傳統(tǒng)的圖像處理技術(shù)主要包括特征提取和分類(lèi)器兩部分,特征提取算法的設(shè)計(jì)復(fù)雜性與應(yīng)用局限性、穩(wěn)定性,以及特定的特征提取算法與特定的分類(lèi)器相結(jié)合的多樣性限制著圖像處理技術(shù)的發(fā)展。神經(jīng)網(wǎng)絡(luò)的出現(xiàn),使端到端的圖像處理成為可能,當(dāng)網(wǎng)絡(luò)的隱藏層發(fā)展到多層吋便稱(chēng)之為深度學(xué)但同吋

6、需要用逐層初始化技術(shù)解決深層次網(wǎng)絡(luò)訓(xùn)練難度大的問(wèn)題,之后深度學(xué)習(xí)便成為時(shí)代的主角。而卷積神經(jīng)網(wǎng)絡(luò)(CNN)便是深度學(xué)習(xí)與圖像處理技術(shù)相結(jié)合所產(chǎn)生的經(jīng)典模型,實(shí)現(xiàn)該模型的網(wǎng)絡(luò)實(shí)例在特定的圖像問(wèn)題處理上都卓有成效。祌經(jīng)網(wǎng)絡(luò)之所以能和圖像領(lǐng)域相結(jié)合,并呈現(xiàn)巨大的發(fā)展前景,是有生物學(xué)依據(jù)的。人類(lèi)視覺(jué)信息處理機(jī)制的發(fā)現(xiàn),是19世紀(jì)19年代生物學(xué)界的重人發(fā)現(xiàn)之一,它證明了大腦可視皮層是分級(jí)存在的。人的視覺(jué)系統(tǒng)是一個(gè)反復(fù)抽象和迭代的過(guò)程。而卷積祌經(jīng)網(wǎng)絡(luò),就模擬了這個(gè)過(guò)程。首先,每一個(gè)卷積層,便是將具體信息做抽象的過(guò)程,而多個(gè)卷積層串聯(lián)操作,便是將上一層的抽象結(jié)果再做抽象處理的過(guò)程,

7、稱(chēng)之為迭代。在這個(gè)抽象迭代的過(guò)程屮,不斷抽取大腦可感知的高維度特征。如當(dāng)一幅閣像經(jīng)過(guò)視網(wǎng)膜進(jìn)入視野,首先會(huì)將光線像素等信息抽象為圖像邊緣信息,然后再抽象為目標(biāo)物體的某一部位,再抽象為物體輪廓形成對(duì)整個(gè)0標(biāo)的感知。卷積神經(jīng)網(wǎng)絡(luò)包括卷積池化層操作和全連接層操作。該網(wǎng)絡(luò)基于傳統(tǒng)神經(jīng)網(wǎng)絡(luò),主要做/參數(shù)數(shù)量和訓(xùn)練難度方面的優(yōu)化。后者各層網(wǎng)絡(luò)之間采用的是全連接,導(dǎo)致參數(shù)數(shù)量較多,由此便需要足夠多的訓(xùn)練數(shù)據(jù)才可能達(dá)到較好的訓(xùn)練效果,這限制了網(wǎng)絡(luò)的深度和大小。前者采用局部視野和參數(shù)共享機(jī)制,大大較少了參數(shù)數(shù)量。局部視野就相當(dāng)于人再觀察世界時(shí),并不是全局觀察,而是分局

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶(hù)上傳,版權(quán)歸屬用戶(hù),天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶(hù)請(qǐng)聯(lián)系客服處理。