資源描述:
《基于視覺信息的圖像特征提取算法研究.pdf》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、摘要摘要基于視覺信息的圖像特征提取算法研究計(jì)算機(jī)視覺從其產(chǎn)生就成為二維圖像識(shí)別和分析的工具,作為人類視覺的模擬,視信息成為它的處理對(duì)象。視信息包括諸如形狀、位置、顏色、紋理等圖像特征,計(jì)算機(jī)視覺對(duì)這些圖像特征進(jìn)行處理的主要任務(wù)就是特征提取,所提取的特征點(diǎn)也希望盡可能具有不變性。因此,本文主要針對(duì)紋理、輪廓兩個(gè)特征及具有不變性的SIFT特征點(diǎn)進(jìn)行相關(guān)算法改進(jìn)并實(shí)現(xiàn)。針對(duì)紋理特征提取的復(fù)雜背景中單一目標(biāo)輪廓提取算法。原始的邊緣提取算法一般都是以空間域?yàn)榛鶞?zhǔn),選取合適的算子與基準(zhǔn)圖像做卷積計(jì)算。此種方法實(shí)現(xiàn)起來(lái)容易而且快速,但是它在運(yùn)行的過(guò)程中丟失了包括上下文信息在內(nèi)
2、的一些相關(guān)信息,無(wú)法分割目標(biāo)與背景,并且存在邊緣不連續(xù)及邊緣過(guò)窄等問(wèn)題。輪廓作為容納了形狀及結(jié)構(gòu)的一個(gè)中層特征,人通過(guò)輪廓很容易識(shí)別物體,對(duì)于場(chǎng)景中的目標(biāo)及背景區(qū)分也不難。高級(jí)視覺通路由感知物體形狀的what通路和感知空間位置的where通路組成。在Hubel和Wiesel提出分級(jí)處理思想后,人們對(duì)于腹側(cè)流結(jié)構(gòu)有了新的認(rèn)識(shí),標(biāo)準(zhǔn)模型的建立就是對(duì)這種新認(rèn)識(shí)的融入。2007年,Serre等人結(jié)合生物學(xué)的研究成果提出HMAX模型,它與標(biāo)準(zhǔn)模型類同,是一個(gè)由五層構(gòu)成的層次結(jié)構(gòu),這五層是S1層(簡(jiǎn)單細(xì)胞層),C1層(復(fù)雜細(xì)胞層),S2層(合成特征層),C2層(復(fù)雜合成層)
3、,VTU層(視覺調(diào)整細(xì)胞層)。HMAX模型與人對(duì)物體識(shí)別過(guò)程有類似之處,HMAX模型在最終的VTU層輸出了特征向量,顯而易見,它很適合于作物體識(shí)別,但針對(duì)于特征提取的話,我們希望最終得到的是圖像,HAMX模型無(wú)法做到。非經(jīng)典感受野對(duì)神經(jīng)元的抑制作用可以弱化背景邊緣,最終輸出的是輪廓圖像。所以,若是旨在輪廓提取的話,借助于非經(jīng)典感受野抑制可以使輪廓提取質(zhì)量提高,但僅基于非經(jīng)典感受野抑制進(jìn)行輪廓提取會(huì)導(dǎo)致邊緣抑制效果薄弱,且與人類實(shí)際的視皮層結(jié)構(gòu)存在較大差異,因此,為使其符合人類的生理特征,將HMAX的模型構(gòu)造融入其中,二者之間取長(zhǎng)補(bǔ)短,可以達(dá)到更好地輪廓提取效果。
4、本文所構(gòu)建的模型結(jié)構(gòu)分為五層,層次I摘要?jiǎng)澐峙cHMAX模型一致,本算法對(duì)HMAX模型逐層改進(jìn),逐層設(shè)置參數(shù),每層輸入輸出的視信息數(shù)量與基準(zhǔn)圖像相同。仿真實(shí)驗(yàn)中,通過(guò)效果圖評(píng)估、準(zhǔn)確率評(píng)估及盒須圖評(píng)估驗(yàn)證了本算法的有效性。針對(duì)輪廓特征提取的低分辨率LBP人臉識(shí)別算法。LBP算子是一種基于灰度所提出的算子,它主要是針對(duì)圖像的局部紋理特征進(jìn)行提取。它的思想比較簡(jiǎn)單,容易被理解,面對(duì)因灰度所引起的變化具有很強(qiáng)的魯棒性,在紋理分類中的功能十分強(qiáng)大。多分辨率理論是小波分析中的一個(gè)重要內(nèi)容,它為小波的構(gòu)造從函數(shù)空間的角度搭建了一個(gè)框架。每一幅圖像在不同分辨率下顯示出的特性不盡
5、相同,高分辨率下圖像可以更加清晰,細(xì)節(jié)表現(xiàn)得更明顯,低分辨率下圖像相對(duì)模糊,但是概貌了然,不局限于一種分辨率解決問(wèn)題,而從多分辨率入手或許更有利于問(wèn)題的解決,Mallat于1987年提出多分辨率理論,該理論提出后研究人員就展開了多方位的研究。小波變換是建立在傅立葉變換基礎(chǔ)上的,傅立葉變換是一種全局變化,小波變換是一種局部變化,二者都是時(shí)頻分析方法,但小波變換屬于時(shí)間與頻度、空間與頻率之間的變換,信號(hào)中包含著有用的且可被提取的信息,小波變換的出現(xiàn)在調(diào)和分析的歷史上有著劃時(shí)代的意義。結(jié)合LBP算法強(qiáng)魯棒性,低分辨率對(duì)圖像概貌了解的適合,小波變換的濾波功能,本文提出L
6、RLBP算法,該算法從低分辨圖像入手,利用合適的小波變換進(jìn)行圖像分解,結(jié)合LBP算法思想完成特征向量提取。本算法以人臉為識(shí)別對(duì)像,效果較好,計(jì)算簡(jiǎn)便,并從ORL數(shù)據(jù)庫(kù)和YALE數(shù)據(jù)庫(kù)中隨機(jī)抽取圖片對(duì)本算法進(jìn)行測(cè)試,測(cè)試結(jié)果顯示本算法的整體性能優(yōu)于基本LBP算法。針對(duì)SIFT特征點(diǎn)提取的簡(jiǎn)化SIFT算法。不變量的概念在十九世紀(jì)初被提出。伴隨著對(duì)人類視覺系統(tǒng)研究的不斷深入,研究者發(fā)現(xiàn)人類視覺系統(tǒng)對(duì)視覺信息處理過(guò)程中對(duì)不變量的選擇與視覺不變量理論有極其類似之處,這就自然而然地使研究者想到將不變量理論引入到機(jī)器視覺中,也就使得機(jī)器視覺逐步“生理化”。代數(shù)不變量注重全局概
7、貌且抗噪性能強(qiáng),微分不變量注重局部細(xì)節(jié),不受位置移動(dòng)、朝向改變影響且能很好地對(duì)抗噪聲。SIFT算法就是基于局部考慮的特征提取算法。SIFT算法由D.G.Lowe1999年發(fā)表,2004年完善總結(jié)。該算法能進(jìn)行海II摘要量特征的數(shù)據(jù)計(jì)算,并可以和其他形式的特征向量進(jìn)行聯(lián)合匹配,但SIFT算法存在的最大問(wèn)題就是維數(shù)過(guò)高,故而一些改進(jìn)算法都在力求通過(guò)降維以使SIFT算法的思想得到更好的應(yīng)用,本文所提出S-SIFT算法就基于降維的想法,對(duì)SIFT算法改進(jìn)。S-SIFT算法改變了特征點(diǎn)區(qū)域的形狀,由SIFT算法中的矩形調(diào)整為圓形,但范圍大小與原來(lái)相同,這種鄰域形狀的改變免
8、去了高斯模糊的過(guò)程,也無(wú)