資源描述:
《基于GPU的反卷積算法并行優(yōu)化》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、第46卷第6期2016年11月航空計算技術(shù)AeronauticalComputingTechniqueV01.46No.6NOV.2016基于GPU的反卷積算法并行優(yōu)化雋鵬輝1,賈婷婷2,竇愛萍1,劉金學(xué)1(1.中航工業(yè)西安航空計算技術(shù)研究所,陜西西安710068;2.西安科技大學(xué)高新學(xué)院,陜西西安710109)摘要:反卷積是圖像去模糊的基本算法,針對傳統(tǒng)反卷積算法在圖像去模糊處理中實時性較弱問題,提出基于眾核GPU的IterativeDeconvolve3d反卷積算法的并行優(yōu)化實現(xiàn)。所提算法將原算法中的核心運(yùn)算
2、放在GPU上并行實現(xiàn),利用CPU和GPU協(xié)同工作模式,CPU負(fù)責(zé)串行任務(wù)GPU負(fù)責(zé)并行任務(wù)。實驗表明:與傳統(tǒng)的算法相比,在不影響圖片處理效果的前提下,計算速度比CPU上的實現(xiàn)速度提高了近11倍,并具有良好的可擴(kuò)展性。關(guān)鍵詞:并行;反卷積;GPU;CUDA中圖分類號:TP332;TP399.4文獻(xiàn)標(biāo)識碼:A文章編號:1671.654X(2016)06—0076.04OptimizationofImageDeconvolutiononGPUJUANPeng.huil,JIATing.tin92,DOUAi.pin91
3、,LIUJin.xue(1.Xi’anAeronauticsComputingTechniqueResearchInstitute,AVIC,Xi’an710068,China2.GaoxinCollege,Xi’anUniversityofScienceandTechnology,Xi’an710109,China)Abstract:DeconvolutionisthebasicalgorithmofImageDeblurring.Inordertodealwiththeproblemofweakrealtim
4、e,theimplementationofIterativeDeconvolve3dbasedontheGPUisproposedthathasim—plementedthecoreoperationonGPU.InuseofthecollaborativeworkmodeofGPUandCPU,CPUisre.sponsiblefortheserialworkandGPUisresponsiblefortheparallelwork.Comparedwiththetraditionalalgorithm,the
5、experimentshowsthat:underthepremiseofnotaffectingtheimageprocessingresults,thecalculationspeedofthisalgorithmonGPUisnearly1timesfasterthanthatofCPU,andhasagoodex—pansibility.Keywords:parallel;deconvolution;GPU;CUDA引言隨著計算技術(shù)和集成電路技術(shù)的發(fā)展,圖形硬件的更新速度越來越快。1999年NVIDIA發(fā)
6、布GeForce256繪圖處理芯片時,首先提出GPU概念,其多流水結(jié)構(gòu)、向量處理特性以及32位IEEE標(biāo)準(zhǔn)浮點(diǎn)精度的實現(xiàn),使得它對于計算密集型的科學(xué)應(yīng)用有非常大的吸引力,越來越成為通用計算的一個有效的并行平臺。近幾年來很多科學(xué)計算都已經(jīng)被移植到GPU這個計算平臺,如精確天氣預(yù)報、衛(wèi)星圖像處理和核爆炸的模擬等。由于光的衍射作用,傳統(tǒng)的熒光顯微鏡由于焦平面外信息的干擾造成拍攝圖像模糊。為了提高圖像的分辨率,一方面改善熒光顯微鏡的成像技術(shù),典型的代表是激光共聚焦以及CCD技術(shù)的使用;另一方面,通過計算機(jī)進(jìn)行數(shù)字圖像處理
7、和分析。圖像反卷積算法是圖像去模糊的基本算法,使得光學(xué)顯微鏡發(fā)揮了很大的作用。herativeDeconvolve3d算法是非負(fù)的迭代型圖像處理算法,由BobDougherty開發(fā)作為圖像處理軟件ImageJ的插件¨。2J,能夠?qū)?D和3D圖像進(jìn)行反卷積處理,由于該算法基于JAVA實現(xiàn),對小數(shù)據(jù)速度尚可;隨著顯微鏡成像技術(shù)的快速發(fā)展,需要處理的圖像數(shù)據(jù)越來越巨大,對日益增長的圖像數(shù)據(jù)進(jìn)行反卷積處理已不現(xiàn)實,為了應(yīng)對這種需求,本文在GPU眾核處理器上實現(xiàn)了IterativeDeconvolve3d并行版本。1并行優(yōu)
8、化的實現(xiàn)1.1CPU多核的優(yōu)化實現(xiàn)為了對該算法進(jìn)行并行優(yōu)化,首先使用VisualVM工具進(jìn)行熱點(diǎn)函數(shù)分析,圖1是分析得到的程序調(diào)用收稿日期:2016一10—17修訂日期:2016一ll—15基金項目:國家自然科學(xué)基金項目資助(31327901)作者簡介:雋鵬輝(1989一),男,陜西寶雞人,助理工程師,碩士研究生,主要研究方向為計算機(jī)系統(tǒng)結(jié)構(gòu)。2016年11月雋鵬輝等:基