資源描述:
《圖像處理地gpu加速技術地的研究與評價與衡量與衡量》由會員上傳分享,免費在線閱讀,更多相關內容在工程資料-天天文庫。
1、實用標準文案圖像處理的GPU加速技術研究與評價劉偉峰蔣楠宋付英孟凡密陳芳莉(中國石油化工股份有限公司石油勘探開發(fā)研究院信息技術研究所,北京,100083,liuwf@pepris.com)摘要:針對大多數(shù)圖像處理問題的計算密集性,提出了圖像處理的GPU加速技術。首先,描述了相對于CPU,采用GPU能夠帶來計算效率提升的體系結構基礎。其次,將直方圖生成和快速傅里葉變換計算二維卷積兩個具有代表性的圖像處理算法移植至GPU。最后,利用同樣市場價格組合的CPU和GPU進行實驗,利用多分辨率圖像作為測試數(shù)據(jù),比對CPU和GPU方案的計算效率。結果顯示,與相同算法的
2、CPU實現(xiàn)相比,其GPU實現(xiàn)分別將計算效率最高提高到了17倍和40倍。關鍵詞:圖形處理器;直方圖;快速傅里葉變換;二維卷積;統(tǒng)一計算設備架構EvaluationandComparativeResearchofGPUAccelerationTechniquesofImageProcessingLIUWei-feng,JIANGNan,SONGFu-ying,MENGFan-mi,CHENFang-li(InformationandTechnologyStation,SINOPECExploration&ProductionResearchInstitute
3、,Beijing100083)Abstract:Forthecompute-intensivecharacterofimageprocessing,weproposeGPUaccelerationtechniquesofimageprocessing.Inthispaper,first,wedescribetheefficientarchitectureofGPU.Second,weimplementtworepresentativeimageprocessingalgorithms,histogramgenerationandFastFourierTr
4、ansformation-basedtwo-dimensionalconvolution,onGPU.Finally,usingthesamemarketpriceCPUandGPUashardwareplatform,andusingmulti-resolutionimagesastestdatasets,wecomparethecomputationalefficiencyofGPUwithCPU.TheresultsshowthespeedofthetwoalgorithmsimplementedonGPUcanbeimprovedbyupto17
5、timesand40timescomparedtoCPU-basedimplementations.Keywords:GPU;histogram;FFT;2Dconvolution;CUDA精彩文檔實用標準文案1引言隨著科學技術的迅猛發(fā)展,圖像處理技術已經成為了近代信息處理領域一項非常重要的技術,并已在遙感、醫(yī)學、生物特征鑒別、運動分析等領域得到了廣泛應用。由于大多數(shù)圖像處理問題是計算密集型的,所以許多串行處理方法在應用中遇到了難以實時計算的困難。隨著并行計算機及并行處理技術的發(fā)展,并行圖像處理技術應運而生,但這些技術往往要么運行于大型集群上,要么還在被
6、作為測試并行機性能的輔助技術使用,其推廣完全受制于硬件環(huán)境的推廣。本文利用已被廣泛接受并使用的GPU(graphicsprocessingunit,圖形處理器)作為硬件載體,在其上并行地實現(xiàn)了兩個圖像處理的常用算法——直方圖生成和快速傅里葉變換計算二維卷積,并對其執(zhí)行性能數(shù)據(jù)與CPU上的相同算法執(zhí)行性能數(shù)據(jù)進行了比對。實驗結果顯示,同樣的圖像處理算法,GPU組合對比于同樣市場價格的CPU,其計算效率是后者的17-40倍??傻贸鼋Y論,將原有CPU執(zhí)行的算法移植至GPU執(zhí)行能夠獲得很高的效率提升,而且是經濟、可行的。精彩文檔實用標準文案2GPU介紹過去的二十
7、年間,中央處理器遵循摩爾定律發(fā)展,在不斷提升性能的同時降低價格,為高性能計算提供了有效的支持。然而,自2003年以來,這種趨勢發(fā)生了變化,不斷提高的CPU頻率帶來了高功耗和高發(fā)熱量,使得CPU頻率止步于4GHz,并向提高頻率以外的方向發(fā)展。從那時起,以游戲加速和圖形處理為初衷設計的GPU以超出摩爾定律的速度發(fā)展,并開始在高性能計算領域被大量使用。圖1為近年來CPU和GPU的浮點運算速度對比圖[1]。圖1GPU和CPU的FLOPS理論峰值Fig.1TheoreticalpeakFLOPSonGPUsandCPUs帶來這種數(shù)據(jù)處理能力差別的主要原因在于GPU
8、是典型的關注于計算而不太在乎如何訪問存儲器的流處理機,流式編程模型的約束使得GP