資源描述:
《基于gpu和多核cpu的并行高階矩量法的實現(xiàn)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、隸韻大·璺碩士學(xué)位論文基于GPU禾I多核CPU的并行高階矩量法的實現(xiàn)專業(yè)名稱:電磁場與微波技本研究生姓名:陳康導(dǎo)師姓名:周后型教授本論文獲國家公益性行業(yè)科研專項(201110046—2)和國家基礎(chǔ)科學(xué)研究項目(2010CB327400,2013CB329002)的資助。REALIZATIoNoFPARALLELHIGHER.oRDERMETHoDoFMOMENTSBASEDONGPUANDMULTI—CORECPUADissertationSubmittedtoSoutheastUniversityFortheAcademicDegreeofMasterofScience
2、ByCHENKangSupervisedbyProfessorZHOUHou--XingStateKeyLaboratoryofMillimeterWavesSchoolofInformationScienceandEngineeringSoutheastUniversityJanuary10,2014東南大學(xué)學(xué)位論文獨創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是我個人在導(dǎo)師指導(dǎo)下進行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得東南大學(xué)或其它教育機構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同
3、志對本研究所做的任何貢獻均已在論文中作了明確的說明并表示了謝意。研究生簽名:日期:2壁經(jīng)!墨:;東南大學(xué)學(xué)位論文使用授權(quán)聲明東南大學(xué)、中國科學(xué)技術(shù)信息研究所、國家圖書館有權(quán)保留本人所送交學(xué)位論文的復(fù)印件和電子文檔,可以采用影印、縮印或其他復(fù)制手段保存論文。本人電子文檔的內(nèi)容和紙質(zhì)論文的內(nèi)容相一致。除在保密期內(nèi)的保密論文外,允許論文被查閱和借閱,可以公布(包括以電子信息形式刊登)論文的全部內(nèi)容或中、英文摘要等部分內(nèi)容。論文的公布(包括以電子信息形式刊登)授權(quán)東南大學(xué)研究生院辦理。研究生簽名:導(dǎo)師簽名:麴日期:摘要電大目標電磁散射特性的快速分析方法一直是計算電磁學(xué)界的一個熱點
4、。在早期的矩量法中,局域基函數(shù)是低階基函數(shù)(主要是RWG基函數(shù)),產(chǎn)生的未知量個數(shù)比較多,特別是對于電大目標問題。基于積分方程和矩量法的快速算法是目前求解電大目標電磁散射問題的常用算法,并采用迭代求解器求解矩量法矩陣方程。快速算法能夠顯著地降低每次迭代的計算復(fù)雜度和存儲復(fù)雜度,但以適當犧牲數(shù)值精度為代價。近些年來,高階基函數(shù)(特別是Legendre準正交基函數(shù))被引入矩量法,以大幅度減少未知量個數(shù),并適當提高數(shù)值精度。在大面片上采用高階基函數(shù)的矩量法(高階矩量法)已經(jīng)成為電磁學(xué)界的一個熱點。本文研究基于GPU和多核CPU的并行高階矩量法的實現(xiàn),重點在于高階矩量法矩陣的快速
5、生成方法。本文主要工作如下:1.提出了兩個加速方法:一是將現(xiàn)有的共用Green函數(shù)法擴展為“共用Green函數(shù)與共用方向向量相互作用法”;二是將高階基函數(shù)按階數(shù)高低進行分組積分的方法,即“基函數(shù)按階分組法”。在這兩個方法以及現(xiàn)有的高階基函數(shù)積分表法基礎(chǔ)上,研究7"OpenMP控制多核CPU生成高階矩量法矩陣的并行計算程序的實現(xiàn)方法;2.提出了將高階矩量法的CPU串行程序直接向GPU環(huán)境移植的方法。高階矩量法矩陣的生成是一項計算密集型的工作,特別適合用眾核GPU來提速。但是,在基于GPU的編程中要處理各種存儲器之間的關(guān)系,比在基于多核CPU的情形復(fù)雜得多。文獻中給出的是直接
6、將針對采用RWG基函數(shù)的矩量法的GPU實現(xiàn)演變?yōu)獒槍Ω唠A矩量法的,僅獲得3倍左右的加速。本文的GPU程序?qū)崿F(xiàn)是優(yōu)化的,達到了20倍以上的加速;3.提出了高階矩量法矩陣在并行環(huán)境中高效計算的一種分塊方法,非常匹配從GPU高效顯存蛩]CPU主內(nèi)存的連續(xù)拷貝機制,避免YGPU與CPU間反復(fù)多次的小內(nèi)存交互。該方法不僅可以基于內(nèi)存來擴大計算規(guī)模(核內(nèi)存儲版本),還可以讓內(nèi)存結(jié)合硬盤來進一步擴大計算規(guī)模,即演變?yōu)閹Ш送獯鎯Φ腉PU力I速程序(核外存儲版本)。關(guān)鍵詞:電磁散射,高階基函數(shù),高階矩量法,快速算法,并行算法,OpenMP,GPU,CUDA,核內(nèi)存儲,核外存儲。Abstra
7、ctFastanalyzingelectromagneticscatteringcharacteristicsofelectricallylargeobjectshavebeenahottopicinthecomputationalelectromagnetism.Intheearlymethodofmoments,localbasisfunctionsarelower-orderbasisfunctions(mainlyRWGbasisfunctions)thenumberofunknownvariablesproduced