資源描述:
《高性能并行計算平臺及并行計算環(huán)境概述》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、高性能并行計算平臺及并行計算環(huán)境概述中國水利水電科學(xué)研究院信息網(wǎng)絡(luò)中心2005年8月11日內(nèi)容提要1、前言2、高性能并行計算平臺建設(shè)3、水利水電高性能計算實踐4、結(jié)語1、前言什么是高性能并行計算?科學(xué)家和工程師可以用它來解決一些程序規(guī)模龐大、運算時間長以及數(shù)據(jù)量大的科研課題。并行計算是提高服務(wù)器計算速度和處理能力的一種有效手段。計算機按照編好的程序?qū)τ嬎銌栴}進(jìn)行分解,并把分解的任務(wù)塊通過一定的方式交給不同的處理器去求解。國際發(fā)展動態(tài)2005年6月22日公布的全球高性能計算機top500,第一名是IBM的Blue
2、Gene/L,Linpack測試值為每秒136.8萬億次,第二名是IBM的BlueGene/W,Linpack測試值為每秒91萬億次。日本第一的高性能計算機,EarthSimulator(地球模擬器),Linpack測試值為35.6萬億次。國內(nèi)發(fā)展動態(tài)中國的第一名,中國氣象局的高性能計算機,Linpack值為每秒10.3萬億次。曙光系列、神威系列、銀河系列、深騰系列中科院計算所、曙光公司和上海超級計算中心三方共同研制的曙光4000A,Linpack測試值為每秒8.061萬億次。聯(lián)想公司為中科院網(wǎng)絡(luò)信息中心生產(chǎn)的
3、深騰6800,共有1060顆1.3Ghz的安騰2處理器,Linpack測試值為每秒4.183萬億次。院內(nèi)需求分析隨著工程規(guī)模的逐漸擴(kuò)大、復(fù)雜問題求解分析的日益深入,其科學(xué)計算的“瓶頸”日趨嚴(yán)重,即使對模型和算法進(jìn)行簡化,一次計算仍需要幾個小時、幾天甚至數(shù)十天的時間,這一現(xiàn)狀嚴(yán)重制約了我院水利水電學(xué)科的發(fā)展,許多工程師、教授提出的理論和設(shè)想都因為計算能力受到限制而無法實施。課題1:小灣壩踵應(yīng)力誘導(dǎo)縫研究小灣拱壩壩底縫計算采用網(wǎng)格有20萬個單元,總共24萬多個節(jié)點。單機上運行模擬計算程序時,一個計算步需要將近4~5
4、個小時,一個工況一般有30~40個計算步,總共有幾十種工況。課題2:混凝土三維細(xì)觀力學(xué)模型的研究模型1:濕篩試件靜動態(tài)彎拉強度細(xì)觀力學(xué)分析研究中對試件進(jìn)行劃分,用4面體單元將細(xì)網(wǎng)格6面體單元過渡到兩邊粗網(wǎng)格6面體單元,共有24257節(jié)點,29952個單元,其中骨料2160個單元,固化水泥砂漿體3805單元,粘結(jié)界面14515單元以及宏觀均勻混凝土9472個單元。以上三維計算是在內(nèi)存1G,CPU為2.8G的PC機上進(jìn)行的。靜力計算耗時163小時39分,約7天時間;動力計算耗時196小時25分鐘,約8天時間。模型2
5、:全級配試件靜動態(tài)彎拉強度三維細(xì)觀力學(xué)分析剖分后的單元有骨料單元、融入小骨料后的固化水泥砂漿單元和兩者之間的界面單元,共有24257個節(jié)點,113920個單元。計算時間:在以上配置相同的PC機上,三維靜力計算耗時209小時50分鐘,約9天時間;動力計算耗時291小時57分鐘,約12天時間。問題要實現(xiàn)三維細(xì)觀力學(xué)數(shù)值計算,計算速度這一難題必須克服,通常,針對一個模型研究人員需要反復(fù)調(diào)整參數(shù)進(jìn)行數(shù)值計算,一個算例耗時數(shù)天甚至數(shù)周簡直無法忍受。上述種種計算和數(shù)據(jù)的處理對計算環(huán)境提出了新的要求,如果以傳統(tǒng)的個人PC機作
6、為計算平臺,計算的時間和效率遠(yuǎn)遠(yuǎn)滿足不了科研的需求,甚至?xí)捎趦?nèi)存、CPU等硬件的限制而無法進(jìn)行計算。因此我院急需建設(shè)一個高性能并行計算平臺,更好的為科研項目服務(wù)。二、高性能并行計算平臺建設(shè)硬件平臺建設(shè)初步構(gòu)想采用Sun公司提供的SunFireSupercluster解決方案。2~4臺高性能的SunFire6800服務(wù)器作為集群節(jié)點。每臺服務(wù)器達(dá)到滿配置,即24個1.2GhzUltraSPARCIIICPU,192GB內(nèi)存。節(jié)點之間采用SunFireLinkInterconnect技術(shù)通過光纖互聯(lián)。IWHR高性
7、能并行計算平臺硬件體系結(jié)構(gòu)SunFire6800技術(shù)指標(biāo)硬件完全冗余,可以從任何硬件故障中恢復(fù)。最多24個CPU,最大192GB內(nèi)存,32PCI或者16cPCI插槽。每臺SunFire6800機器最多分為4個域,每個域相當(dāng)于一臺獨立的服務(wù)器。具有很好的線性擴(kuò)充能力,24個CPU運行時的Linpack值是1個CPU運行時的23.3倍。SunFireLinkInterconnectSunFireLink為一套高帶寬、低延遲的互聯(lián)系統(tǒng),可以擴(kuò)展SunFire6800系統(tǒng)的可用性。一個SunFireLink系統(tǒng)最多可以
8、由8個SunFire6800服務(wù)器節(jié)點組成,每個節(jié)點由SunFireLink光纖網(wǎng)絡(luò)連接在一起,一整套軟件支持。SunManagementCenter可以為SunFireLink網(wǎng)絡(luò)資源的配置、監(jiān)視與管理提供最佳可用性。我院SunFire6800現(xiàn)有配置CPU數(shù)量4*1200Mhz內(nèi)存容量8GB(16X512MBDIMMs)I/O板4個,PCI擴(kuò)展槽共32個SunStorage3510