linux高性能計算集群

linux高性能計算集群

ID:10296553

大小:321.50 KB

頁數(shù):33頁

時間:2018-07-06

linux高性能計算集群_第1頁
linux高性能計算集群_第2頁
linux高性能計算集群_第3頁
linux高性能計算集群_第4頁
linux高性能計算集群_第5頁
資源描述:

《linux高性能計算集群》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、Linux高性能計算集群--Beowulf集群1集群1.1什么是集群簡單的說,集群(cluster)就是一組計算機(jī),它們作為一個整體向用戶提供一組網(wǎng)絡(luò)資源。這些單個的計算機(jī)系統(tǒng)就是集群的節(jié)點(node)。一個理想的集群是,用戶從來不會意識到集群系統(tǒng)底層的節(jié)點,在他/她們看來,集群是一個系統(tǒng),而非多個計算機(jī)系統(tǒng)。并且集群系統(tǒng)的管理員可以隨意增加和刪改集群系統(tǒng)的節(jié)點。1.2為什么需要集群集群并不是一個全新的概念,其實早在七十年代計算機(jī)廠商和研究機(jī)構(gòu)就開始了對集群系統(tǒng)的研究和開發(fā)。由于主要用于科學(xué)工程計算,所以這些系統(tǒng)并不為

2、大家所熟知。直到Linux集群的出現(xiàn),集群的概念才得以廣為傳播。對集群的研究起源于集群系統(tǒng)的良好的性能可擴(kuò)展性(scalability)。提高CPU主頻和總線帶寬是最初提供計算機(jī)性能的主要手段。但是這一手段對系統(tǒng)性能的提供是有限的。接著人們通過增加CPU個數(shù)和內(nèi)存容量來提高性能,于是出現(xiàn)了向量機(jī),對稱多處理機(jī)(SMP)等。但是當(dāng)CPU的個數(shù)超過某一閾值,象SMP這些多處理機(jī)系統(tǒng)的可擴(kuò)展性就變的極差。主要瓶頸在于CPU訪問內(nèi)存的帶寬并不能隨著CPU個數(shù)的增加而有效增長。與SMP相反,集群系統(tǒng)的性能隨著CPU個數(shù)的增加幾乎

3、是線性變化的。圖1顯示了這中情況。圖1.幾種計算機(jī)系統(tǒng)的可擴(kuò)展性集群系統(tǒng)的優(yōu)點并不僅在于此。下面列舉了集群系統(tǒng)的主要優(yōu)點:1.高可擴(kuò)展性:如上所述。2.高可用性:集群中的一個節(jié)點失效,它的任務(wù)可以傳遞給其他節(jié)點??梢杂行Х乐箚吸c失效。3.高性能:負(fù)載平衡集群允許系統(tǒng)同時接入更多的用戶。4.高性價比:可以采用廉價的符合工業(yè)標(biāo)準(zhǔn)的硬件構(gòu)造高性能的系統(tǒng)。1.2.1集群系統(tǒng)的分類雖然根據(jù)集群系統(tǒng)的不同特征可以有多種分類方法,但是一般我們把集群系統(tǒng)分為兩類:·高可用(HighAvailability)集群,簡稱HA集群。這類集群

4、致力于提供高度可靠的服務(wù)?!じ咝阅苡嬎?HighPerfermanceComputing)集群,簡稱HPC集群。這類集群致力于提供單個計算機(jī)所不能提供的強(qiáng)大的計算能力。2高可用集群2.1什么是高可用性計算機(jī)系統(tǒng)的可用性(availability)是通過系統(tǒng)的可靠性(reliability)和可維護(hù)性(maintainability)來度量的。工程上通常用平均無故障時間(MTTF)來度量系統(tǒng)的可靠性,用平均維修時間(MTTR)來度量系統(tǒng)的可維護(hù)性。于是可用性被定義為:MTTF/(MTTF+MTTR)*100%業(yè)界根據(jù)可用

5、性把計算機(jī)系統(tǒng)分為如下幾類:可用比例(PercentAvailability)年停機(jī)時間(downtime/year)可用性分類99.53.7天常規(guī)系統(tǒng)(Conventional)99.98.8小時可用系統(tǒng)(Available)99.9952.6分鐘高可用系統(tǒng)(HighlyAvailable)99.9995.3分鐘FaultResilient99.999932秒FaultTolerant表1.系統(tǒng)可用性分類對于關(guān)鍵業(yè)務(wù),停機(jī)通常是災(zāi)難性的。因為停機(jī)帶來的損失也是巨大的。下面的統(tǒng)計數(shù)字列舉了不同類型企業(yè)應(yīng)用系統(tǒng)停機(jī)所帶來

6、的損失。應(yīng)用系統(tǒng)每分鐘損失(美元)呼叫中心(CallCenter)27000企業(yè)資源計劃(ERP)系統(tǒng)13000供應(yīng)鏈管理(SCM)系統(tǒng)11000電子商務(wù)(eCommerce)系統(tǒng)10000客戶服務(wù)(CustomerServiceCenter)系統(tǒng)27000表2.停機(jī)給企業(yè)帶來的損失隨著企業(yè)越來越依賴于信息技術(shù),由于系統(tǒng)停機(jī)而帶來的損失也越拉越大。2.2高可用集群高可用集群就是采用集群技術(shù)來實現(xiàn)計算機(jī)系統(tǒng)的高可用性。高可用集群通常有兩種工作方式:·容錯系統(tǒng):通常是主從服務(wù)器方式。從服務(wù)器檢測主服務(wù)器的狀態(tài),當(dāng)主服務(wù)工作

7、正常時,從服務(wù)器并不提供服務(wù)。但是一旦主服務(wù)器失效,從服務(wù)器就開始代替主服務(wù)器向客戶提供服務(wù)?!へ?fù)載均衡系統(tǒng):集群中所有的節(jié)點都處于活動狀態(tài),它們分?jǐn)傁到y(tǒng)的工作負(fù)載。一般Web服務(wù)器集群、數(shù)據(jù)庫集群和應(yīng)用服務(wù)器集群都屬于這種類型。關(guān)于高可用集群的討論很多,這里就不進(jìn)行深入的闡述了。3高性能計算集群3.1什么是高性能計算集群簡單的說,高性能計算(High-PerformanceComputing)是計算機(jī)科學(xué)的一個分支,它致力于開發(fā)超級計算機(jī),研究并行算法和開發(fā)相關(guān)軟件。高性能計算主要研究如下兩類問題:·大規(guī)模科學(xué)問題,

8、象天氣預(yù)報、地形分析和生物制藥等;·存儲和處理海量數(shù)據(jù),象數(shù)據(jù)挖掘、圖象處理和基因測序;顧名思義,高性能集群就是采用集群技術(shù)來研究高性能計算。3.2高性能計算分類高性能計算的分類方法很多。這里從并行任務(wù)間的關(guān)系角度來對高性能計算分類。3.2.1高吞吐計算(High-throughputComputing)有一類高性能計算,可以把它

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。