資源描述:
《VMware HA高可用性》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、如何在虛擬環(huán)境里達(dá)到高可用性?(上)2009-1-13??大
2、中
3、小導(dǎo)讀:本文介紹高可用性(HA)的定義及測量公式。關(guān)鍵詞:高可用性HA正在加載數(shù)據(jù)...【TechTarget中國原創(chuàng)】網(wǎng)絡(luò)基礎(chǔ)架構(gòu)設(shè)備需要通過建設(shè)高可用性(HA)架構(gòu),并且部署一個(gè)混合的商業(yè)成品(COTS)硬件以及商業(yè)和開源的軟件組件達(dá)到更高的可靠性。曾經(jīng)高度依賴自定義和私有平臺(tái)的位于網(wǎng)絡(luò)核心和邊緣的系統(tǒng)如今建立在基于標(biāo)準(zhǔn)運(yùn)輸?shù)燃?jí)的操作系統(tǒng)、服務(wù)可用性論壇API和AdvancedTCA之上,并能達(dá)到第五或第六級(jí)別的高可用性?! ⊥ㄟ^虛擬化結(jié)合關(guān)鍵HA技術(shù)和實(shí)踐,數(shù)據(jù)中心也能在現(xiàn)有的主流數(shù)
4、據(jù)中心硬件和軟件平臺(tái)上實(shí)現(xiàn)更高可用性的益處。在本文中,TechTarget中國的特約作者BillWeinberg將解釋HA的組件以及如何使用高可用性方法增加數(shù)據(jù)中心可用性?! 「呖捎眯远x及測量 可用性一般表示為在給定時(shí)間內(nèi)(一般是一年),可用系統(tǒng)運(yùn)行時(shí)間與總體時(shí)間的比率。所以,如果你的架構(gòu)允許在一年365天里宕機(jī)一天的話,那么你需要的可用性是364/365或者99.73%?! √峁└叩燃?jí)可用性的系統(tǒng)根據(jù)其所支持的NINE數(shù)量提升自己。高的可用性系統(tǒng)能達(dá)到第四、五或六級(jí)。 在現(xiàn)實(shí)中,宕機(jī)是由統(tǒng)計(jì)平均故障時(shí)間(MTTF)得到的值表示的。和宕機(jī)一樣重要的
5、是修復(fù)故障——平均修復(fù)時(shí)間(MTTR)所需要的時(shí)間?! ∧敲纯捎眯詰?yīng)該這樣計(jì)算:可用性=MTTF/(MTTF+MTTR) 如果一個(gè)系統(tǒng)或組件提供50000小時(shí)MTTF,并且平均需要15分鐘修復(fù)替換(例如查找和換出磁盤或刀片),那么這個(gè)系統(tǒng)的可用性是99.9995%,或者說達(dá)到了第五等級(jí)?! 倪@個(gè)公式可以看出,通過使用更可靠的硬件和軟件組件,即增加MTTF,并且通過降低故障持續(xù)時(shí)間和影響,即減少M(fèi)TTR,這樣的架構(gòu)能增強(qiáng)整體可用性?! A:不是一刀切 非專業(yè)人員傾向于考慮將IT設(shè)備故障持續(xù)幾小時(shí)或幾天,正好相反,網(wǎng)絡(luò)數(shù)據(jù)架構(gòu)系統(tǒng)優(yōu)化后允許經(jīng)常的短期
6、斷電,通常是不到一秒一次,并且迅速恢復(fù)并正常運(yùn)行?! ≡跀?shù)據(jù)通信和電信行業(yè),HA性能建立在一個(gè)專門混合的和COTS硬件和軟件上。如今這種混合架構(gòu)包括高級(jí)的TCA刀片、冗余以太網(wǎng)、RAID、CarrierGradeLinux(電信級(jí)Linux,即CGL)、日志文件系統(tǒng)和HA中間件。數(shù)據(jù)中心和其他企業(yè)IT場所也能使用更多通用的硬件和軟件提升可用性?! ⊥ㄟ^部署以下和其他技術(shù)有助于提供更高的可用性:·消除CPU、存儲(chǔ)、界面及程序等的單點(diǎn)故障·加速故障檢測、隔離與解決 HA系統(tǒng)架構(gòu)首先通過冗余達(dá)到第一個(gè)設(shè)計(jì)目的,尤其是通過配置空閑的硬件和軟件處于不同的準(zhǔn)備狀態(tài)
7、:·熱備份:所運(yùn)行的硬件或軟件的額外實(shí)例,處于接近或精確追蹤實(shí)際使用資源的狀態(tài)。一臺(tái)熱備份刀片服務(wù)器將反射或檢測事務(wù)和其活動(dòng)副本的狀態(tài)數(shù)據(jù),最小化故障轉(zhuǎn)移的時(shí)間和破壞?!づ瘋浞荩╓armspares):硬件或軟件的可用實(shí)例,處于開啟或初始化狀態(tài),不會(huì)緊密地追蹤活動(dòng)資源的狀態(tài)。在故障轉(zhuǎn)移時(shí),暖備份必須在運(yùn)行的事務(wù)或會(huì)話之前重新構(gòu)建活動(dòng)狀態(tài)信息或重啟。·冷備份:與硬件或軟件類似的程序鏡像代替出現(xiàn)故障的活動(dòng)實(shí)例,不過首先必須啟動(dòng)、下載或者在故障發(fā)生之前初始化和重新構(gòu)建所有狀態(tài)信息。 一般來說,備份越及時(shí)(即越“熱”),解決方案就越貴。 第二個(gè)設(shè)計(jì)目的——加
8、速故障檢測、隔離及解決能建立在現(xiàn)有的故障檢測機(jī)制上,像設(shè)備驅(qū)動(dòng)暫停和協(xié)議重試。下面的技術(shù)通過流線化故障轉(zhuǎn)移、定期地支撐所運(yùn)行應(yīng)用的狀態(tài)、備份和同步化運(yùn)行硬件和軟件的狀態(tài)信息提升可用性:·健康監(jiān)控:通過軟件應(yīng)用編程接口與硬件接口監(jiān)控程序、界面、驅(qū)動(dòng)和硬件本身的狀態(tài)·頻率:健康的應(yīng)用或節(jié)點(diǎn)周期性地使用頻率監(jiān)控軟件檢測?!じ呋虻蜆?biāo)記:當(dāng)可用內(nèi)存、緩沖區(qū)、帶寬等這樣的資源達(dá)到臨界點(diǎn)和正常狀態(tài)時(shí),設(shè)置和恢復(fù)警告條件·監(jiān)視器:即系統(tǒng)范圍的計(jì)時(shí)器,重新啟動(dòng)或重新設(shè)置應(yīng)用以及整個(gè)已超時(shí)的操作系統(tǒng)。健康的節(jié)點(diǎn)隨著自身的運(yùn)行周期性地重新設(shè)置計(jì)時(shí)器。凍結(jié)的系統(tǒng)會(huì)讓監(jiān)視器超時(shí)。
9、·檢查指示:檢查應(yīng)用和操作系統(tǒng)本身或者通過外部守護(hù)進(jìn)程周期性地寫入日志或備份關(guān)鍵數(shù)據(jù)架構(gòu)、整個(gè)數(shù)據(jù)段或內(nèi)存鏡像。檢查過的數(shù)據(jù)可以離線保存或者用于動(dòng)態(tài)地更新暖或熱備份。 高可用性與虛擬化之間的關(guān)系是什么?虛擬化作為HA平臺(tái)需要用到哪些技術(shù)?得到了哪些附加好處?在本文的下半部分中,我們將一一為您解答。如何在虛擬環(huán)境里達(dá)到高可用性?(下)2009-1-13??大
10、中
11、小導(dǎo)讀:本文介紹通過虛擬化結(jié)合關(guān)鍵HA技術(shù)和實(shí)踐,數(shù)據(jù)中心也能在現(xiàn)有的主流數(shù)據(jù)中心硬件和軟件平臺(tái)上實(shí)現(xiàn)更高可用性的益處。關(guān)鍵詞:虛擬化HA高可用性正在加載數(shù)據(jù)...【TechTarget中國原創(chuàng)
12、】在本文的上半部分中,我們解釋了什么是高可用性(HA)、如何測量HA的公式以及增