資源描述:
《ArchSummit北京-《經(jīng)驗(yàn)分享:構(gòu)建OpenStack高可用云服務(wù)平臺(tái)》-吳德新》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、經(jīng)驗(yàn)分享構(gòu)建OpenStack高可用云服務(wù)平臺(tái)目錄?我們是誰?高可用介紹?OpenStack高可用方案?案例分享海云是誰?北京海云捷迅科技有限公司,簡稱AWcloud海云,國內(nèi)領(lǐng)先的企業(yè)級(jí)OpenStack云服務(wù)提供商?AWcloud海云成立于2010年,2012年開始專注OpenStack私有云服務(wù)?核心成員來自IBM/RedHat/甲骨文/綠盟/東軟?公司總部位于北京,在深圳、武漢、上海等地設(shè)有分支機(jī)構(gòu)?2013年10月獲得寶德科技A輪1500萬人民幣融資?2015年06月獲得INTEL領(lǐng)投的B輪數(shù)千萬人民幣融資海云業(yè)務(wù)?私有云解決
2、方案(PrivateCloudSolution):基于海云OpenStack發(fā)行版,支持KVM、Hyper-V、VMware等異構(gòu)虛擬化平臺(tái),為企業(yè)客戶構(gòu)建和管理私有云平臺(tái)。?私有云托管(PrivateCloudHosting):海云為企業(yè)客戶提供私有云托管服務(wù),幫助客戶一站式解決數(shù)據(jù)中心、硬件、存儲(chǔ)、云平臺(tái)、運(yùn)維等所有問題??蛻舭葱枳赓U整體云平臺(tái),按需付費(fèi)。?融合一體方案:海云為企業(yè)客戶提供AWcloud超融合一體機(jī),幫助企業(yè)實(shí)現(xiàn)IT系統(tǒng)快速部署、自動(dòng)化運(yùn)維。?IDC數(shù)據(jù)中心云平臺(tái)聯(lián)合運(yùn)營:聯(lián)合國內(nèi)知名IDC企業(yè),整合優(yōu)勢(shì)資源,為ID
3、C企業(yè)提供基于OpenStack技術(shù)的公有云平臺(tái),為IDC企業(yè)迅速轉(zhuǎn)型為VDC,提供平臺(tái)支持、技術(shù)支持和服務(wù)支持。?OpenStack咨詢與培訓(xùn):為企業(yè)客戶提供OpenStack運(yùn)維、開發(fā)的咨詢和培訓(xùn)。海云的技術(shù)團(tuán)隊(duì),具備豐富的一線運(yùn)營經(jīng)驗(yàn),可以為企業(yè)客戶提供成熟的OpenStack運(yùn)營和運(yùn)維服務(wù)。高可用介紹?Availablity=Fn(MTBF,MTTR)可用性百分比每年停機(jī)時(shí)間?通過避免單點(diǎn)故障來減少停機(jī)時(shí)間99%87.6小時(shí)99.5%43.8小時(shí)?冗余服務(wù)99.9%8.8小時(shí)–Active-Active?無狀態(tài)應(yīng)用99.95%4
4、.4小時(shí)?應(yīng)用內(nèi)置支持99.99%53分鐘–Active-Passive99.999%5.3分鐘?通過外部集群軟件Haproxy+Keepalived?Haproxy負(fù)載均衡?Keepalived切換虛IP?基于VRRP?高版本可以配置單播?避免Keepalived“腦裂”?ping網(wǎng)關(guān)?只有從節(jié)點(diǎn)可以failover,發(fā)生切換后通知管理員?配置簡單,適合于切換虛IP?沒有完整的服務(wù)管理和Fence機(jī)制Pacemaker?使用Corosync維護(hù)成員關(guān)系?Quorum機(jī)制?通過STONITH支持Fence?豐富的服務(wù)管理腳本?控制服務(wù)依
5、賴,主機(jī)親和力?豐富的文檔OpenStack架構(gòu)http://docs.openstack.org/openstack-ps/content/figures/2/figures/osog_0001.png基礎(chǔ)服務(wù)的高可用?MySQL?Galera多主,但只有一個(gè)可寫,避免死鎖同步復(fù)制,運(yùn)維方便,吞吐量有影響?原生的主從方案+MHA?RabbitMQ?RabbitMQ內(nèi)置集群機(jī)制?不要使用Haproxy,直接使用oslo.messaging的驅(qū)動(dòng)控制節(jié)點(diǎn)高可用架構(gòu)問題?單節(jié)點(diǎn)故障恢復(fù)時(shí)間,大概在一分鐘左右,這期間的客戶端請(qǐng)求可會(huì)出錯(cuò)?Ra
6、bbitMQ節(jié)點(diǎn)的消息同步是異步的,所以有可以碰到丟消息的情況?RabbitMQ出現(xiàn)過懸空consumer的問題,自制監(jiān)控腳本,用刪隊(duì)列并讓客戶端自動(dòng)重建隊(duì)列的方法解決。高版本增加客戶端應(yīng)用層面心跳有可能解決?使用memcached作為Keystone的token存儲(chǔ)時(shí),發(fā)現(xiàn)客戶端集群沒有fence/unfence機(jī)制,導(dǎo)致在節(jié)點(diǎn)故障時(shí)仍然連接故障節(jié)點(diǎn),延長重試時(shí)間后,又發(fā)現(xiàn)有丟token的現(xiàn)象。改為使用MySQL存放token,后來開發(fā)了Redis驅(qū)動(dòng)?服務(wù)啟動(dòng)順序有依賴關(guān)系,需要保證按順序啟動(dòng)?經(jīng)過優(yōu)化后,全部控制節(jié)點(diǎn)從斷電到完成恢
7、復(fù)需要5分鐘時(shí)間存儲(chǔ):數(shù)據(jù)平面(Ceph)?支持?jǐn)?shù)據(jù)多副本?數(shù)據(jù)按照CRUSH算法存放,可以考慮物理拓年?客戶端通過CRUSH算法來計(jì)算數(shù)據(jù)存儲(chǔ)位置?CephMonitor使用Paxos算法保證一致性http://pinrojas.com/2014/05/20/ceph-you-will-love-the-way-it-flies/網(wǎng)絡(luò)節(jié)點(diǎn)?DHCP運(yùn)行多個(gè)Agent,地址分配由Neutron控制?虛擬路由器通過Keepalived互備?在L版本里修復(fù)和L2pop的沖突?不支持連接跟蹤信息failover?單個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)在可用性和性能都可
8、能成為瓶頸?社區(qū)DVR功能并不成熟?可以根據(jù)需求考慮使用物理網(wǎng)絡(luò)設(shè)備管理三層虛擬機(jī)高可用方案?在虛擬機(jī)內(nèi)運(yùn)行集群?SDN的限制?多播?Neutron的allowed-address-pairs?虛IP的切換