我是盧松松,點點上面的頭像,歡迎關注我哦!
2012年6月,蘇格蘭皇家銀行在2012年6月份進行軟件升級以后,因為系統(tǒng)故障出現(xiàn)長達兩周的中斷,給銀行客戶帶來了重大的損失,最后不得不拿出1.25億英鎊進行賠付;
2017年12月,愛立信公司因軟件證書過期問題,在11個國家內(nèi)引發(fā)將近1天的網(wǎng)絡停運問題——這直接導致日本3000萬軟銀移動客戶與2500萬英國移動客戶無法正常聯(lián)網(wǎng),愛立信為此需要支付數(shù)千萬英鎊的賠償金;
2018年6月,美國航空公司旗下的全資子公司PSA航空公司的航班調(diào)度與追蹤系統(tǒng)就曾出現(xiàn)過問題,在7天之內(nèi)導致接近3000次航班被迫取消,直接經(jīng)濟損失高達3500萬美元……
以上發(fā)生在金融領域、通信領域、航空領域的這些事故,不過IT故障帶來損失案例中的冰山一角。除了上述列舉的這些領域外,網(wǎng)絡安全、醫(yī)療健康、警務管理、鐵路交通、零售服務等等,IT故障帶來的破壞可謂無處不在,根源就是這些事故中涉及的軟硬件高可用的不足。
就像車會拋錨,人會生病,服務器/線上應用等這些,硬件也好軟件也罷,都有無法保障100%可用性的時候。高可用架構設計的目的,就是為了保證服務器硬件故障時服務依然可用、數(shù)據(jù)依然保存并能夠被訪問。阿里云等云服務和應用就是極為重要的可對癥下藥的解決方案。
一、何為高可用?
隨著云計算的興起,阿里云等應用服務不斷普及,眾多企業(yè)進入云時代:云洽談、云招商、云簽約、云開工、云路演、云服務、云招聘……這一點,在三年新冠疫情期間,人們的體驗應當最為深刻:以阿里云等為代表的各種云服務,儼然成為無數(shù)企業(yè)和從業(yè)者在一次次的封控隔離期間,依然能夠保持運營效率和生產(chǎn)力的最終解決方案。這里面,保障一切服務、系統(tǒng)和線上應用之所以能夠順利正常持續(xù)運行,高可用是核心最關鍵的因素之一。
高可用幾乎涉及任何IT系統(tǒng),小到一個微服務,大到一整個完整的系統(tǒng)都會要求高可用,尤其是在大型的業(yè)務系統(tǒng)中,因為不同的服務之間存在互相依賴,因此高可用會被反復提及,每一個小的組件都要求滿足高可用,才能確保大的系統(tǒng)不會被拖累。
對于普通人來說,想要完全搞懂和理解清楚其含義,其實也不是很復雜的問題:高可用,又叫高可用性,英文叫High Availability,即根據(jù)預定義的服務級別承受所有運行中斷并繼續(xù)提供處理能力。涵蓋的運行中斷可以包括計劃外事件,例如軟件故障、硬件故障、電源故障和災難等。更直白地說法就是,高可用是一種面向風險設計,使系統(tǒng)具備控制風險,提供更高程度的可用性的能力。
舉個例子,比如說一個系統(tǒng)它一直能夠為你提供服務,那它的系統(tǒng)可用性就是100%。但實際上目前大部分企業(yè)的高可用目標是4個9,也就是99.99%,有幾個 9,就代表了你有多高的可用性,9越多,出現(xiàn)故障的時間就越短:
2個9:基本可用,網(wǎng)站年度不可用時間小于 88 小時;
3個9:較高可用,網(wǎng)站年度不可用時間小于 9 小時;
4個9:具有自動恢復能力的高可用,網(wǎng)站年度不可用時間小于 53 分鐘。
二、為什么說云是高可用的最佳載體?
傳統(tǒng)的高可用實現(xiàn)方式主要包括主從方式 (非對稱方式)、雙機雙工方式(互備互援)、集群工作方式(多服務器互備方式)三種。而在云計算環(huán)境中,高可用的實現(xiàn)方式主要以第二種和第三種方式為主,在保證高可用的同時,利用多機分擔負載,也具有高的擴展性(Scalability)。通常來說,云計算的計算資源和存儲資源是以集群形式實現(xiàn)的,特別強調(diào)可擴展性。
而在大數(shù)據(jù)爆發(fā)的當下,云計算的這種可擴展性,正是眾多企業(yè)所迫切需要的,企業(yè)數(shù)字化轉(zhuǎn)型已成為必然趨勢。Gartner調(diào)查顯示,2/3的企業(yè)領導者相信,企業(yè)必須加快數(shù)字化進程,才能保持競爭優(yōu)勢。為此,隨著數(shù)字化轉(zhuǎn)型進程的推進,數(shù)據(jù)量呈爆炸性增長,越來越多的行業(yè)用戶正在構建行業(yè)云,逐步將應用遷移至云上。
就目前而言,云架構已在各個領域大量運營,數(shù)據(jù)中心作為云資源的提供者承載了大量不同類型的應用,傳統(tǒng)單一的數(shù)據(jù)中心已發(fā)展成為內(nèi)分布式云數(shù)據(jù)中心模式,因此對于分布式云數(shù)據(jù)中心構成一體化高可用能力的需求也越來越迫切。為此,云之所以被稱為是高可用的最佳展現(xiàn)載體,其根本原因就在于:
1、高可用云服務,能夠基于租戶級別的備份,實現(xiàn)租戶災備數(shù)據(jù)安全隔離;
2、高可用支持異構云平臺間的災難恢復,滿足不同云平臺之間的災難恢復需求;
3、高可用提供永久增量備份、多節(jié)點并發(fā)備份,可為Hadoop、SAP HANA等平臺提供高效保護,大幅縮短備份所需時間;
4、高可用云服務,能夠通過打造兩地三中心災備架構,滿足更高等級保護需求;
5、高可用云服務,能夠提供智能的災備運維,簡化管理復雜度;
三、高可用表現(xiàn)有在哪些層面?
高可用自下而上可分為三個層面。首先是資源高可用。就云平臺而言,這通常指的是 IaaS 資源的高可用。IaaS 即 Infrastructure as a Service(基礎設施即服務), 一般指的是云平臺為用戶提供的 IT 基礎架構服務,如計算、存儲、網(wǎng)絡等,類似于大家生活中使用的水和電一樣。
其次是應用高可用。就云平臺而言,這通常指的是 PaaS 服務高可用。PaaS 即 Platform as a Service(平臺即服務), 一般指的是云平臺為用戶提供的中間件服務、數(shù)據(jù)庫服務、日志服務、大數(shù)據(jù)處理服務等一系列應用支持服務。
最后是服務高可用。就云平臺和對用戶而言,這通常指的是 SaaS 服務高可用。SaaS 即 Software as a Service(軟件即服務),一般我們指的是由軟件提供商和服務商在互聯(lián)網(wǎng)上直接提供給客戶,通常是面向最終用戶的多租戶服務。
隨著云平臺建設從初期進入“深水區(qū)”,企業(yè)對云平臺建設考慮的也從應用遷移上云,轉(zhuǎn)向后續(xù)的運維、災備、安全等在前期建設中容易忽視的場景。這些支撐服務型技術、應用的引入,也將貫穿在這三大層面上,成為進一步提高企業(yè)優(yōu)化“降本增效”效果的重要手段。
結(jié)束語
自2006云計算興起,到目前相關技術逐漸趨于成熟,高可用云平臺建設已初見成效。尤其是經(jīng)過三年疫情的催化,市場需求激增,政策持續(xù)加碼,相應的數(shù)字化技術也不斷突破。我們有理由相信,隨著企業(yè)數(shù)字化轉(zhuǎn)型進程加深,以及“上云“概念的普及化,高可用云服務大發(fā)展大應用的趨勢必然勢不可擋。未來企業(yè)業(yè)務的轉(zhuǎn)型、迭代和突破,高可用云服務將是強大助力。屆時上下齊心,必有所成。
文章來源:盧松松博客,歡迎關注我的賬號哦!
本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://www.gptmaths.com/cgo/model/93853.html