2014年春節,隨著(zhù)華為IT容災現場(chǎng)指揮的一聲令下,華為開(kāi)始了數據中心帶業(yè)務(wù)容災演練,將500多個(gè)IT系統從深圳總部數據中心切換到南京容災中心,并在南京支撐全球業(yè)務(wù)正常運行一天后,回切至深圳數據中心。
從結果看來(lái),演練切換和回切堪稱(chēng)完美,這一過(guò)程中,沒(méi)有任何數據丟失和不一致。數據中心關(guān)鍵系統的切換和回切均在2小時(shí)內完成,其余系統4小時(shí)內全部完成。
華為數據中心帶業(yè)務(wù)容災演練實(shí)施過(guò)程圖
據悉,在容災中心運行期間,有近2500人正常使用ERP等相關(guān)系統,近13萬(wàn)人次訪(fǎng)問(wèn)企業(yè)BG官網(wǎng),有效支撐了業(yè)務(wù)連續性運作。
這是一次很有挑戰的容災演練。據華為企業(yè)業(yè)務(wù)BG規劃咨詢(xún)部部長(cháng)傅依林介紹,一是兩地之間的遠距離,深圳數據中心和南京數據中心相距1300多公里;二是環(huán)境復雜,涉及切換的系統超過(guò)500多個(gè),各系統之間有復雜的集成關(guān)系;三是數據量巨大。
華為數據中心容災規劃
華為從2001年開(kāi)始,在數據中心與容災的規劃、設計、建設與運營(yíng)上積累了豐富的經(jīng)驗。以三個(gè)階段劃分,為摸索階段、一主一備階段和未來(lái)的兩地三中心階段。
傅依林告訴記者,第一階段從2001年開(kāi)始,華為在北京建立ERP等關(guān)鍵系統的數據容災,2005年建立關(guān)鍵系統的同城同步容災,2008年實(shí)現國內外研究所重要研發(fā)數據異地容災。第二階段進(jìn)行了系統性的規劃和設計,2009年結合業(yè)界最佳實(shí)踐,華為發(fā)布了完整的容災管理體系。2010年啟用南京容災中心并整合容災為異地互備模式,建立專(zhuān)業(yè)容災運維組織。2011年開(kāi)始,陸續實(shí)施了多項容災演練,包括PDM單系統帶業(yè)務(wù)容災演練、LTC流程端到端集成容災演練、數據中心集成功能演練和最近的數據中心異地帶業(yè)務(wù)容災演練。
未來(lái)的容災模式是兩地三中心,按照華為規劃,華為將建成兩地三中心容災架構,實(shí)現關(guān)鍵業(yè)務(wù)同城雙活容災。傅依林介紹說(shuō),“深圳的數據中心是4000多平,往未來(lái)看,目前數據中心的容量是不能滿(mǎn)足未來(lái)10-15年的業(yè)務(wù)發(fā)展的。”
未來(lái)10-15年,隨著(zhù)業(yè)務(wù)的發(fā)展,華為企業(yè)數據中心面積將需要達到10000平米。“目前,新數據中心已經(jīng)完成設計并開(kāi)工建設,預計在2016年7月投入使用。”
同時(shí),在松山湖華為另有一個(gè)1200平米的數據中心,以后作為同城的容災中心。“因為異地的容災中心恢復的時(shí)間相對長(cháng)一些,主數據中心一旦出現問(wèn)題,可以在2小時(shí)內借助同城容災快速恢復關(guān)鍵業(yè)務(wù)。目標實(shí)現同城雙活的‘零數據丟失’、‘業(yè)務(wù)無(wú)感知切換’。”傅依林說(shuō)。
南京依然作為異地容災中心,整體看來(lái),華為兩地三中心的模式已經(jīng)完成了架構設計,并構成了容災路線(xiàn)圖。
華為容災能力
對華為來(lái)說(shuō),IT容災是公司業(yè)務(wù)持續運行的基礎性保障,對內支撐企業(yè)的長(cháng)期發(fā)展,對外支撐企業(yè)的社會(huì )責任以及客戶(hù)與行業(yè)的認證要求。華為目前有15萬(wàn)員工,分布全球150個(gè)國家,700多個(gè)辦公地點(diǎn),共有16個(gè)研究所。保證業(yè)務(wù)的連續性,要求IT系統的高可用,是業(yè)務(wù)運作與發(fā)展的首要內在要求。
“另外,華為跟很多跨國的運營(yíng)商打交道,例如BT、Vodafone等,他們對業(yè)務(wù)的連續性有很高要求,會(huì )到華為來(lái)認證具不具備這種容災能力。有了客戶(hù)要求,華為還要證明具不具備這種能力,自2005年以來(lái),華為就一直保持ISO20000、ISO 27001等有效認證,目前正在進(jìn)行Cobit評估準備等。”傅依林說(shuō)。
華為容災以在規劃、設計、建設與運營(yíng)方面已經(jīng)具備的全方位、端到端的數據中心與容災能力為支撐,除了在布局、選址、性能容量、技術(shù)標準的規劃能力外,傅依林表示,在數據中心容災系統設計上,華為沿公司主業(yè)務(wù)流分層分級構建容災環(huán)境,兼顧容災效果與成本:劃分為公司生存攸關(guān)的為Vital級別,運營(yíng)必須的為Critical級別,日常運作需要的為Important級別。通過(guò)在業(yè)務(wù)上的一些重要性來(lái)確定IT系統的級別,從而來(lái)甄別這些IT系統的不同級別的容災設計。
容災網(wǎng)絡(luò )設計與建設是華為的強項,華為在異地容災網(wǎng)絡(luò )中,采用網(wǎng)絡(luò )高可用和網(wǎng)絡(luò )架構雙冗余,骨干線(xiàn)路雙供應商,分支機構同時(shí)接入深圳數據中心和南京容災中心。保證5級QoS,實(shí)現重點(diǎn)業(yè)務(wù)重點(diǎn)保障。同時(shí)讓容災中心應用的防火墻策略與生產(chǎn)環(huán)境一致,確保容災中心應用實(shí)時(shí)可用。
在運營(yíng)上,“華為數據中心運行管理瞄準國際標準和最佳實(shí)踐,流程成熟度達到了持續改進(jìn)級。容災管理完美融于與華為IT基于ITIL V3的IT運行流程管理框架。”傅依林說(shuō)。
基于這一系列能力,即使面臨眾多挑戰下,華為如期完成數據中心容災演練。傅依林強調,“容災演練成功本身就標志著(zhù)華為容災能力得到驗證,作為一個(gè)全球化運作的企業(yè),這樣的成功案例本身就是一個(gè)很好的信息化建設樣板品,也對其他大型企業(yè)起到借鑒意義。”