“重復勞動(dòng),效率低下,事情繁雜,出事背鍋”。這是一直以來(lái)數據中心網(wǎng)絡(luò )運維人員的切身感受。數據中心運維本來(lái)就是一個(gè)復雜的事情,用一個(gè)公式可以感受其中的難度:數據中心運維綜合復雜度=網(wǎng)絡(luò )技術(shù)×服務(wù)器技術(shù)×業(yè)務(wù)系統×工具×流程管理。
隨著(zhù)業(yè)務(wù)不斷增長(cháng),數據中心常見(jiàn)規模從以前幾個(gè)機柜,發(fā)展到如今成百上千個(gè)機柜,原先相對簡(jiǎn)單的運維工作,復雜程度呈幾何系數的增長(cháng)。這背后,是一大堆相關(guān)部門(mén)的協(xié)同工作,是夜以繼日的開(kāi)會(huì )、協(xié)同辦公,是運維人員的苦不堪言。
怎么辦?新華三的專(zhuān)家們給出的答案是“自動(dòng)化”。如圖一所示,在一臺設備的整個(gè)生命周期內,除了采購、上架/下架等工作必須要人來(lái)做,其余的配置、鏡像校驗、上業(yè)務(wù)、變更配置等工作,都是可以通過(guò)自動(dòng)化來(lái)實(shí)現的。

套路一:設備自動(dòng)化上線(xiàn)
網(wǎng)絡(luò )設備的自動(dòng)化上線(xiàn)又可以稱(chēng)為做自動(dòng)化部署,其中的難點(diǎn)就在于如何確定“自動(dòng)化上線(xiàn)”的這臺設備是一臺“怎樣的”設備。這就需要在自動(dòng)化部署之前,提前規劃好設備的耦合關(guān)系。
這些具體的“耦合”包括了設備的序列號、其所在的物理位置、這臺設備的“身份”,以及,其網(wǎng)絡(luò )配置,包含基礎配置如SNMP、AAA、鏈路聚合、網(wǎng)絡(luò )管理等,以及專(zhuān)屬配置如接口業(yè)務(wù)VLAN、IP地址信息、設備命名、描述信息等。
準備工作做好之后,其他的工作就可以“自動(dòng)”了。在具體實(shí)現途徑上,新華三提供了兩種不同的思路。一種是Python腳本方式,利用Python腳本,一一完成設備定位和配置工作。
另一種則是LLDP方式,這種部署方式通常用于增量設備部署。這種方式利用LLDP的鄰居發(fā)現特點(diǎn),自動(dòng)發(fā)現新增設備的物理所在位置,從而決定網(wǎng)絡(luò )設備的身份和角色。
套路二:配置自動(dòng)化變更
如今,數據中心運維人員還在持續使用CLI、SNMP等傳統網(wǎng)絡(luò )管理方式的話(huà),那就太OUT了。Netconf(Network Configuration Protocol 網(wǎng)絡(luò )配置協(xié)議)是現在運維人員眼中更高效、更便捷的網(wǎng)絡(luò )配置管理方式。它提供一種可編程的、對網(wǎng)絡(luò )設備進(jìn)行配置和管理的方法,可以通過(guò)該協(xié)議設置參數、獲取參數值、獲取統計信息等,第三方開(kāi)發(fā)也非常便利,很容易開(kāi)發(fā)出在混合不同廠(chǎng)商、不同設備的環(huán)境下的特殊定制的網(wǎng)管軟件。

在新華三的解決方案中,借助Netconf,解決了很多傳統網(wǎng)絡(luò )配置工具所難以實(shí)現的工作。如實(shí)現批量獲取設備的數據,實(shí)現批量修改設備配置數據,對不同廠(chǎng)商不同品牌的網(wǎng)絡(luò )設備實(shí)現統一封裝,標準化配置管理,減少甚至禁止人工對網(wǎng)絡(luò )設備的直接操作,減少誤操作幾率,強化操作審計等。
現在,越來(lái)越多的IaaS基礎架構采用OpenStack及OpenStack相關(guān)的商業(yè)定制版,在這些云環(huán)境中,如何實(shí)現自動(dòng)化呢?
答案就是借助H3C Neutron Driver。面對開(kāi)源社區版OpenStack、H3C CloudOS或者其他商業(yè)定制版OpenStack,H3C Neutron Driver都能夠實(shí)現配置自動(dòng)化部署,讓用戶(hù)的云運維更加輕松。
套路三:設備智能化
如今的網(wǎng)絡(luò )設備,已經(jīng)不再是“黑盒子”的概念。SDN的火熱,也帶動(dòng)了網(wǎng)絡(luò )設備的可編程能力。例如新華三旗下的數據中心級網(wǎng)絡(luò )設備均已支持SNMP、CLI、WEB、Python、Netconf、REST、XML、Bash、TCL等開(kāi)放可編程方式,還從多個(gè)維度開(kāi)放API接口供業(yè)務(wù)編排。
說(shuō)到SDN,必然要提起H3C VCFC控制器。大家都知道,OpenStack是從系統視角出發(fā),把網(wǎng)絡(luò )視為是一根根的導線(xiàn),但是對更復雜的資源對應沒(méi)有做深入定義。
對此,新華三認為,光有資源分配的入口還不行,需要SDN控制器(即VCFC)作為資源的調度中心,這樣的云環(huán)境才足夠智能。
套路四:可視化監控
隨著(zhù)網(wǎng)絡(luò )的不斷發(fā)展,越來(lái)越多的業(yè)務(wù)對網(wǎng)絡(luò )質(zhì)量產(chǎn)生了更高要求,而這些要求在運維人員看來(lái)很多時(shí)候無(wú)從下手,因為沒(méi)有一個(gè)專(zhuān)門(mén)的工具或者平臺來(lái)完成這些工作。
新華三正是看到了目前運維對網(wǎng)絡(luò )可視化的需求,從網(wǎng)絡(luò )設備本身角度出發(fā),做到了流量可視化、緩存可視化、芯片可視化。
不僅如此,新華三更近一步,實(shí)現了網(wǎng)絡(luò )路徑的可視化。在將網(wǎng)絡(luò )路徑拓撲呈現的基礎上,結合H3C VCFC控制器和網(wǎng)絡(luò )管理平臺,針對VxLAN環(huán)境和傳統IP網(wǎng)絡(luò )環(huán)境,幫助數據中心運維人員通過(guò)不同的技術(shù),實(shí)現一致的路徑展示。
套路五:運維大數據
如何利用好運維數據才是體現運維服務(wù)業(yè)務(wù)的價(jià)值關(guān)鍵。新華三提出了運維大數據的“相關(guān)性網(wǎng)絡(luò )”概念,將IT運維過(guò)程中各個(gè)信息元素進(jìn)行關(guān)聯(lián),對其進(jìn)行數據挖掘,提煉出運維維度的相關(guān)性。
具體來(lái)說(shuō),就是將運維工作劃分成網(wǎng)絡(luò )流量預測、網(wǎng)絡(luò )性能預測、網(wǎng)絡(luò )容量預測、故障預測等幾個(gè)維度。根據歷史數據,形成對未來(lái)網(wǎng)絡(luò )流量、容量等方面的預測,給運維決策提供依據,并且利用運維大數據平臺,將日志、告警、snmp、syslog等信息做統一收集,做數據轉換后形成故障推理,幫助用戶(hù)在一堆日志告警中精確判斷真正故障原因。
以上就是新華三針對數據中心運維提出的“五大套路”,套路背后,新華三更在乎的是這些運維自動(dòng)化的手段給用戶(hù)帶來(lái)的價(jià)值,將“套路”變成運維的“思路”。多一些“套路”,多一些真誠,面對壓力重重的數據中心運維工作,這種套路,希望還是越多越好。
新華三集團
新華三是全球領(lǐng)先的新IT解決方案領(lǐng)導者,致力于新IT解決方案和產(chǎn)品的研發(fā)、生產(chǎn)、咨詢(xún)、銷(xiāo)售及服務(wù),擁有H3C品牌的全系列服務(wù)器、存儲、網(wǎng)絡(luò )、安全、超融合系統和IT管理系統等產(chǎn)品,能夠提供大互聯(lián)、大安全、云計算、大數據和IT咨詢(xún)服務(wù)在內的一站式、全方位IT解決方案。同時(shí),新華三也是HPE品牌的服務(wù)器、存儲和技術(shù)服務(wù)的中國獨家提供商。
新華三是全球領(lǐng)先的新IT解決方案領(lǐng)導者,致力于新IT解決方案和產(chǎn)品的研發(fā)、生產(chǎn)、咨詢(xún)、銷(xiāo)售及服務(wù),擁有H3C品牌的全系列服務(wù)器、存儲、網(wǎng)絡(luò )、安全、超融合系統和IT管理系統等產(chǎn)品,能夠提供大互聯(lián)、大安全、云計算、大數據和IT咨詢(xún)服務(wù)在內的一站式、全方位IT解決方案。同時(shí),新華三也是HPE品牌的服務(wù)器、存儲和技術(shù)服務(wù)的中國獨家提供商。