數據中心是一個(gè)非常復雜的信息綜合系統,涉及到網(wǎng)絡(luò )、服務(wù)器、監控、存儲、消防等方方面面,耗費著(zhù)大量的人力。雖然近幾年關(guān)于無(wú)人值守數據中心的技術(shù)在不 斷普及,但對于大型的數據中心,系統過(guò)于復雜,業(yè)務(wù)非常重要的仍需要有人24小時(shí)在線(xiàn)值守,其實(shí)對于數據中心,在建成開(kāi)始運營(yíng)后,數據中心的主要工作就轉向了線(xiàn)上業(yè)務(wù)的調整、變更、軟硬件升級、更換等工作,其它方面的工作是比較少的,所以有些大型數據中心慢慢的在向無(wú)人值守方向發(fā)展。一般是本地數據中心留有具備基本技能的工程師值守,比如調整個(gè)網(wǎng)線(xiàn)、換個(gè)設備、做下軟件升級等基礎性工作,遠程后臺有技術(shù)專(zhuān)家支撐。更多的技術(shù)專(zhuān)家幾乎都是通過(guò)遠程來(lái)管理和控 制數據中心的,本文將講述那些管控數據中心的技術(shù)方法。
遠程管控你的數據中心,首先當然要可以遠程進(jìn)入到數據中心內部。數據中心內部其實(shí)是由成千上萬(wàn)臺的設備組成的,要保證所有的設備都可以遠程訪(fǎng)問(wèn),那么就需 要建立一條接入數據中心的VPN隧道,數據中心有公網(wǎng)的地址可供外界VPN接入網(wǎng)絡(luò ),通過(guò)防火墻來(lái)嚴格控制接入的安全性,對于數據中心如果對于接入者沒(méi)有 很好的管理措施,一旦被黑客所攻擊,數據中心的一切數據都可以被竊取甚至損壞,所以一定要把好安全這關(guān)。有了這樣一個(gè)訪(fǎng)問(wèn)通道,數據中心的運維技術(shù)專(zhuān)家只 要接入互聯(lián)網(wǎng),就可以隨時(shí)隨地訪(fǎng)問(wèn)數據中心內部設備,進(jìn)行管理和故障診斷等工作。在有些大型的互聯(lián)網(wǎng)公司,由于在全國各地都有數據中心,這樣在總部的網(wǎng)絡(luò ) 中就可以直接訪(fǎng)問(wèn)各地的數據中心內部,這樣整個(gè)公司內部互訪(fǎng)都屬于內部訪(fǎng)問(wèn),這種訪(fǎng)問(wèn)安全性更高些,整個(gè)公司的所有數據中心都是與外界隔離的,各地數據中 心都是通過(guò)VPN進(jìn)入公網(wǎng)隧道來(lái)保證安全性的。
其次,現在平板電腦、智能手機已經(jīng)非常普及,這些方式也可以通過(guò)互聯(lián)網(wǎng)接入到數據中心內部,在智能手機的應用商店很容易就可以找到telnet、ssh訪(fǎng) 問(wèn)設備的應用程序,安裝后只要輸入數據中心的公網(wǎng)地址,就可以通過(guò)移動(dòng)互聯(lián)網(wǎng)進(jìn)入數據中心。最近很火的BYOD就是基于智能手機的解決方案,實(shí)現人們隨時(shí) 隨地辦公的愿望,這種方式同樣也會(huì )提升數據中心的管理實(shí)時(shí)性。現在的數據中心管理軟件已經(jīng)變得比較智能了,當數據中心自身運行出現一些異常時(shí),就是打印一 些告警,這些告警完全可以通過(guò)網(wǎng)絡(luò )直接自動(dòng)發(fā)送到數據中心相關(guān)人員的手機上,讓所有人及時(shí)掌握數據中心的運營(yíng)狀態(tài)。
再次,市面上出現了一些專(zhuān)門(mén)制作這類(lèi)遠程管理的軟件公司。其中Teamviewer就是一個(gè)能在任何防火墻和NAT代理的后臺用于遠程控制的軟件,騰訊 QQ里的遠程協(xié)助與Teamviewer功能類(lèi)似。通過(guò)Teamviewer可以直接控制遠端數據中心的設備,實(shí)現遠程桌面、文件快速傳輸等功能,不過(guò) Teamviewer是收費軟件,相比起來(lái)使用騰訊QQ更劃算一些。要進(jìn)行遠程控制,首先要兩方電腦都必須執行Teamviewer,運行 Teamviewer后,Teamviewer的服務(wù)器會(huì )自動(dòng)分配一個(gè)ID和密碼給你,ID是固定的,但密碼隨機,這樣相比QQ安全性更高,建立連接后, 可以進(jìn)行聊天對話(huà)、視頻會(huì )議、遠程操作等。不過(guò)這種Teamviewer使用的前提是兩方都要有人,這樣才能操作建立連接。就像QQ,一端發(fā)起連接請求 時(shí),對方必須有回應才能建立起來(lái),如果現場(chǎng)無(wú)人這種方式就無(wú)法進(jìn)行了,使用上受到一定的限制。這種兩邊都有人的控制還有一種常用的方式,就是在數據中心現 場(chǎng)工程師通過(guò)PC連接到數據中心網(wǎng)路中,PC再通過(guò)智能手機連接到互聯(lián)網(wǎng)上,這樣遠程技術(shù)專(zhuān)家就可以通過(guò)無(wú)線(xiàn)網(wǎng)訪(fǎng)問(wèn)到數據中心內部來(lái),這種方式在現在數據 中心運維中非常常見(jiàn)。
最后,在數據中心內部除了網(wǎng)絡(luò )、存儲、服務(wù)器之外還有多個(gè)子系統,比如機房?jì)炔繙囟冗^(guò)高、設備掉電等異常出現時(shí),如何在遠端也能隨時(shí)知道,這就需要在本地 數據中心內部建立一套完整的自動(dòng)監控系統,監控系統不僅監控者主要網(wǎng)絡(luò )設備、服務(wù)器設備的運行,還對溫濕度、電力運行情況進(jìn)行管理,當機房溫度過(guò)高時(shí),系 統會(huì )自動(dòng)發(fā)出告警,將告警及時(shí)發(fā)向管理中心以及每個(gè)數據中心相關(guān)人員的手機、平板等終端設備上,這樣相關(guān)人員還可以通過(guò)遠程來(lái)調節空調的溫度,通風(fēng)口的大 小,讓數據中心內部溫度恢復正常,這個(gè)過(guò)程都不需要數據中心內部有人在。當有設備故障時(shí),數據中心會(huì )自動(dòng)切換到正常設備上,并向數據中心相關(guān)人員發(fā)出警告,這樣相關(guān)人員及時(shí)協(xié)調硬件備件進(jìn)行更換處理。
通過(guò)以上一系列的手段,可以實(shí)現讓你隨時(shí)隨地控制數據中心的愿望。當然,只要是軟件總會(huì )有Bug,有一句俗話(huà)叫做“眼見(jiàn)為實(shí)”,通過(guò)遠程所看到的信息展現 的只是局部,也許只是一個(gè)假象,不排除此時(shí)是軟件運行出了Bug,出現了誤報,這些事件都時(shí)有發(fā)生。我們在充分使用這些高科技手段來(lái)管理數據中心時(shí),也要 保持一顆謹慎的心態(tài),不放過(guò)任何細節。美國的無(wú)人機技術(shù)很發(fā)達,無(wú)人機經(jīng)常通過(guò)遠程人為控制來(lái)進(jìn)行特定目標的轟炸,然而誤傷事件頻頻出現,所以任何技術(shù)都 有不靈、出錯的情況。我們通過(guò)遠程管理數據中心,提升了工作的效率,但也需要周期性的安排技術(shù)人員到數據中心現場(chǎng)進(jìn)行檢查,及時(shí)發(fā)現一些隱患并消除掉。采用遠程管理加上周期性檢查的方式不失為未來(lái)數據中心最好的管理模式。實(shí)現隨地隨地管控你的數據中心并不難,就看你如何才能更好地利用好它。