
現代的云數據中心有數以百計的服務(wù)器,上面運行著(zhù)上千個(gè)虛擬機,還有各種網(wǎng)絡(luò )設備和存儲,管理運營(yíng)數據中心是一個(gè)挑戰:需要監控的對象超出人力所及的范圍,需要分析的報警數據根本來(lái)不及處理。在這樣的壓力下,管理員疲于奔命,被動(dòng)式地響應服務(wù)請求,累得跟狗一樣還總是有人報怨故障解決得太慢,IT民工咋那么命苦呢?別著(zhù)急,vRealize Operations就是改變廣大運營(yíng)維人員命運的一款神器。
保證服務(wù)質(zhì)量
vROps會(huì )代替管理員監控數據中心內的所有設備,而且是24小時(shí)不間斷地,不會(huì )漏掉任何報警信息。但是它不會(huì )簡(jiǎn)單地把收到的信息直接呈現給管理員,而是進(jìn)過(guò)整理和分析之后進(jìn)行總結,過(guò)濾掉關(guān)于同一故障的大量冗余信息,最后以三個(gè)非常簡(jiǎn)單的超級指標形式展現:健康狀況、系統風(fēng)險、運行效率。管理員通過(guò)vROps及時(shí)發(fā)現和解決問(wèn)題,采取措施預防潛在風(fēng)險和提高運行效率,來(lái)保證整個(gè)數據中心的服務(wù)質(zhì)量等級SLA。

vROps會(huì )根據歷史數據進(jìn)行分析,對系統的性能和風(fēng)險作出智能預測,最后通過(guò)超級指標提示管理員。神奇的是,vROps不但通能指出問(wèn)題所在,而且能進(jìn)一步給出整改意見(jiàn)。
舉個(gè)栗子:在下圖中,vROps顯示“健康”和“風(fēng)險”這兩項指標都有問(wèn)題,管理員就應該看一下每個(gè)指標下的詳細信息。“健康”指標下的第一條警告顯示有些虛擬機由于快像太多而導致磁盤(pán)I/O延遲問(wèn)題,點(diǎn)開(kāi)后就可以看到進(jìn)一步的詳細指示:刪除多余的快像,把多余的快像合并成一個(gè)。管理員按照指示采取相應的操作之后,就可以消除這一系統性能問(wèn)題。

漲姿勢:虛機的數據存放在虛機的鏡像文件中,虛機的快像(snapshot)實(shí)際上是把虛機目前的狀態(tài)跟原鏡像之間的差異保存在一個(gè)delta文件中。當虛機有多個(gè)快像時(shí),就有多個(gè)對應的delta文件存在,每個(gè)delta文件記錄跟前一個(gè)虛機狀態(tài)之間的差異,虛機當前的數據是由所有這些delta文件和原鏡像疊加計算出來(lái)的。所以虛機的鏡像不宜太多,不然會(huì )嚴重降低系統性能,刪除一些不必要的快像可以減輕文件讀寫(xiě)負擔,提高系統性能。
提高運營(yíng)效率
從上面的例子可以看到,vROps不僅可以幫助快速定位問(wèn)題,還能指導管理員迅速解決問(wèn)題。據統計,vROps可以減少大約50%的排錯時(shí)間,從而大大減少管理員的工作負擔,好讓他們也有時(shí)間去陪妹紙呀。
為了防止容量不夠而引起故障,應用部門(mén)在申請虛機容量時(shí)往往向上靠,又導致了容量的過(guò)量分配。盡管VMware也提供了Thin Provision的虛擬硬盤(pán)分配選項,但是在服務(wù)器中經(jīng)常選擇性能更優(yōu)的Thick Provision,過(guò)量分配就會(huì )占用大量的硬盤(pán)空間。另一方面,有些虛擬機用完以后也沒(méi)有被及時(shí)注銷(xiāo),數據中心每隔一段時(shí)間就會(huì )出現僵尸虛機,也占用著(zhù)寶貴的內存和存儲空間。
vROps提供了容量分析工具來(lái)讓管理員定期檢查系統資源的使用情況,一旦發(fā)現資源不足(超出警戒線(xiàn))或是過(guò)量分配的情況,就能及時(shí)采取措施,來(lái)化解資源短缺的險情,回收過(guò)量分配的資源。這么做一方面可以有效防止因為資源短缺而引起的故障風(fēng)險,另一方面也可以有效利用現有的硬件資源,降低數據中心的硬件采購成本。
在啟動(dòng)新項目之前,管理員可以使用vROps來(lái)針對容量進(jìn)行What-If假設分析,看看現有的容量是否能滿(mǎn)足新項目的需求。如果容量不夠的話(huà),可以規劃一下需要加入多少新的服務(wù)器或存儲才能滿(mǎn)足新增需求;也可以查找可回收的資源,計算一下這些資源回收以后能否滿(mǎn)足需求。

漲姿勢:vSphere在創(chuàng )建虛機時(shí)虛擬硬盤(pán)有三種格式可以選擇:
Thick Provision Lazy Zeroed
一開(kāi)始就分配足額空間給虛擬硬盤(pán),但是等真正寫(xiě)入數據時(shí)才初始化(寫(xiě)0);
一開(kāi)始就分配足額空間給虛擬硬盤(pán),但是等真正寫(xiě)入數據時(shí)才初始化(寫(xiě)0);
Thick Provision Eager Zeroed
一開(kāi)始就分配足額空間給虛擬硬盤(pán),并且完全初始化(寫(xiě)0),性能最優(yōu);
一開(kāi)始就分配足額空間給虛擬硬盤(pán),并且完全初始化(寫(xiě)0),性能最優(yōu);
Thin Provision
根據虛擬硬盤(pán)的實(shí)際使用來(lái)分配空間,但在性能上要比上面兩種差一些。
根據虛擬硬盤(pán)的實(shí)際使用來(lái)分配空間,但在性能上要比上面兩種差一些。
控制和合規
出于安全、性能和管理等方面的要求,每個(gè)數據中心都有一系列的規章制度。舉個(gè)栗子:DCUI(Direct Console UserInterface)是vSphere在每臺物理服務(wù)器上的管理界面,它有一個(gè)LoginIdle Timeout參數一定要設置(建議設成10分鐘),不然管理員忘記Logout就走開(kāi)了,碰到惡意搞破壞的壞人就會(huì )有安全隱患。
類(lèi)似這樣的安全強制條例可能有上百條,數據中心的每一臺設備都要求符合這些規定。讓管理員一臺一臺去檢查嗎?別逗了,那別的工作什么都不用干了。vROps可以自動(dòng)檢查數據中心里所有設備的合規性(Compliance),把不合規的情況一條條列出來(lái),管理員可以隨后手工改正這些問(wèn)題,也可以讓vROps強制(Hardening)修正。

大家可能也聽(tīng)說(shuō)過(guò)VMware的另一個(gè)監控工具vRealize LogInsight,vROps跟它是什么關(guān)系呢?vROps跟LogInsight是這樣分工的,vROps負責收集和監控結構化的數據,包括各種系統指標、告警、事件等;LogInsight負責收集和監控非結構化的數據—所有的文本日志,這些日志分布在多個(gè)設備和服務(wù)中,由LogInsight來(lái)把它們收集到一起,這樣管理員就可以在一個(gè)地方看到所有的日志。兩個(gè)工具一起協(xié)作來(lái)共同支持數據中心中的運營(yíng)管理工作,實(shí)際上vROps和LogInsight也是所有vRealize套件產(chǎn)品中的基礎組件。

通過(guò)上面的介紹大家可以看到vROps有這么強的管理功能,有了這樣一個(gè)工具的幫助,云數據中心的管理工作就不再是MissionImpossible。
漲姿勢:vRealize產(chǎn)品家族
VMware把云管平臺產(chǎn)品家族命名為vRealize,包括4個(gè)主要產(chǎn)品:
- vRealize Business,IT資源成本核算
- vRealize Automation,自動(dòng)化部署IT服務(wù)
- vRealize Operations,監控運營(yíng)數據中心
- vRealize LogInsight,日志管理平臺
另外,也有以上幾個(gè)產(chǎn)品組合在一起的套件產(chǎn)品vRealize Suite,分成標準版、高級級和企業(yè)版三個(gè)不同等級的版本。