更多虛機重啟優(yōu)先級
當故障轉移(failover)發(fā)生時(shí),虛機重啟優(yōu)先級決定了虛機重啟的先后順序。需要重啟的虛機被分配給還有空閑資源的服務(wù)器,高優(yōu)先級的虛機被優(yōu)先分配,然后是次一級優(yōu)先級的虛機,直到所有的空閑資源用完。服務(wù)器然后按照優(yōu)先順序啟動(dòng)虛機,如果資源不夠了,vSphere 會(huì )暫停重啟動(dòng)作,直到有足夠的資源可用(因為有其他的虛機釋放資源了)。
在 vSphere 6.5 中新增了兩個(gè)虛機重啟優(yōu)先級(下面標藍色的兩個(gè)級別),讓管理員有更多的配置選擇,把虛機的優(yōu)先等級分得更細。
- Highest
- High
- Medium
- Low
- Lowest

虛機重啟順序可控
一個(gè)多層應用(Multi-Tiered Application)是由多個(gè)虛機組成的,如數據庫、應用服務(wù)器、Web 服務(wù)器等,這些虛機的啟動(dòng)應該有一個(gè)先后順序,在一般的情況下,應該遵循數據庫→應用服務(wù)器→Web服務(wù)器的順序。vSphere 用 vApp 把這些虛機組成一組,作為一個(gè)整體來(lái)進(jìn)行管理。管理員可以給 vApp 分配資源,把 vApp 作為一個(gè)整體來(lái)啟動(dòng)或關(guān)閉等。在 vApp 的配置中,通過(guò)指定每一個(gè)虛機啟動(dòng)的延遲時(shí)間來(lái)調整各個(gè)虛機的啟動(dòng)順序。
vSphere 6.5 引入了虛機之間的依賴(lài)鏈機制來(lái)控制多層應用的啟動(dòng),通過(guò)指定虛機之間的依賴(lài)關(guān)系來(lái)定義它們的啟動(dòng)順序,這稱(chēng)之為順序可控的重啟(Orchestrated Restart)。在下圖的例子中,APP 依賴(lài)于 DB,WEB 依賴(lài)于 APP,所以它們的啟動(dòng)順序就如數字標識所示。vSphere 會(huì )檢依賴(lài)鏈的有效性,避免產(chǎn)生無(wú)效的依賴(lài)關(guān)系:
- 循環(huán)依賴(lài):例如下圖中 DB 又依賴(lài)于 WEB;
- 依賴(lài)關(guān)系跟重啟優(yōu)先級相矛盾:例如下圖中 APP 和 WEB 為高優(yōu)先級,但是 DB 卻被定義為低優(yōu)先級。

主動(dòng)預防系統故障
傳統的 HA 都是被動(dòng)的,只有當服務(wù)器故障時(shí),才會(huì )把受保護的虛機故障轉移(failover)到其他的服務(wù)器上去。現在主流的服務(wù)器廠(chǎng)商都提供了硬件系統的監控和預警功能,使得主動(dòng)預防成為可能。vSphere 6.5 可以通過(guò)插件與以下服務(wù)器廠(chǎng)商的系統管理工具相集成,以實(shí)現主動(dòng)預防式 HA(Proactive HA):
- Dell Openmanage
- HP Insight Manager
- Cisco UCS Manager
這些系統管理工具會(huì )把服務(wù)器的一些異常狀況向 vSphere 告警,例如某個(gè)散熱風(fēng)扇發(fā)生故障,某塊硬盤(pán)的讀寫(xiě)故障率超出正常閾值范圍等等。當這種告警發(fā)生時(shí),意味著(zhù)服務(wù)器處于亞健康狀態(tài),這時(shí) vSphere 就會(huì )把這臺服務(wù)器處于隔離模式(Quarantine mode),這意味著(zhù)該服務(wù)器上不會(huì )再啟動(dòng)新的虛機,并且 vSphere 會(huì )盡可能地把該服務(wù)器上的虛機 vMotion 到其他健康服務(wù)器上去。
傳統的 HA 是當服務(wù)器發(fā)生故障時(shí)才起作用,主動(dòng)預防式 HA 把故障防患于未然,主動(dòng)獲取服務(wù)器的故障預警,在宕機發(fā)生之前就把應用負載轉移到其他服務(wù)器上去,從而為企業(yè)關(guān)鍵應用提供更高等級的可靠性保護。
