不能懵,華為現在帶你一起,十問(wèn)數據中心!

人人聊,家家說(shuō),AI在數據中心真的落地了嗎?
自從AlphaGo戰勝了柯潔和李世石,如果一個(gè)科技圈或創(chuàng )業(yè)圈的精英不會(huì )聊兩句AI,出門(mén)兒都不好意思跟人打招呼。無(wú)比敬崗愛(ài)崗的數據中心從業(yè)者們當然也不能放著(zhù)這么好的技術(shù)不琢磨,不過(guò)關(guān)于A(yíng)I與數據中心,說(shuō)了不少,也聽(tīng)了很多。但新技術(shù)只有應用,創(chuàng )造出價(jià)值,才有繼續優(yōu)化和演進(jìn)的可能。
問(wèn):所以現在A(yíng)I在數據中心真的落地了嗎,應用了有什么好處?
答:落地了,實(shí)踐證明,AI是數據中心難得的行業(yè)轉折機遇,AI將使能數據基礎設施價(jià)值最大化。
問(wèn):那怎么用AI實(shí)現價(jià)值最大化呢?
答:以下有幾個(gè)經(jīng)過(guò)驗證的標準答案,要不借你“Ctrl C”一下。
1、讓AI時(shí)時(shí)給數據中心做CT
主動(dòng)預防,安全可靠
安全運行對數據中心的重要性不言而喻,業(yè)界在提升數據中心可靠性和可用性方面已有實(shí)踐,例如收集供配電系統設備信息,對即將發(fā)生故障的設備和部件提前發(fā)出預警,為運維人員的運維活動(dòng)提供決策支撐,但是如何利用機器的自我學(xué)習能力,做到供配電系統整體運行的安全可靠,是需要思考的重點(diǎn)問(wèn)題。要實(shí)現更高程度的智能化及主動(dòng)避錯,這對AI技術(shù)應用是個(gè)很好的契機。

華為融入AI性能的iPower技術(shù)可提升數據中心可用性,借助智能化硬件,實(shí)現智能故障定位與預警管理,引入大數據技術(shù),智能分析每日海量的運維數據,識別機房潛在隱患,保障數據中心的可靠運行。
iPower智能供配電技術(shù)以模塊化UPS為核心,主要通過(guò)供電全鏈路監測、預警和故障自動(dòng)隔離等手段,提高數據中心能源基礎設施可用性,繼而通過(guò)AI技術(shù)的應用,最終實(shí)現預測性維護。
iPower通過(guò)供電全鏈路監測,可實(shí)現毫秒級的故障檢測,毫秒級的故障隔離,分鐘級的故障恢復,可消除火災隱患,大大提高數據中心能源基礎設施可靠性和可用性;
以電池管理為例,在預防電池失效方面,iPower通過(guò)AI技術(shù),可以精確預測電池的壽命和健康度,為用戶(hù)提前提供維護決策依據,及時(shí)排除有失效隱患的電池組,變事后補救為事前預防,變被動(dòng)響應為主動(dòng)維護,大大提高數據中心供配電安全等級。華為的模塊化UPS結合iPower技術(shù),可以在電池出現溫度快速升高等極端情況下,自動(dòng)切斷該組電池,從而避免出現起火等惡性事件。
2、讓AI給數據中心做管家
智能營(yíng)維,自動(dòng)高效
數據中心傳統的維護方法是靠人,失誤率大、漏錯率高、失效排查時(shí)間長(cháng),傳統運維方式無(wú)法解決人為誤操作帶來(lái)的業(yè)務(wù)中斷問(wèn)題。
融入AI性能的 iManager,可看作是數據中心的大腦,借助智能化硬件和傳感器,實(shí)現精準感知。通過(guò)自動(dòng)化手段,逐步減少人工巡檢等例行重復性工作,池化專(zhuān)家資源和能力,并固化于運維流程中。
加上全流程的電子運維,包括巡檢、維保、應急演練,把所有的流程以及操作指導全部做到線(xiàn)上,實(shí)現了運維質(zhì)量從原來(lái)靠人的責任心到現在靠流程管理的轉變。通過(guò)全流程電子化的運維跟蹤,量化原來(lái)無(wú)法量化的信息,比如通過(guò)電子運維提升巡檢的執行力和運維活動(dòng)的質(zhì)量、實(shí)現故障的預測等,大幅提高人均運維效率和運維水平,提升數據中心的可靠性。
此外,市場(chǎng)上出現了越來(lái)越多由邊緣計算產(chǎn)生的邊緣數據中心機房,就近提供服務(wù)和處理計算。邊緣數據中心數量日益增長(cháng),分行、支行、網(wǎng)點(diǎn)等數據中心無(wú)法統一集中管理,數據中心故障響應速度慢,運維效率低。
華為iManager全網(wǎng)管理功能,實(shí)現對多網(wǎng)點(diǎn)數據中心基礎設施進(jìn)行集中監控,統一管理,實(shí)現預防性維護,通過(guò)GIS定位技術(shù)提高故障定位響應速度,提升數據中心運維效率;移動(dòng)APP監控,從內到外簡(jiǎn)化管理,輕松知曉海量網(wǎng)點(diǎn)數據中心運行情況,擺脫傳統人工的運維檢修方式,降低維護下站次數和節省開(kāi)支,讓數據中心管理變得更加簡(jiǎn)單、高效。
華為iManager還能對資產(chǎn)進(jìn)行盤(pán)查,保證設備的完整性,保護重要數據。另外,還可以對資產(chǎn)匹配最適宜的供電、制冷、空間、帶寬等資源,實(shí)現資源的最佳利用,利用AI技術(shù),可協(xié)助對資產(chǎn)上下架和運營(yíng)進(jìn)行智能化的管理,提升運營(yíng)效率和效益。
3、AI給數據中心唱首“涼涼”
降耗增效,綠色節能
能耗問(wèn)題一直是數據中心關(guān)注的焦點(diǎn),傳統數據中心年平均PUE高于1.8,隨著(zhù)越來(lái)越多AI應用的落地,業(yè)界對高速計算的需求日漸增多,GPU計算服務(wù)器的規模和需求將持續增長(cháng),加速計算服務(wù)器產(chǎn)生的熱能是傳統CPU的數倍,如何解決服務(wù)器的散熱問(wèn)題將是未來(lái)的重要考量。目前已有的智能DC節能技術(shù)可以通過(guò)傳感器獲取關(guān)鍵節點(diǎn)數據,進(jìn)而優(yōu)化所有系統和設備的整體能耗,降低PUE。
而AI能否深入數據中心內核,帶來(lái)更低PUE?華為作為ICT行業(yè)的領(lǐng)導者,在數據中心熱管理技術(shù)方面走在行業(yè)前端,致力于帶給客戶(hù)更低的PUE。
華為將基于A(yíng)I的iCooling智能熱管理解決方案融入數據中心基礎設施,針對數據中心制冷效率提升瓶頸,通過(guò)深度學(xué)習,打通精密空調末端、冷水機組、冷卻塔、水泵等制冷系統以及IT負載、環(huán)境變量等大數據之間的聯(lián)動(dòng),對大量的歷史數據進(jìn)行分析,探索影響能耗的關(guān)鍵因素,獲取PUE的預測模型。利用尋優(yōu)算法,獲取調優(yōu)參數組,下發(fā)到控制系統,實(shí)現制冷系統的最優(yōu)控制。最終通過(guò)規范化的實(shí)踐引導和目標導向評測,不斷調整優(yōu)化,獲取最佳PUE。
iCooling@AI解決方案目前已在華為云廊坊數據中心成功部署,全年P(guān)UE可降低超過(guò)0.1,年平均值達到1.3以下,年節約電費數百萬(wàn)元。