
需求迫切,算力服務時延圈勢在必行
栗蔚表示,根據中國信通院數據顯示,我國算力規(guī)模排名全球第二且增速排名第一,但算力輸送效率不高。隨著數字化轉型的不斷深入,例如車聯(lián)網、實時渲染、AR/VR、智慧城市等應用對高算力、低時延的需求正在呈指數級增長,算力服務低時延的需求愈發(fā)迫切。
在此背景下,我國各省市陸續(xù)出臺降低算力時延相關文件,加速構建全國/省域/城市范圍的時延圈,推動算力服務的高效便捷使用,最終讓其如同水與電一樣,為數字產業(yè)發(fā)展提供有效支撐。
栗蔚介紹,傳統(tǒng)意義上,時延是指一個報文或分組從一個網絡的一端傳送到另一個端所耗費的時間。但是在算力服務時代,時延定義不僅局限在端到端網絡時延,延伸拓展至用戶獲取和使用算力服務的時間成本。
具體來看,“算力服務時延圈”是指一定區(qū)域范圍內,用戶根據業(yè)務需求端到端算力服務接入獲取的最大時延。可以說,時延將是衡量算力是否便捷、普惠和泛在的關鍵客觀指標。
目前,以運營商、云服務商為代表的算力服務供給側企業(yè),加速建設覆蓋全國范圍的算力基礎設施,強化云邊端統(tǒng)籌協(xié)同,統(tǒng)一提供多層級分布式云算力服務時延圈。
強化核心三要素,構建算力服務時延圈
栗蔚指出,構建算力服務時延圈,應重點基于用戶視角從算力供給、傳輸能力、協(xié)同調度三方面強化能力。
一是,構建云邊端多層次算力服務供給。建設多樣化、泛在云邊端算力服務,覆蓋中心、區(qū)域、邊緣算力異構節(jié)點,滿足實時渲染、安防監(jiān)控、車聯(lián)網、工業(yè)制造等不同場景的低時延計算需求。
二是,強化網絡數據傳輸質量。提升用戶“入算”能力,提高網絡接入能力,優(yōu)化拓撲分流架構,提升算力節(jié)點高速互聯(lián),降低算力服務獲取網絡時延損枆;提高數據傳輸效能,提升端到端數據傳輸分發(fā)速率、可靠性、安全。
三是,提升面向時延的全局統(tǒng)籌調度能力。強化全局資源視圖,將時延圈覆蓋范圍可視化集中呈現(xiàn);強化云邊端協(xié)同調度能力,根據不同業(yè)務屬性、時延需求,在滿足應用計算質量前提下,將請求調度到時延最佳匹配算力節(jié)點。
構建《算力服務時延圈評價模型》標準
為此,中國信通院提出《算力服務時延圈評價模型》標準,包含算力服務接入、算力數據傳輸、低時延調度、管理和可視化,以及面向場景的云游戲、車聯(lián)網等應用。
根據這些標準體系,云服務商可以很好地建立為用戶提供不同算力服務時延圈的分布式云服務,用戶也可以比現(xiàn)在更加享受實時調度等場景化需求。
栗蔚介紹,依托《算力服務時延圈評價模型》標準,建立統(tǒng)一監(jiān)測體系,通過部署探針和現(xiàn)場測試,2023年上半年中國信通院開展首批評估試點,對移動云、天翼云在北京、上海、廣州等互聯(lián)網邊緣云算力服務接入時延測試,測試結果顯示,不管哪個城市訪問邊緣云都是5毫秒以內。
面向未來,中國信通啟動算力服務時延圈領航計劃,聯(lián)合政產學研開展核心技術攻關,健全完善標準體系。同時,構建“1+2+N”模式,建立統(tǒng)一公共服務監(jiān)測平臺,采用定點探針監(jiān)測、現(xiàn)場實際兩種評測方式,對N個技術和應用場景開展試點驗證,定期發(fā)布監(jiān)測報告,總結成效問題,逐步構建覆蓋全國各省、市、區(qū)的多層級算力服務時延圈,降低用戶算力服務獲取和使用成本。