宋慶春指出,當前數據中心異構算力需求正在不斷提升,主要包括三個(gè)方面,一是HPC高性能業(yè)務(wù)不斷增長(cháng);二是AI應用對算力需求正在不斷提升,包括大規模訓練、推薦、推理系統等均需要大規模算力支撐;三是數字孿生、元宇宙等技術(shù)發(fā)展,對高性能、AI算力需求快速增長(cháng)。多種異構算力需求場(chǎng)景的涌現也對數據中心算力基礎設施發(fā)展帶來(lái)巨大挑戰,用戶(hù)一方面需要算力平臺提供高可靠的算力性能,另一方面又希望算力平臺的功耗維持在較低水平。
“在傳統計算架構中,CPU要參與到除加速計算外的所有事情,容易產(chǎn)生系統性能瓶頸,在性能和能耗間難以實(shí)現協(xié)同提升。”宋慶春講道。對此,他認為云原生超級計算架構能夠有效平衡性能提升和節能減排,是未來(lái)數據中心計算架構的重要方向。
宋慶春表示,云原生超級計算架構的核心是將原先由CPU執行的操作卸載到DPU上,將存儲、計算框架等管理平面上的操作同樣卸載到DPU上,釋放CPU、GPU資源,使CPU、GPU能夠更加集中的處理業(yè)務(wù),DPU上的算力也可實(shí)現算力共享,最終確保CPU、DPU、加速器和網(wǎng)絡(luò )協(xié)同工作,數據在哪里,計算就在哪里,由此形成更高性能、更環(huán)保、更安全的計算平臺。
最后,宋慶春總結道,NVIDIA將持續關(guān)注網(wǎng)絡(luò )異構計算的發(fā)展,為用戶(hù)提供高性能、低功耗的計算、存儲及網(wǎng)絡(luò )產(chǎn)品,提供高品質(zhì)的云原生超級計算架構,促進(jìn)數據中心異構計算向前發(fā)展。