存算一體作為先進(jìn)計算技術(shù),從架構上突破馮·諾依曼架構存儲和計算分離導致的存儲墻和功耗墻問(wèn)題,可大幅提升算力和能效水平,在A(yíng)I時(shí)代的重要性日益凸顯。
中國移動(dòng)自2021年起開(kāi)展存算一體技術(shù)研究,并與高校和產(chǎn)業(yè)伙伴聯(lián)合推動(dòng)存算一體多技術(shù)路線(xiàn)探索和研發(fā)。2022年提出“如何實(shí)現存算一體芯片工程化和產(chǎn)業(yè)化”提案,并獲評為中國科協(xié)“10個(gè)對產(chǎn)業(yè)發(fā)展具有引領(lǐng)作用的產(chǎn)業(yè)技術(shù)問(wèn)題”之一;同年,聯(lián)合清華大學(xué)研發(fā)業(yè)界首款基于憶阻器的110nm制程存算一體SoC芯片,單芯片憶阻器集成規模突破300萬(wàn),算力能效較相同工藝下的主流GPU提升2個(gè)數量級,達業(yè)內領(lǐng)先水平。但從產(chǎn)業(yè)維度來(lái)看存算一體目前仍處于初級發(fā)展階段,主要廠(chǎng)商多聚焦在芯片研發(fā)層面,而在產(chǎn)業(yè)鏈其他環(huán)節難以集中力量開(kāi)展布局,導致缺乏成熟的軟件工具鏈和模型適配算法,缺少典型性的應用引領(lǐng)及相關(guān)的測試驗證標準平臺,產(chǎn)業(yè)生態(tài)構建存在諸多困難。
面對存算一體產(chǎn)業(yè)發(fā)展的挑戰,中國移動(dòng)聯(lián)合清華大學(xué)等高校和智存科技等頭部企業(yè),圍繞軟件、算法、應用環(huán)節的短板精準發(fā)力:在軟件方面,研發(fā)了適配存算一體芯片的半自動(dòng)化軟件計算引擎,支持面向存算一體計算架構的AI模型編譯、算子編排、模型部署和推理以及芯片性能模擬等功能,有效降低用戶(hù)開(kāi)發(fā)和部署門(mén)檻,開(kāi)發(fā)調試效率提升3倍以上。在算法方面,針對存算一體器件規模受限和模擬計算誤差的問(wèn)題,提出面向存算一體的模型壓縮、誤差補償和加噪訓練等適配算法,在保證計算準確性的同時(shí)將模型規模縮減至1/16,實(shí)現AI模型在存算一體芯片的高效、準確和魯棒運行。在應用驗證方面,實(shí)現存算一體芯片與自研的5G工業(yè)網(wǎng)關(guān)的硬件系統集成,并通過(guò)自研的軟件計算引擎輔助實(shí)現了多種人工智能模型的自動(dòng)部署和推理,在衛星圖像分類(lèi)、PCB板質(zhì)檢等場(chǎng)景完成應用驗證:其中衛星圖像識別準確率達96%以上,PCB板質(zhì)檢實(shí)現5種常見(jiàn)元件的精準識別和定位,并支持3種以上微小瑕疵的自動(dòng)檢測。
本次端對端技術(shù)驗證是存算一體由技術(shù)研究邁向產(chǎn)業(yè)應用的關(guān)鍵環(huán)節,中國移動(dòng)作為移動(dòng)信息產(chǎn)業(yè)鏈鏈長(cháng),將持續發(fā)揮產(chǎn)業(yè)引領(lǐng)作用,推進(jìn)產(chǎn)學(xué)研用合作,積極構建自主可控的存算一體新型算力生態(tài)。