
近日,由中國信息通信研究院、深度學(xué)習技術(shù)及應用國家工程研究中心、人工智能關(guān)鍵技術(shù)和應用評測工信部重點(diǎn)實(shí)驗室主辦的2022可信AI峰會(huì )線(xiàn)上召開(kāi)。由捷通華聲參編的《大規模預訓練模型技術(shù)和應用評估方法》同步在峰會(huì )期間發(fā)布。

近年來(lái),大模型參數規模和模型性能不斷創(chuàng )出新高,逐步夯實(shí)人工智能技術(shù)底座,推動(dòng)人工智能向著(zhù)通用化、工業(yè)化、集約化發(fā)展。在此背景下,中國信息通信研究院聯(lián)合捷通華聲等行業(yè)內50余家單位,對大模型的工程化路徑進(jìn)行了深入研究和探討。面向大模型工程化多個(gè)重要階段構建了大模型標準體系,包含模型開(kāi)發(fā)、模型能力、模型應用和安全可信四個(gè)部分,本次會(huì )議發(fā)布了標準的前兩部分。
大模型憑借優(yōu)越的泛化性、通用性、遷移性,在零樣本、小樣本任務(wù)領(lǐng)域下表現出色,并成為人工智能新基建領(lǐng)域的熱點(diǎn)方向之一,同時(shí)也是AI產(chǎn)業(yè)發(fā)展底座的重要一環(huán)。捷通華聲作為國內領(lǐng)先的人工智能技術(shù)、產(chǎn)品與解決方案服務(wù)提供商,始終堅持關(guān)鍵核心技術(shù)自主研發(fā),致力于持續為客戶(hù)提供行業(yè)領(lǐng)先的AI體驗。目前捷通華聲已將大模型應用于多項靈云人工智能核心技術(shù)算法研究與模型訓練過(guò)程。
捷通華聲在研發(fā)靈云語(yǔ)義理解過(guò)程中,采用大規模預訓練,實(shí)現了從大量標記和未標記數據中捕獲知識,將知識存儲到大量的參數中,并對特定任務(wù)進(jìn)行微調,極大地擴展了模型的泛化能力。
此外,捷通華聲通過(guò)大模型的自監督學(xué)習方法,在一定程度上解決了數據標注過(guò)程中人工成本高、周期長(cháng)、準確度不高的問(wèn)題。同時(shí),使得小樣本的學(xué)習也能達到比以前更好的能力,且模型參數規模越大,優(yōu)勢越明顯,進(jìn)而實(shí)現使用小樣本就可以訓練自己所需模型的目的。
相比于傳統開(kāi)發(fā)模式,利用已訓練大模型進(jìn)行下游任務(wù)時(shí),可有效縮短開(kāi)發(fā)周期。在數字時(shí)代發(fā)展過(guò)程中,大模型能夠更好的幫助企業(yè)滿(mǎn)足業(yè)務(wù)場(chǎng)景多樣化、人工智能需求碎片化等行業(yè)數字化轉型需求。