官方表示,當前,大模型正處在產(chǎn)業(yè)落地前期,高質(zhì)量的數據,是大模型實(shí)現產(chǎn)業(yè)化的關(guān)鍵要素。
對于以ChatGPT、文心一言為代表的生成式AI,海量的數據訓練、人工標注、指令微調、基于人類(lèi)反饋的強化學(xué)習(RLHF),可以讓大模型與人類(lèi)價(jià)值觀(guān)、思維方式不斷對齊,使大模型更加可用。
據介紹,為保障數據標注質(zhì)量,百度智能云搭建了全流程數據服務(wù)人才梯隊,海口數據標注基地現擁有數百名專(zhuān)職大模型數據標注師,標注師的本科率達到100%。
百度智能云方面表示,目前已經(jīng)在全國與各地政府合作,共建了十多個(gè)數據標注基地,累計為當地提供超過(guò)1.1萬(wàn)個(gè)穩定就業(yè)崗位,間接帶動(dòng)5萬(wàn)人就業(yè)。