
SQuAD挑戰賽最新成績(jì)榜單
2017年7月,科大訊飛憑借交互式層疊注意力模型(Interactive AoA Reader)獲得該賽事的榜首,并在同年10月進(jìn)一步優(yōu)化該模型后再次刷新紀錄。此次訊飛與哈工大聯(lián)合實(shí)驗室提交的融合式層疊注意力系統(Hybrid Attention-over-Attention Reader)融合了近期學(xué)術(shù)界提出的諸多前沿技術(shù),如基于上下文的文本表示、自適應轉隨機梯度下降的優(yōu)化方法等,同時(shí)又研發(fā)出一些全新技術(shù),不僅在SQuAD挑戰賽中取得亮眼成績(jì),在其他自然語(yǔ)音處理任務(wù)上也獲得了顯著(zhù)性能提升。

科大訊飛與哈工大聯(lián)合實(shí)驗室參賽提交系統一覽
機器閱讀理解技術(shù)目前已經(jīng)成為多家知名企業(yè)、高校等研究機構關(guān)注的對象,技術(shù)上的突破將帶來(lái)自然語(yǔ)言理解的長(cháng)足進(jìn)步。在與其他研究機構和高校一同探索技術(shù)發(fā)展的同時(shí),科大訊飛也在積極推動(dòng)該項技術(shù)在對話(huà)、問(wèn)答系統中的落地應用,其中一個(gè)重要場(chǎng)景就是與智能車(chē)載系統的對話(huà)交互的結合,逐步實(shí)現汽車(chē)領(lǐng)域的精準問(wèn)答。通過(guò)讓機器閱讀汽車(chē)說(shuō)明書(shū)及相關(guān)的介紹材料,使機器深度理解并掌握對該車(chē)型的相關(guān)知識;在用戶(hù)提出相關(guān)問(wèn)題時(shí),不僅能夠快速反饋給用戶(hù)相關(guān)章節,并且還能夠利用閱讀理解技術(shù)進(jìn)一步挖掘并反饋更精準的答案,從而減少用戶(hù)的閱讀量,提高信息獲取的速度。

科大訊飛執行總裁胡郁在2017發(fā)布會(huì )上介紹智能車(chē)載系統中閱讀技術(shù)的應用
科大訊飛不僅在SQuAD挑戰賽持續發(fā)力,也關(guān)注并積極推動(dòng)中文信息處理的研究發(fā)展。2017年,科大訊飛攜手中國中文信息學(xué)會(huì )計算語(yǔ)言學(xué)專(zhuān)業(yè)委員會(huì )(CIPS-CL)承辦了第一屆“訊飛杯”中文機器閱讀理解評測(CMRC2017),發(fā)布了相關(guān)中文閱讀理解數據集。今年,科大訊飛將繼續與中國中文信息學(xué)會(huì )計算語(yǔ)言學(xué)專(zhuān)委會(huì )共同舉辦第二屆“訊飛杯”中文機器閱讀理解評測(CMRC2018),進(jìn)一步促進(jìn)中文機器閱讀理解研究。
擁有廣闊應用場(chǎng)景的機器閱讀理解技術(shù)領(lǐng)域,未來(lái)將有怎樣的發(fā)展?
科大訊飛高級副總裁、AI研究院院長(cháng)、認知智能?chē)抑攸c(diǎn)實(shí)驗室主任胡國平表示,科大訊飛非常高興看到更多研究人員加入到機器閱讀理解技術(shù)的研究中來(lái)。前不久微軟亞洲研究院、阿里巴巴分別在EM指標上超過(guò)人類(lèi)平均水平,并且有許多中國團隊在榜單中名列前茅,我們對中國研究機構在這個(gè)領(lǐng)域所取得的好成績(jì)表示祝賀。但同時(shí),我們必須清楚地認識到,雖然目前的系統在SQuAD挑戰賽中超過(guò)了人類(lèi)平均水平,但這并不能代表機器在機器閱讀理解任務(wù)上“完全”打敗了人類(lèi)。
他表示,真正的閱讀理解過(guò)程遠比我們想象的要復雜,以目前的技術(shù)水平還很難做到深層的推理和歸納。鑒于此,目前科大訊飛還在積極探索其他類(lèi)型的閱讀理解,例如基于知識、常識的閱讀理解以及基于綜合線(xiàn)索的閱讀理解,并取得了一定的成績(jì)。相信在不久的將來(lái),科大訊飛將在機器閱讀領(lǐng)域為大家展示更多的可能。