
因應語(yǔ)音辨識蔚為風(fēng)潮,Mozilla宣布啟動(dòng)第一個(gè)旨在訓練語(yǔ)音辨識app的開(kāi)源資料集的群眾募資計畫(huà)Common Voice。
這項專(zhuān)案在6月間釋出,目前已開(kāi)始訓練階段。Mozilla指出,現今許多軟件大廠(chǎng),包括Google、蘋(píng)果及亞馬遜都各自推出了語(yǔ)音辨識服務(wù),喊了個(gè)指令就可以開(kāi)始作業(yè),似乎很方便,但是這種大廠(chǎng)控制的語(yǔ)音辨識生態(tài)圈卻可能扼殺了創(chuàng )新者的進(jìn)入。
一來(lái),大廠(chǎng)只會(huì )著(zhù)重特定英文、中文、西文等等主流語(yǔ)言,而忽略了使用者較少的其他語(yǔ)言。二者,這些生態(tài)圈產(chǎn)生的資料集也為大廠(chǎng)控制,使得也有意開(kāi)發(fā)語(yǔ)音控制裝置的學(xué)生、新創(chuàng )公司及研究人員能存取的資料相當有限。
Common Voice專(zhuān)案現在開(kāi)始到秋天,邀請開(kāi)發(fā)人員大聲誦讀句子以協(xié)助語(yǔ)音辨識引擎的訓練,貢獻量沒(méi)有上限,該計劃預計匯集1萬(wàn)小時(shí)的語(yǔ)音錄音檔,也可協(xié)助聽(tīng)取驗證錄音檔的準確性。
Mozilla表示,資料量足夠后,預計2017年下半可以將Common Voice資料庫開(kāi)源釋出,用以支援語(yǔ)音辨識裝置、app及作業(yè)系統的開(kāi)發(fā)。