
Google上周開(kāi)源了語(yǔ)音命令資料集( Speech Commands Dataset),可望加速開(kāi)發(fā)人員打造支援語(yǔ)音命令的各種應用。
此一語(yǔ)音命令資料集是由數千名不同的使用者念出30種命令文字,迄今總計采集了6.5萬(wàn)個(gè)只有1秒的語(yǔ)音檔。這些文字涵蓋了Yes、No、Up、Down、Left、Right、On、Off、Stop、Go,以及數字等,方便開(kāi)發(fā)人員用來(lái)訓練應用程式的基本語(yǔ)音介面。
迄今Google已開(kāi)源多項人工智慧專(zhuān)案,包含機器學(xué)習技術(shù)TensorFlow、自造者AI專(zhuān)案—AIY,以及用來(lái)采集語(yǔ)音片段的Open Speech Recording網(wǎng)路程式。
此外語(yǔ)音命令資料集是由TensorFlow與AIY團隊共同建立,以用它來(lái)增加TensorFlow的訓練與介面樣本程式,Google預期開(kāi)源後的資料集數量將會(huì )持續成長(cháng),以帶來(lái)更多不同的口音。