
日前,Google推出旗下云端語(yǔ)音識別API(Cloud Speech API)正式版(GA),Google云端語(yǔ)音識別服務(wù)能夠實(shí)時(shí)辨識80種以上的語(yǔ)言,轉換成文字,連正體中文也可以辨識。
Google在2016年夏天釋出云端語(yǔ)音識別API公開(kāi)測試版,現在終于推出正式版,提供云端開(kāi)發(fā)人員使用。
而云端語(yǔ)音識別API采用與Google Now、Google搜尋及Google Assistant相同的語(yǔ)音識別技術(shù),根據Google,云端語(yǔ)音識別API是幾款預先訓練機器學(xué)習模型(Pre-Trained Machine-Learning Model)的其中之一,可以用來(lái)執行如影像分析、圖像分析、文字分析和動(dòng)態(tài)翻譯等常見(jiàn)的任務(wù)。
在正式版的云端語(yǔ)音識別API,Google加強了長(cháng)度較長(cháng)的音頻檔案轉錄精準度,以及新增支持WAV、Opus和Speex文件格式。Google也聲稱(chēng),新版語(yǔ)音識別API比舊版的批處理速度快3倍。
另外,目前已有廠(chǎng)商采用Google云端語(yǔ)音識別API,根據Google官網(wǎng),美國德州的電話(huà)語(yǔ)音SaaS開(kāi)發(fā)商InteractiveTel采用Google云端語(yǔ)音識別服務(wù),透過(guò)實(shí)時(shí)的語(yǔ)音轉文字,來(lái)分析業(yè)者與顧客在電話(huà)中的互動(dòng),以協(xié)助業(yè)者提升銷(xiāo)售業(yè)績(jì)。