• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 新聞 > 國際 >
     首頁(yè) > 新聞 > 國際 >

    語(yǔ)音合成技術(shù)已接近人類(lèi)語(yǔ)言水平

    --DeepMind最新AI進(jìn)展

    2016-09-13 15:02:26   作者:   來(lái)源:雷鋒網(wǎng)   評論:0  點(diǎn)擊:


      AlphaGo背后的谷歌人工智能部門(mén)DeepMind近日披露最新研究成果,其正在設法研發(fā)出更為接近人類(lèi)實(shí)際語(yǔ)言水平的機器語(yǔ)音合成系統。據說(shuō),這個(gè)被稱(chēng)為Wave Net的新型人工智能系統是一種深層神經(jīng)網(wǎng)絡(luò ),能通過(guò)抽樣現實(shí)中的人類(lèi)語(yǔ)言形成原始音頻波形,最后達到生成語(yǔ)音的目的。 
      從面向廣大英語(yǔ)和普通話(huà)聽(tīng)眾的測試中發(fā)現,WaveNet的表現已經(jīng)優(yōu)于現有的語(yǔ)音合成系統,但結果還是略遜于人類(lèi)真正的語(yǔ)言水平。
      目前的語(yǔ)音合成系統只有兩種工作方式:第一種是截取實(shí)際的講話(huà)錄音,然后打碎重組成新的語(yǔ)音——有點(diǎn)像綁架電話(huà)慣用的手段;另一種是依賴(lài)電腦合成,通過(guò)編程生成語(yǔ)音,這意味著(zhù)它不需要預先錄制好語(yǔ)音材料,但是聽(tīng)起來(lái)的效果并不好,很像機器人。
      另一方面,WaveNet仍然使用真實(shí)的語(yǔ)音輸入,但通過(guò)學(xué)習和模仿來(lái)合成語(yǔ)音,而不是將其打破重組。項目的研究人員寫(xiě)道:“單單一個(gè)WaveNet就能以相同的保真度捕捉記錄下各個(gè)不同說(shuō)話(huà)者的特點(diǎn),并且可以任意切換聲音。”
      同樣令人印象深刻的是,它可以利用諸如唇部運動(dòng)和人工呼吸來(lái)模擬語(yǔ)調、情緒和口音。如果這還不夠,WaveNet也許還能像鋼琴一樣彈奏樂(lè )曲,研究人員只需提供一些經(jīng)典片段,它就能創(chuàng )作出自己的作品。
      DeepMind在Twitter發(fā)文稱(chēng):“讓人類(lèi)和機器對話(huà)是人機交互領(lǐng)域長(cháng)久以來(lái)的夢(mèng)想”

    專(zhuān)題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 鹤峰县| 江孜县| 桐庐县| 清流县| 连州市| 平山县| 武平县| 凤庆县| 格尔木市| 巴彦县| 额尔古纳市| 濮阳市| 惠州市| 阳东县| 陈巴尔虎旗| 库伦旗| 开鲁县| 韶关市| 原阳县| 始兴县| 维西| 什邡市| 邵武市| 连南| 枣阳市| 镇沅| 天台县| 柞水县| 固阳县| 蕉岭县| 柳江县| 朝阳区| 平湖市| 汶上县| 平江县| 健康| 宝坻区| 宣武区| 开阳县| 毕节市| 威信县| http://444 http://444 http://444 http://444 http://444 http://444