語(yǔ)音控制類(lèi)玩具的設計應該注意什么?

趙大有 2002/11/26

  當語(yǔ)音識別技術(shù)被玩具業(yè)所應用,對語(yǔ)音激活的滿(mǎn)足,和那種似乎能理解人類(lèi)的語(yǔ)音命令并對之做出相應的回應的最新一代玩具,迅速成為孩子們的新寵。更令人驚異的是他們能搞清孩子們說(shuō)話(huà)的意思,而且在玩耍的過(guò)程中遭到不可避免的物理?yè)p壞時(shí)還能繼續工作。

  今天應用在玩具上的語(yǔ)音識別技術(shù)不僅要求準確率和能在高噪音的環(huán)境下操作,還要求有系統的設計方法。語(yǔ)音技術(shù)家必須考慮從麥克風(fēng)和傳感器的放置到語(yǔ)音與機械系統的組合中的每一件事。從技術(shù)的角度來(lái)說(shuō),就是一個(gè)集成的、系統級的、整體產(chǎn)品的方案。

  最新一代的智能玩具能在外部刺激的基礎上改變他們的行為,能從過(guò)去的經(jīng)歷中進(jìn)行學(xué)習,給人一種印象:他們是真正的在跟孩子相互作用。語(yǔ)音的識別和激活--"理解"的能力和對所說(shuō)的話(huà)的反應--和語(yǔ)音合成--"說(shuō)"以前錄好的字和句子的能力--對這些玩具的智能部分是十分關(guān)鍵的。這些技術(shù)合在一起,使玩具看上去具有了生命。

  當把語(yǔ)音識別和合成的技術(shù)加入到玩具中時(shí),許多相互關(guān)聯(lián)的因素必須被指出。首先,永遠的,就是成本的問(wèn)題。玩具業(yè)在成本上的競爭是很殘酷的。當產(chǎn)品放到零售架上時(shí)技術(shù)成本會(huì )被打成四、五成,所以制造商在壓縮每一分錢(qián)上承受著(zhù)巨大的壓力。

  高度集成的語(yǔ)音方案--也就是說(shuō)芯片內部不僅包括了語(yǔ)音算法還包含了硬件電路,如麥克風(fēng)預放,ROM,RAM,DAC,ADC和揚聲器裝置等--極大降低了玩具的最終消費價(jià)格。成本較低的通用DSP可能看上去是提供語(yǔ)音能力的更好的方案,但當所有其他的支持該DSP的元器件被加上來(lái)時(shí),最終成本遠遠超過(guò)了集成方案的成本。

  語(yǔ)音識別的關(guān)鍵是正確率。說(shuō)話(huà)者獨立(不需要使用者進(jìn)行訓練'即先儲存使用者的聲音樣本')技術(shù)--該技術(shù)中軟件可以識別任何一個(gè)人的話(huà),使得玩具一出廠(chǎng)就顯得更容易接近,但通常無(wú)法有使用者自由升級,也就是說(shuō)玩具中所使用的語(yǔ)音命令(或者是對話(huà)的內容)是在工廠(chǎng)里固定了的。說(shuō)話(huà)者依賴(lài)(需要使用者進(jìn)行訓練'即需要先儲存使用者的聲音樣本')技術(shù)--該技術(shù)需要通過(guò)訓練來(lái)識別一個(gè)特定人的說(shuō)話(huà)方式,它會(huì )讓孩子們在設置的時(shí)候就能進(jìn)行學(xué)習,好處更在于能讓客戶(hù)創(chuàng )建自定義的詞匯。例如,玩具的主人可以給他們的木偶和玩具狗命名,然后用自己的獨特語(yǔ)言去定義玩具的各種動(dòng)作。比如,你要一條玩具狗走到你身邊,你可以說(shuō)"笨笨,快過(guò)來(lái)",也可以說(shuō)"小乖乖,來(lái)"--只要你喜歡,怎么說(shuō)都可以。更新的技術(shù)能讓玩具從一連串的話(huà)中聽(tīng)出獨立的關(guān)鍵字。

  語(yǔ)音識別引擎要能正常工作的話(huà)就必須收到一個(gè)高信噪比的干凈的語(yǔ)音輸入信號。信號的完整性會(huì )因很多因素的影響而被降低:例如不理想的布板(PCB電路),麥克風(fēng)的放置,連線(xiàn)的長(cháng)短、屏蔽,電源設計,產(chǎn)品的安放設計。對這些因素的仔細留意會(huì )讓識別算法發(fā)揮它最大的潛力來(lái)挑戰環(huán)境,例如噪音和遠距離。如果不考慮客觀(guān)原因,語(yǔ)音技術(shù)達不到100%的識別率的話(huà),玩具的普及性會(huì )很難。

  玩具設計者必須經(jīng)過(guò)長(cháng)久的思考、努力--要對孩子的精神有可靠的了解--來(lái)把語(yǔ)音識別和語(yǔ)音合成融合在玩具里。孩子們經(jīng)常不會(huì )遵循既定的規則,他們也不會(huì )做或說(shuō)成年人所規定、期待的東西。這一事實(shí)給玩具設計者帶來(lái)了很大的壓力,因為他們要創(chuàng )造出自然而又強大的用戶(hù)界面,要提供更寬廣的范圍給兒童自由選擇。語(yǔ)音識別技術(shù)的實(shí)踐證明孩子們必須通過(guò)玩具本身的設計來(lái)接受指導,讓他們使用特定的話(huà)語(yǔ)而非其他的。

  最后指出,有很多設計事項和語(yǔ)音識別或語(yǔ)音合成沒(méi)有直接關(guān)系,但對這兩項技術(shù)卻起著(zhù)關(guān)鍵性作用。

  語(yǔ)音技術(shù)毫無(wú)疑問(wèn)在未來(lái)的玩具業(yè)將扮演著(zhù)越來(lái)越重要的角色。但正如我們所見(jiàn),要把這項技術(shù)成功的融合到玩具里需要做的工作還很多。不僅僅只是建立算法來(lái)產(chǎn)生語(yǔ)音或識別語(yǔ)音。玩具設計者和語(yǔ)音專(zhuān)家需要在創(chuàng )建產(chǎn)品的一開(kāi)始就共同工作,共同創(chuàng )建孩子們喜歡,生產(chǎn)廠(chǎng)商又能夠制造的低成本的產(chǎn)品。今天的智能玩具也許只是孩子的玩物, 但他們的設計絕對是專(zhuān)家的領(lǐng)域。

深圳捷通公司供稿 CTI論壇編輯



相關(guān)鏈接:
捷通82語(yǔ)音識別模塊產(chǎn)品說(shuō)明書(shū) 2003-06-09
語(yǔ)音合成芯片情況介紹和產(chǎn)品設想 2003-05-06
數字可視復讀機方案 2003-04-09
語(yǔ)音識別控制電話(huà)機方案 2003-04-04
智能早教機方案 2003-04-03

分類(lèi)信息:  其它_與_語(yǔ)音識別ASR     文摘   行業(yè)_其它_解決方案   技術(shù)_語(yǔ)音識別_文摘
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 白山市| 隆化县| 突泉县| 鄂托克前旗| 清流县| 邯郸市| 肥城市| 平泉县| 万全县| 大化| 右玉县| 普兰店市| 枣庄市| 临邑县| 家居| 阜新| 台中市| 色达县| 杭锦旗| 景泰县| 南溪县| 阳曲县| 屏南县| 宝坻区| 运城市| 梁河县| 正安县| 长武县| 德安县| 定远县| 余干县| 钦州市| 岳普湖县| 闻喜县| 永清县| 莒南县| 应城市| 安仁县| 阳江市| 广东省| 虹口区| http://444 http://444 http://444 http://444 http://444 http://444