科大訊飛車(chē)載導航語(yǔ)音合成系統探析
2009/09/30
從全球汽車(chē)產(chǎn)業(yè)發(fā)展狀況來(lái)看,智能語(yǔ)音技術(shù)在車(chē)載導航中的應用是一種新的、必然的趨勢。傳統的車(chē)載導航產(chǎn)品,是用眼睛看的方式獲取相關(guān)信息,對汽車(chē)駕駛者而言存在一定的安全隱患。智能語(yǔ)音技術(shù)在車(chē)載導航中的應用,變看為聽(tīng),極大提升了汽車(chē)駕駛的舒適性與安全性。
目前,國內車(chē)載導航制造廠(chǎng)商就語(yǔ)音技術(shù)在車(chē)載導航中的應用已經(jīng)達成了廣泛的共識,都在積極尋求智能語(yǔ)音技術(shù)提供商。那么,各車(chē)載導航制造廠(chǎng)商如何才能選購一款符合消費者使用需求的優(yōu)質(zhì)語(yǔ)音合成系統?基于對語(yǔ)音合成技術(shù)的開(kāi)發(fā)應用研究以及與車(chē)載導航廠(chǎng)商的合作經(jīng)驗,作為國內最大智能語(yǔ)音技術(shù)提供商的科大訊飛建議:車(chē)載導航廠(chǎng)商選購語(yǔ)音合成系統,可從以下4個(gè)方面進(jìn)行考量。
地名、路名的準確播報
在實(shí)時(shí)的導航過(guò)程中,需要播報大量動(dòng)態(tài)的地名和路名,傳統的真人錄音無(wú)法實(shí)現對如此海量數據的處理,導航設備的資源存儲空間有限,也無(wú)法容納大量的聲音文件。隨著(zhù)全國城市建設的提速,每過(guò)一段時(shí)間,就會(huì )有新的導航地圖發(fā)布、使用。如此的更新速度,也是傳統真人錄音手段望塵莫及的。而利用語(yǔ)音合成技術(shù)可輕松解決這一難題,將海量、動(dòng)態(tài)的信息實(shí)時(shí)轉化為語(yǔ)音播報給用戶(hù)。
中國地大物博、文化豐富,存在太多生僻地名、路名,有時(shí)普通大眾也不知道如何發(fā)音。生僻字、多音多義字大量存在,這就要求導航產(chǎn)品所選用的語(yǔ)音系統能夠實(shí)現地名、路名的準確播報,充分保證語(yǔ)音播報的質(zhì)量和正確率。不恰當或者錯誤的路名播報會(huì )誤導用戶(hù)行車(chē)方向以及浪費旅途時(shí)間,會(huì )給用戶(hù)帶來(lái)巨大的困擾甚至安全問(wèn)題,直接影響到用戶(hù)對車(chē)載導航產(chǎn)品的使用感受和信任度。
具備“語(yǔ)隨文變”的優(yōu)質(zhì)語(yǔ)音合成效果
語(yǔ)音服務(wù)不僅實(shí)現了便捷化、人性化的操作,更重要的是保證了駕駛者的安全。如何讓駕駛者無(wú)需繁雜操作就可以第一時(shí)間了解所需信息,清晰、流暢、自然準確的語(yǔ)音合成效果顯得至關(guān)重要。
導航過(guò)程中,語(yǔ)音合成系統應具備文本的自然播報以及強大的智能處理能力,真正實(shí)現語(yǔ)隨文變。部分導航文本具有特殊性,播報時(shí)需要考慮它們在日常導航里的通用稱(chēng)謂,例如G101——幺零幺國道;S309——三零九省道等等。漢語(yǔ)的詞語(yǔ)、成語(yǔ)和一般語(yǔ)境中有不少多音字,這就需要語(yǔ)音導航根據上下文和語(yǔ)境判斷這些多音字的讀音,同時(shí)還考慮到人名、地名等一些特殊情況。
另外,語(yǔ)音合成系統還必須根據上下文和語(yǔ)境正確判斷一些常見(jiàn)標點(diǎn)符號、特殊符號的合成效果,如 “$0.50”與“敖東/北大街”,應合成為“零點(diǎn)五零美元”、“敖東*北大街”。
與硬件設備的融合
語(yǔ)音合成系統能否與導航設備完美融合一直是車(chē)載導航制造廠(chǎng)商考察智能語(yǔ)音技術(shù)合作伙伴的關(guān)鍵。優(yōu)秀的語(yǔ)音合成系統應該具備強大的兼容性,實(shí)現內核與平臺無(wú)關(guān),任何平臺只需簡(jiǎn)單配置、編譯,即可完成移植。
此外,嵌入式環(huán)境下資源空間非常寶貴,語(yǔ)音合成系統應該在系統架構、代碼實(shí)現、資源結構等方面進(jìn)行大量的優(yōu)化工作,降低運算資源和存儲資源的需求。即使是一些低端的平臺,也能夠從容運行。同時(shí),語(yǔ)音合成系統應該提供不同的輸出采樣率,滿(mǎn)足各種播音設備,真正適應不同的平臺需求。
娛樂(lè )化需求設計
長(cháng)途的行駛過(guò)程中,同一種語(yǔ)音播報會(huì )讓用戶(hù)感到單調。如果語(yǔ)音技術(shù)提供商能夠提供不同發(fā)音人、方言發(fā)音以及定制特殊發(fā)音人等個(gè)性化需求設計,將會(huì )使駕駛旅途變得更輕松愉快。
娛樂(lè )化需求設計表現在一些人性化的設計上,如支持菜單播報、開(kāi)機問(wèn)候語(yǔ)、語(yǔ)音提醒等功能。不論是固定文本還是動(dòng)態(tài)文本,如“下班先去玩具店給兒子買(mǎi)禮物”,既能省去真人錄音的工作及其占用的寶貴空間,又能解決真人發(fā)音無(wú)法應對處理的動(dòng)態(tài)文本問(wèn)題。
未來(lái),語(yǔ)音合成系統將成為車(chē)載內信息獲取、互動(dòng)娛樂(lè )、程序操控的重要工具,這就需要語(yǔ)音技術(shù)提供商重點(diǎn)考慮語(yǔ)音車(chē)載導航的更廣泛的需求設計。
CTI論壇編輯
相關(guān)鏈接:
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩
开江县|
石泉县|
山东省|
海宁市|
綦江县|
大姚县|
冕宁县|
马龙县|
信宜市|
平和县|
奇台县|
巴东县|
巩留县|
鄂托克前旗|
八宿县|
即墨市|
炉霍县|
襄垣县|
华安县|
霍山县|
芦溪县|
谷城县|
安宁市|
玛多县|
辽源市|
吴江市|
承德县|
台中市|
邢台县|
津南区|
华阴市|
平凉市|
深圳市|
开化县|
化隆|
峨眉山市|
长泰县|
高陵县|
万年县|
高密市|
吴忠市|
http://444
http://444
http://444
http://444
http://444
http://444