手機里的語(yǔ)音技術(shù),你了解嗎?
手機嵌入式語(yǔ)音應用介紹
2006/02/24
隨著(zhù)人們對各種終端設備智能化程度要求的提高,語(yǔ)音技術(shù)正發(fā)揮著(zhù)越來(lái)越重要的作用。語(yǔ)音技術(shù)的應用就相當于給終端設備裝上了嘴巴和耳朵,使得終端設備成為一個(gè)能說(shuō)會(huì )道又聽(tīng)話(huà)的智能設備。
隨著(zhù)經(jīng)濟的發(fā)展,人們生活水平的提高,手機的使用日漸普及,并且人們對手機的娛樂(lè )性和智能化要求越來(lái)越高,給語(yǔ)音技術(shù)在手機上的應用帶來(lái)了機遇。語(yǔ)音技術(shù)的應用將使手機變得更加智能,更加好玩,并且使用更加方便。這無(wú)疑會(huì )成為手機的一大特色,受到消費者們的喜愛(ài),并且會(huì )成為一種流行趨勢。
當手機具有語(yǔ)音合成功能時(shí),我們的手機就可以"說(shuō)話(huà)"了。
當有來(lái)電時(shí),如果來(lái)電號碼在我們的通訊錄里有,手機就可以播報出來(lái)電者的姓名,如果通訊錄里沒(méi)有,手機就可以播報出電話(huà)號碼。并且,如果預先讓手機具有識別區號和手機號所屬地區的功能,那么它還可以變得更智能一些,可以播報出是哪個(gè)地方的誰(shuí)來(lái)的電話(huà)。
當有新的短消息到達時(shí),手機可以為我們讀出短信息的內容和來(lái)信人的姓名,當然為了保護我們的隱私,也可以設置不讓手機自動(dòng)閱讀短消息,在我們讓它讀的時(shí)候它才讀,通過(guò)一個(gè)按鍵便可以控制。
顯然,如果在駕車(chē)狀態(tài)下使用語(yǔ)音智能手機,那么將達到駕車(chē)、通訊兩不誤的效果,并且提高了駕駛的安全性。
另外,我們也可以把鬧鈴的鈴聲設置成個(gè)性化的語(yǔ)音提醒,例如可以讓手機說(shuō):"懶蟲(chóng),起床了",等所有您想讓手機喊您起床時(shí)說(shuō)的話(huà),而且可以天天更換,您所要做得只是輸入您想手機說(shuō)的話(huà)的內容,這樣,連您起床時(shí)都可以不用聽(tīng)老套的鬧鈴的鈴聲了,而是聽(tīng)您想聽(tīng)的話(huà)。同時(shí),日程表也可以用語(yǔ)音合成讀出來(lái),當有日程提醒時(shí),我們不用看手機,就知道該干什么了。
當手機具有識別功能后,我們的手機就變得"聽(tīng)話(huà)"了。
當我們需要查找某人的電話(huà)號碼時(shí),我們再也不用不停地按手機按鍵來(lái)查找了,只需對著(zhù)手機說(shuō)出我們要找的人的名字,手機便可以自動(dòng)幫我們找出要查找的人的所有的電話(huà)號碼,并且用語(yǔ)音提示您當前所處的是哪個(gè)號碼。
要打電話(huà)嗎,同樣簡(jiǎn)單,對著(zhù)電話(huà)喊一下就行了,同時(shí)手機還會(huì )給您反饋,提醒您撥打的是哪個(gè)號碼,防止您撥錯了可以及時(shí)停止操作。另外,還可以用語(yǔ)音的方式實(shí)現很多常用的功能,如我們可以對著(zhù)手機說(shuō):打開(kāi)通訊錄,打開(kāi)收信箱,打開(kāi)系統設置等等很多命令,手機接收到之后便可以執行相應的命令。這樣可以大大節省您進(jìn)行復雜的按鍵操作所需要的時(shí)間。
目前,市場(chǎng)已經(jīng)有較多具有語(yǔ)音功能的手機,特別是語(yǔ)音識別方面,已經(jīng)有很多手機應用了這種功能。而在合成方面則只有比較少數的機型才具有,當然還有一些公司推出了一些既具有合成功能又具有識別功能的智能手機。如磨托羅拉A728,A760,A780等既具有合成功能又具有識別功能,還有很多產(chǎn)品具有識別功能,諾基亞很多產(chǎn)品具有識別功能,三星也推出了多款具有合成功能的手機和具有識別功能的手機。
我們可以預期,隨著(zhù)人們對手機娛樂(lè )性和智能化的不斷追求,同時(shí)在這些大型手機制造商的帶領(lǐng)下,語(yǔ)音技術(shù)的應用必將成為手機行業(yè)的一個(gè)應用潮流。
目前,國內提供語(yǔ)音技術(shù)的有很多家,其中以安徽中科大訊飛在中文語(yǔ)音技術(shù)方面具有最好的效果。并且在手機上已經(jīng)有較多的成功應用案例。
據了解,安徽中科大訊飛信息科技有限公司是于1999年6月在國家智能計算機研究開(kāi)發(fā)中心、中國科學(xué)技術(shù)大學(xué)人機語(yǔ)音通信實(shí)驗室的基礎上組建,專(zhuān)注于語(yǔ)音技術(shù)的核心研究及其產(chǎn)業(yè)化的一家高新技術(shù)企業(yè)。經(jīng)過(guò)幾年的發(fā)展,該公司已經(jīng)成為中國產(chǎn)業(yè)化實(shí)體中,在語(yǔ)音技術(shù)方面基礎研究時(shí)間最長(cháng)、資產(chǎn)規模最大、歷屆評測成績(jì)最好、專(zhuān)業(yè)人才最多的公司,并且獲得了多項中文語(yǔ)音研究和產(chǎn)業(yè)界最高榮譽(yù),2003年獲得"國家科技進(jìn)步二等獎"和"中國十大杰出青年科技創(chuàng )新獎",2005年獲得05年"國家信息產(chǎn)業(yè)重大技術(shù)發(fā)明獎"獎。
經(jīng)過(guò)多年研究,該公司在以往技術(shù)的基礎上,于2005年初推出了具有更好的合成效果的嵌入式語(yǔ)音合成軟件InterSound 4.0KT。
InterSound 4.0KT語(yǔ)音合成軟件是業(yè)界最小的輕量級中文連續語(yǔ)音合成軟件。系統針對有一定處理能力,但資源受到嚴格限制的嵌入式環(huán)境。它在合成效果上更加自然和流暢,已經(jīng)接近傳統大語(yǔ)料庫語(yǔ)音合成算法的效果;它集成了智能的文本分析算法,將規則和統計等處理方法進(jìn)行了有機的結合,具備了較強的分詞、多音字識別、姓氏識別、韻律環(huán)境預測能力,以及自動(dòng)識別和處理日期時(shí)間、數值金額、電話(huà)號碼等文本的能力,并能通過(guò)添加外部規則的方式,快速增加對新的文本格式的支持能力。按照5分制計算,其合成的自然度可以達到4.2分,可懂度為98%,節奏正確率達到95%。
InterSound 4.0KT在系統架構、代碼實(shí)現、資源結構等方面進(jìn)行了大量的研究和優(yōu)化工作。整體系統架構的設計緊湊高效;系統開(kāi)發(fā)過(guò)程中,在合成算法、數據結構、代碼編寫(xiě)等不同層面都進(jìn)行了深入優(yōu)化;庫資源的結構設計也非常精巧,目前的庫資源的尺寸已經(jīng)低于1.2M字節,同時(shí)提升了資源訪(fǎng)問(wèn)的效率。最終的優(yōu)化結果,使得InterSound 4.0KT系統在存儲資源的需求方面較傳統的合成系統有了極大的降低,但整體的效果卻有了顛覆性的提升。
InterSound 4.0KT系統具有很強的移植性,已經(jīng)在以下的操作系統下實(shí)現移植:Linux,WinCE,Omap,Smartphone,PPC等等,并成功的在A(yíng)rm、TI、Epson、Philips等硬件平臺上實(shí)現了移植。Intersound 4.0KT充分考慮了手機的應用環(huán)境,滿(mǎn)足了在手機的嵌入式環(huán)境下的要求,使得實(shí)現手機里的語(yǔ)音合成技術(shù)已經(jīng)不再成為困難,并且合成效果將令用戶(hù)非常滿(mǎn)意,增加了手機的個(gè)性化特點(diǎn)。
科大訊飛的目標是以最好的產(chǎn)品、最優(yōu)的服務(wù)、最合適的應用全面推動(dòng)語(yǔ)音產(chǎn)業(yè)的發(fā)展,做最專(zhuān)業(yè)的中文語(yǔ)音應用整體解決方案提供商。
科大訊飛公司供稿 CTI論壇編輯
相關(guān)鏈接:
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩
尉犁县|
凌源市|
南和县|
剑川县|
武胜县|
乌拉特中旗|
固原市|
新巴尔虎右旗|
天镇县|
延津县|
平果县|
北安市|
梓潼县|
扶风县|
南投县|
镇沅|
新巴尔虎左旗|
绵阳市|
建平县|
井陉县|
娱乐|
仲巴县|
象州县|
兰西县|
日土县|
金山区|
张家界市|
修水县|
边坝县|
黎川县|
探索|
潮州市|
克拉玛依市|
简阳市|
饶阳县|
宣城市|
平武县|
江川县|
四子王旗|
凌源市|
兴海县|
http://444
http://444
http://444
http://444
http://444
http://444