靈云科技26日消息:捷通華聲靈云遠場(chǎng)語(yǔ)音識別技術(shù)全面升級,可獲取7到8米外的語(yǔ)音,語(yǔ)音識別率仍不低于90%,從根本上改變目前市場(chǎng)上因各式問(wèn)題導致的僅能近距離交互的方式,為智能語(yǔ)音技術(shù)應用于智能車(chē)載、智能家電、智能家居、機器人等靈云奠定堅實(shí)的基礎,讓智能硬件不再為遠場(chǎng)語(yǔ)音識別的瓶頸而擔憂(yōu)。據悉,靈云種子已采用靈云遠場(chǎng)語(yǔ)音識別技術(shù)。

靈云種子自2014年發(fā)布以來(lái),得到了智能硬件、車(chē)載、機器人等多個(gè)領(lǐng)域的一致好評,特別是在機器人領(lǐng)域,解決了之前存在的種種人機交互困難的問(wèn)題,使設備脫離了手動(dòng)控制,真正讓機器人實(shí)現了“能說(shuō)會(huì )聽(tīng)、能思考、會(huì )判斷”。
靈云遠場(chǎng)語(yǔ)音識別 距離不再阻礙交流
很長(cháng)一段時(shí)間以來(lái),科大訊飛、NUANCE等語(yǔ)音技術(shù)公司都在努力開(kāi)拓智能硬件市場(chǎng),但智能硬件產(chǎn)品在很多場(chǎng)景下因語(yǔ)音交互體驗不如人意而不能滿(mǎn)足市場(chǎng)的需求,究其原因主要是受限于背景噪音、其他聲音干擾、回聲、混響等多重復雜因素,進(jìn)而導致的識別距離近、識別率低等明顯痛點(diǎn),在這些問(wèn)題沒(méi)有解決之前,智能硬件語(yǔ)音交互方面將一直是一個(gè)短板。鑒于此,靈云推出遠場(chǎng)語(yǔ)音識別技術(shù),將極大推進(jìn)語(yǔ)音識別技術(shù)在真實(shí)生活場(chǎng)景中的應用。
遠場(chǎng)語(yǔ)音識別技術(shù)的核心有兩點(diǎn),一是語(yǔ)音前端處理:利用麥克風(fēng)陣列、回聲消除等技術(shù)將目標說(shuō)話(huà)人的聲音增強,并抑制/消除周?chē)鸁o(wú)用的聲音(噪聲+回聲);二是語(yǔ)音識別引擎針對麥克風(fēng)陣列處理后的數據進(jìn)行專(zhuān)門(mén)優(yōu)化,以使遠場(chǎng)識別效果達到最優(yōu)。
靈云遠場(chǎng)語(yǔ)音識別技術(shù),是基于多麥克風(fēng)陣列的語(yǔ)音硬件前端方案,并利用麥克風(fēng)陣列的空域濾波特性——在目標說(shuō)話(huà)人方向形成拾音波束,抑制波束之外的噪聲和反射聲,其降噪和去混響效果均為國內領(lǐng)先水平,并可成功實(shí)現語(yǔ)音喚醒;聲源定位;遠場(chǎng)識別;回聲消除;語(yǔ)音打斷等5大功能。
可以想象,基于靈云遠場(chǎng)語(yǔ)音識別的遠距離、高識別率支撐,現在用戶(hù)在以家庭為單位的活動(dòng)范圍內,幾乎可以通過(guò)語(yǔ)音輕松操控家里的一切智能硬件設備,推而廣之,搭載遠場(chǎng)識別的智能硬件產(chǎn)品將無(wú)限擴大適用范圍和應用場(chǎng)景。目前的方案主要根據算法不同,可分為適用于電視機、空調、機器人等的加性麥克風(fēng)陣列和適用于采訪(fǎng)話(huà)筒、錄音筆等的差分麥克風(fēng)陣列。
靈云種子 智能終端交互一站式解決方案
智能硬件熱炒兩三年,至今未見(jiàn)哪個(gè)企業(yè)已經(jīng)將成熟的一套方案或者說(shuō)場(chǎng)景完整地展現出來(lái)并得到推廣。總體上來(lái)說(shuō),目前很多企業(yè)設想的場(chǎng)景對于消費者的價(jià)值究竟是什么沒(méi)有考慮清楚;外部來(lái)說(shuō),智能家居還未深入老百姓,市場(chǎng)還未感知到,沒(méi)有爆款產(chǎn)品,產(chǎn)品形態(tài)整體傳統;從內部講,大大小小的企業(yè)都在喊著(zhù)做平臺,資本市場(chǎng)也炒的很熱,但實(shí)際上參與其中的很多智能軟件公司并沒(méi)有一套整體的方案能拿的出手。
如果整體目前玩不轉,那么先從做單品或者微場(chǎng)景來(lái)吸引大眾眼球似乎是不錯的路子,這就是智能硬件目前呈現的結果。在智能家居的部分,基本上所有推出產(chǎn)品的企業(yè)都在強調可以聯(lián)WIFI,可以遠程操控,甚至可以在一臺冰箱上看視頻聽(tīng)音樂(lè ),即所謂的娛樂(lè )化。可這些并不是真正的“智能”。目前,智能單品遇到的市場(chǎng)瓶頸,包括操控形式本末倒置、形式大于實(shí)際效果、存在安全性等問(wèn)題。
怎么定義智能,并真正實(shí)現智能,依然為產(chǎn)業(yè)界,也是媒體爭論的熱點(diǎn)。越來(lái)越多的人認為,能夠實(shí)現手機app控制即為智能,但是手機控制卻也需要手動(dòng)操作各類(lèi)硬件,依然不夠智能。
隨著(zhù)人工智能技術(shù)的應用越來(lái)越廣泛,手機app控制、語(yǔ)音控制等多重控制方式越來(lái)越多的應用到了智能硬件上。靈云智能種子可實(shí)現通過(guò)語(yǔ)音識別、語(yǔ)音合成、自然語(yǔ)言理解等人工智能技術(shù),為用戶(hù)提供各種智能交互服務(wù),用戶(hù)只需要用說(shuō)話(huà)的方式發(fā)布命令,就可以控制相應的系統。
例如,對著(zhù)手機app說(shuō)一聲“我五分鐘之后到家”,就會(huì )得到回復“好的,按照您的習慣,空調已經(jīng)調到26度,熱水器調到35度”;說(shuō)一聲“幫我煮杯咖啡”,咖啡機就開(kāi)始工作;說(shuō)一聲“太熱了,溫度調低兩度”,空調就開(kāi)始調溫窩在沙發(fā)上看著(zhù)無(wú)聊的電視節目,說(shuō)一聲“我想看上周的非誠勿擾”,對應的電視臺就自動(dòng)搜索出來(lái)了;說(shuō)一聲“我要睡覺(jué)了”,空調就自動(dòng)調到睡眠模式,門(mén)窗自動(dòng)鎖閉。用戶(hù)可以通過(guò)語(yǔ)音來(lái)開(kāi)啟燈光、調整燈光的亮度、啟動(dòng)私人家庭影院、控制家用電器、等等,讓家庭自動(dòng)化的功能往前邁向了一大步。
但由于國內諸多語(yǔ)音廠(chǎng)商能力參差不齊、語(yǔ)義理解能力高低有別,而且語(yǔ)音交互僅能辨別指令及交互,僅是智能家居的一部分,并不能為家居的安防、家庭成員的辨別提供能力,因此并不能為家居提供全方位的智能服務(wù)。而國內技術(shù)廠(chǎng)商所推出的智能家居解決方案卻往往固步在“聲”的方向,無(wú)法覆蓋聲紋識別、人臉識別、指紋識別等生物識別能力等全套能力。
2014年,為方便智能終端廠(chǎng)商與集成商、開(kāi)發(fā)商更好地使用靈云平臺(www.hcicloud.com)全方位人工智能能力,捷通華聲特別推出了企業(yè)級開(kāi)發(fā)者專(zhuān)用的智能終端交互方案:靈云種子。靈云種子強化了靈云全方位人工智能平臺各項人工智能技術(shù)的融合,包括靈云語(yǔ)音識別、語(yǔ)音合成、語(yǔ)義理解、聲紋識別、人臉識別、指紋識別等全方位人工智能交互能力,并提供簡(jiǎn)單易用的開(kāi)發(fā)接口,供智能家居、車(chē)載等各類(lèi)智能終端進(jìn)行集成調用,實(shí)現人與終端設備多種方式的自由溝通和控制。企業(yè)級開(kāi)發(fā)商通過(guò)應用靈云種子,可以輕松實(shí)現智能語(yǔ)音交互、智能語(yǔ)音導航、智能語(yǔ)音控制、聲紋解鎖、手寫(xiě)輸入、智能圖像識別、安全身份認證等多種人機交互功能,滿(mǎn)足智能家居、智能車(chē)載、智能家電、機器人及可穿戴式設備等各個(gè)行業(yè)對人工智能技術(shù)應用大量且多方位的需求。
經(jīng)過(guò)與眾多智能終端廠(chǎng)商的合作,為不斷滿(mǎn)足合作的應用需求,捷通華聲“靈云種子”已經(jīng)升級到2.0版,新版靈云種子新增云端和本地同時(shí)識別,并從結果中擇優(yōu)的功能,提高了語(yǔ)音識別的準確率和識別速度,優(yōu)化了意圖理解的幾十個(gè)領(lǐng)域。目前,靈云種子可廣泛應用在以下場(chǎng)景中:
語(yǔ)音檢索:支持包括路況導航類(lèi)、家居菜單智能導航類(lèi)、周邊服務(wù)類(lèi)、生活服務(wù)類(lèi)、娛樂(lè )類(lèi)等多種語(yǔ)音檢索服務(wù);
消息提醒:人性化定制推送類(lèi)別:來(lái)電提醒、短信提醒、應用提醒,并可將設置在云端;
通訊娛樂(lè ):支持短信發(fā)送,電話(huà)通訊,多媒體播放,手機操控;
健康服務(wù):支持傳感器,提供傳感器數據分析,為用戶(hù)提供健康圖表,并結合云端服務(wù)提供定制健康指導等現有及正在研發(fā)的能力;
云平臺:基于靈云平臺,提供多設備數據同步,私人信息云存儲,智能推薦;
這些方案類(lèi)似于一個(gè)開(kāi)發(fā)模版,靈云(www.hcicloud.com)平臺將這些特定領(lǐng)域和場(chǎng)景的智能交互方案經(jīng)過(guò)設計和優(yōu)化后,打造出一體化的全智能人機交互解決方案——“靈云種子”。直接應用“靈云種子”配置的技術(shù)服務(wù)和內容服務(wù),即可滿(mǎn)足各種智能硬件的智能化需求。
在機器人方面,靈云機器人已成功應用靈云種子,全面整合捷通華聲靈云平臺多項人工智能技術(shù)能力,讓稍顯“笨拙”的物理機器人成為真正“能說(shuō)會(huì )聽(tīng),能寫(xiě)會(huì )看,能思考、會(huì )判斷”,有一定分析與辨別能力的聰明、生動(dòng)的智能機器人,可廣泛為金融、電信、交通、教育、醫療等智能客戶(hù)服務(wù)領(lǐng)域,也可以為教育、娛樂(lè )、家居生活等行業(yè)提供智能問(wèn)答、智能聊天、智能“保姆”等服務(wù)。同時(shí),靈云機器人具備平滑的移植性,可移植到市面上各類(lèi)智能機器人硬件設備中。
據捷通華聲靈云產(chǎn)品研發(fā)部門(mén)人員介紹,靈云種子更主要的作用是在產(chǎn)業(yè)中起到示范與引導作用,期望伴隨靈云種子在各行各業(yè)智能硬件中的不斷“生根發(fā)芽”,中國智能硬件將進(jìn)入一個(gè)全新的、真智能的時(shí)代!
捷通華聲靈云種子扎根智能終端 攜手合作伙伴共贏(yíng)
靈云平臺(www.hcicloud.com)是捷通華聲于2011年推出的首個(gè)全方位人工智能開(kāi)放平臺。為推動(dòng)人工智能產(chǎn)業(yè)的廣泛應用,靈云平臺自推出以來(lái)一直面向產(chǎn)業(yè)全面開(kāi)放,包括個(gè)人開(kāi)發(fā)者在內的合作伙伴,都可以通過(guò)靈云平臺獲取智能語(yǔ)音、智能圖像、智能語(yǔ)義、生物特征等技術(shù)能力。
在中國華南地區,尤其廣州、深圳地區經(jīng)濟發(fā)達、創(chuàng )新力強,在智能家居、智能車(chē)載、智能家電、機器人、穿戴式設備研發(fā)與創(chuàng )新上擁有獨特優(yōu)勢。為了向華南地區廣大合作伙伴提供更加直接的支持與幫助,捷通華聲在2015年初成立了深圳捷通華聲公司,旨在依托靈云平臺,利用靈云平臺智能語(yǔ)音、智能圖像、語(yǔ)義理解等全方位人工智能技術(shù)能力和豐富完善的智能終端交互解決方案,與華南地區硬件廠(chǎng)商加強合作關(guān)系,發(fā)揮華南地區智能終端設備研發(fā)和生產(chǎn)的優(yōu)勢,期望伴隨靈云種子在各行各業(yè)智能硬件中的不斷“生根發(fā)芽”,以推動(dòng)智能終端產(chǎn)業(yè)長(cháng)足的進(jìn)步,攜手智能硬件廠(chǎng)商互惠共贏(yíng),推動(dòng)中國智能硬件進(jìn)入一個(gè)全新的、真智能的時(shí)代!
未來(lái)發(fā)展,伴隨人工智能產(chǎn)業(yè)在世界范圍內的高速發(fā)展,捷通華聲與清華大學(xué)共同創(chuàng )建清華靈云人工智能研究中心、清華海峽研究院人工智能研究中心,捷通華聲將以清華大學(xué)人工智能研究力量為依托,更加專(zhuān)注人工智能技術(shù)研究與產(chǎn)業(yè)化的推廣與應用,與合作伙伴精誠合作,共同創(chuàng )建良好的人工智能產(chǎn)業(yè)生態(tài),共同推動(dòng)中國人工智能產(chǎn)業(yè)的發(fā)展進(jìn)步,為中國人工智能產(chǎn)業(yè)的發(fā)展做出應有的貢獻!
靈云平臺更多信息請訪(fǎng)問(wèn):www.hcicloud.com
靈云智能辦公平臺更多信息請訪(fǎng)問(wèn):aioffice.hcicloud.com
了解靈云產(chǎn)品與捷通華聲,請致電問(wèn)詢(xún)靈云客服機器人:010-82826886-8898