在蘋果發(fā)布Siri之后,互聯(lián)網(wǎng)巨頭與硬件企業(yè)就已在智能語音領(lǐng)域展開了新的爭奪戰(zhàn)。
此前,平臺級的語音助手應(yīng)用以蘋果Siri、谷歌GoogleNow為主,現(xiàn)在微軟也在Windows Phone 8.1中集成了Cortana,加入到競爭中來。本月中旬,微軟發(fā)布的視頻廣告中,其智能語音助手Cortana就對蘋果Siri進行了嘲弄。視頻中Cortana向Siri自夸它能完成一些高級的交互功能,而Siri不能。
在中國市場,科大訊飛、百度、騰訊等互聯(lián)網(wǎng)企業(yè),中興、華為等手機企業(yè)今年來也紛紛加大對智能語音領(lǐng)域的投入。那么,國內(nèi)智能語音產(chǎn)品如何實現(xiàn)硬件與軟件結(jié)合,何時能面向大眾市場實現(xiàn)商業(yè)化?語音處理芯片公司Audience中國區(qū)總經(jīng)理林明璋近日就此問題接受了《壹觀察》專訪。以下為主要信息點:
Audience是誰?
Audience公司基于人體聽力學(xué)的原理開發(fā)出一種名為earSmart的智能語音處理模塊,它能讓用戶在嘈雜的環(huán)境中進行清晰的對話。主要向設(shè)備制造商銷售芯片和授權(quán)知識產(chǎn)權(quán),通過過濾背景噪音以提高移動設(shè)備的語音質(zhì)量。
2008年,該公司的第一款語音處理芯片被應(yīng)用于手機上。2012年5月Audience在納斯達克上市。蘋果在iPhone4中開始使用Audience公司的語音處理芯片,蘋果iPhone4S的A5芯片也集成了該芯片模塊,以提高蘋果語音助手Siri的識別能力。
目前,Audience的主要客戶包括三星、中興、華為、小米、HTC等主要手機廠商,同時在Audience也在拓展智能汽車、智能家居等市場。
目前智能語音發(fā)展中遇到的主要問題
1、智能喚醒功能,目前產(chǎn)品使用體驗都不是很好,喚醒率和準確度有待提高,喚醒后的智能語音執(zhí)行也需要大幅優(yōu)化;
2、嘈雜的場合需要提高聲音降噪功能,如高速汽車、家居環(huán)境中超過5米的遠距離語音識別等;
3、市場上所稱的聲紋識別功能,需要提高對特殊語音與關(guān)鍵詞識別。
目前與中國企業(yè)合作進展
Audience目前與中國主要的手機廠商都有合作,如小米2、中興“星星一號”、魅族MX4 Pro等都使用了Audience的語音處理芯片。
今年9月,Audience與中興通訊、百度、高德、Nuance、中國科學(xué)院成立了“智慧語音聯(lián)盟”,這是世界上的第一個移動設(shè)備聲控技術(shù)聯(lián)盟。林明璋稱,成立“智慧語音聯(lián)盟”的目的在于推動智能手機從“觸控”向“聲控”邁進。
除終端廠商外,中國移動與Audience在VoLTE高清語音、提高通話質(zhì)量等方面也有合作。
林明璋對《壹觀察》表示,中國終端廠商中與Audience合作最為密切的是中興通訊與魅族。魅族剛剛發(fā)布的MX4 Pro產(chǎn)品就內(nèi)置了Audience的語音處理方案。而中興通訊與Audience的合作時間最長,中興在三年前已開始進行智能語音的研發(fā),其首款主打智能語音的“星星一號”手機在與Audience聯(lián)合研發(fā)后,通過VoiceQ等技術(shù)已經(jīng)具備了智能語音的常用功能。
如何應(yīng)對中國企業(yè)“仿制”?
林明璋認為,智能語音與拍照軟件相比需要更大的投入,涉及到更復(fù)雜的應(yīng)用場景和算法,因此在短時間內(nèi)被迅速仿制的可能性不大。國內(nèi)終端企業(yè)與Audience合作要牽扯到芯片選型、硬件與軟件適配、UI優(yōu)化、麥克風(fēng)選擇、版型設(shè)計等諸多環(huán)節(jié),一個細節(jié)出了問題往往會發(fā)生非常大的偏差,因此被簡單復(fù)制的難道會相當(dāng)大。
林明璋透露,Audience近期將與中興發(fā)布一款智能語音手機,搭載了不間斷偵測智能語音和音頻解決方案Audience eS700系列處理器,并應(yīng)用了其VoiceQ和MotionQ兩大功能。VoiceQ使移動設(shè)備處于‘永在聆聽’模式,可延長電池使用時間。MotionQ技術(shù)可以直接連接到移動和位置傳感器,支持多達10軸加速度計、陀螺儀和磁強計,不必直接與AP連接。當(dāng)設(shè)備自身發(fā)生方向變化時,通過使用慣性傳感器數(shù)據(jù)優(yōu)化麥克風(fēng)的性能,提高智能語音的識別能力,同時達到超低功耗,提供最好的用戶體驗。
智能語音將擴展至穿戴設(shè)備與智能家居
林明璋認為,隨著物聯(lián)網(wǎng)與移動技術(shù)發(fā)展,語音將成為未來智能家居的核心,而通過智能語音完成智能家居終端之間的鏈接控制,可以將用戶的雙手解放出來。而聲紋和傳感器技術(shù)的進步,智能語音將成為穿戴設(shè)備的主要控制方式,語音識別技術(shù)的應(yīng)用范圍和場景將會無限放大。
林明璋表示,從產(chǎn)業(yè)鏈來看,巨頭們2014年開始全面發(fā)力智能語音,而2015年將成為智能語音在硬件與軟件結(jié)合發(fā)展的關(guān)鍵一年,預(yù)計中國市場高端旗艦產(chǎn)品將全部具備智能語音功能。