在蘋(píng)果發(fā)布Siri之后,互聯(lián)網(wǎng)巨頭與硬件企業(yè)就已在智能語(yǔ)音領(lǐng)域展開(kāi)了新的爭(zhēng)奪戰(zhàn)。
此前,平臺(tái)級(jí)的語(yǔ)音助手應(yīng)用以蘋(píng)果Siri、谷歌GoogleNow為主,現(xiàn)在微軟也在Windows Phone 8.1中集成了Cortana,加入到競(jìng)爭(zhēng)中來(lái)。本月中旬,微軟發(fā)布的視頻廣告中,其智能語(yǔ)音助手Cortana就對(duì)蘋(píng)果Siri進(jìn)行了嘲弄。視頻中Cortana向Siri自夸它能完成一些高級(jí)的交互功能,而Siri不能。
在中國(guó)市場(chǎng),科大訊飛、百度、騰訊等互聯(lián)網(wǎng)企業(yè),中興、華為等手機(jī)企業(yè)今年來(lái)也紛紛加大對(duì)智能語(yǔ)音領(lǐng)域的投入。那么,國(guó)內(nèi)智能語(yǔ)音產(chǎn)品如何實(shí)現(xiàn)硬件與軟件結(jié)合,何時(shí)能面向大眾市場(chǎng)實(shí)現(xiàn)商業(yè)化?語(yǔ)音處理芯片公司Audience中國(guó)區(qū)總經(jīng)理林明璋近日就此問(wèn)題接受了《壹觀察》專訪。以下為主要信息點(diǎn):
Audience是誰(shuí)?
Audience公司基于人體聽(tīng)力學(xué)的原理開(kāi)發(fā)出一種名為earSmart的智能語(yǔ)音處理模塊,它能讓用戶在嘈雜的環(huán)境中進(jìn)行清晰的對(duì)話。主要向設(shè)備制造商銷售芯片和授權(quán)知識(shí)產(chǎn)權(quán),通過(guò)過(guò)濾背景噪音以提高移動(dòng)設(shè)備的語(yǔ)音質(zhì)量。
2008年,該公司的第一款語(yǔ)音處理芯片被應(yīng)用于手機(jī)上。2012年5月Audience在納斯達(dá)克上市。蘋(píng)果在iPhone4中開(kāi)始使用Audience公司的語(yǔ)音處理芯片,蘋(píng)果iPhone4S的A5芯片也集成了該芯片模塊,以提高蘋(píng)果語(yǔ)音助手Siri的識(shí)別能力。
目前,Audience的主要客戶包括三星、中興、華為、小米、HTC等主要手機(jī)廠商,同時(shí)在Audience也在拓展智能汽車、智能家居等市場(chǎng)。
目前智能語(yǔ)音發(fā)展中遇到的主要問(wèn)題
1、智能喚醒功能,目前產(chǎn)品使用體驗(yàn)都不是很好,喚醒率和準(zhǔn)確度有待提高,喚醒后的智能語(yǔ)音執(zhí)行也需要大幅優(yōu)化;
2、嘈雜的場(chǎng)合需要提高聲音降噪功能,如高速汽車、家居環(huán)境中超過(guò)5米的遠(yuǎn)距離語(yǔ)音識(shí)別等;
3、市場(chǎng)上所稱的聲紋識(shí)別功能,需要提高對(duì)特殊語(yǔ)音與關(guān)鍵詞識(shí)別。
目前與中國(guó)企業(yè)合作進(jìn)展
Audience目前與中國(guó)主要的手機(jī)廠商都有合作,如小米2、中興“星星一號(hào)”、魅族MX4 Pro等都使用了Audience的語(yǔ)音處理芯片。
今年9月,Audience與中興通訊、百度、高德、Nuance、中國(guó)科學(xué)院成立了“智慧語(yǔ)音聯(lián)盟”,這是世界上的第一個(gè)移動(dòng)設(shè)備聲控技術(shù)聯(lián)盟。林明璋稱,成立“智慧語(yǔ)音聯(lián)盟”的目的在于推動(dòng)智能手機(jī)從“觸控”向“聲控”邁進(jìn)。
除終端廠商外,中國(guó)移動(dòng)與Audience在VoLTE高清語(yǔ)音、提高通話質(zhì)量等方面也有合作。
林明璋對(duì)《壹觀察》表示,中國(guó)終端廠商中與Audience合作最為密切的是中興通訊與魅族。魅族剛剛發(fā)布的MX4 Pro產(chǎn)品就內(nèi)置了Audience的語(yǔ)音處理方案。而中興通訊與Audience的合作時(shí)間最長(zhǎng),中興在三年前已開(kāi)始進(jìn)行智能語(yǔ)音的研發(fā),其首款主打智能語(yǔ)音的“星星一號(hào)”手機(jī)在與Audience聯(lián)合研發(fā)后,通過(guò)VoiceQ等技術(shù)已經(jīng)具備了智能語(yǔ)音的常用功能。
如何應(yīng)對(duì)中國(guó)企業(yè)“仿制”?
林明璋認(rèn)為,智能語(yǔ)音與拍照軟件相比需要更大的投入,涉及到更復(fù)雜的應(yīng)用場(chǎng)景和算法,因此在短時(shí)間內(nèi)被迅速仿制的可能性不大。國(guó)內(nèi)終端企業(yè)與Audience合作要牽扯到芯片選型、硬件與軟件適配、UI優(yōu)化、麥克風(fēng)選擇、版型設(shè)計(jì)等諸多環(huán)節(jié),一個(gè)細(xì)節(jié)出了問(wèn)題往往會(huì)發(fā)生非常大的偏差,因此被簡(jiǎn)單復(fù)制的難道會(huì)相當(dāng)大。
林明璋透露,Audience近期將與中興發(fā)布一款智能語(yǔ)音手機(jī),搭載了不間斷偵測(cè)智能語(yǔ)音和音頻解決方案Audience eS700系列處理器,并應(yīng)用了其VoiceQ和MotionQ兩大功能。VoiceQ使移動(dòng)設(shè)備處于‘永在聆聽(tīng)’模式,可延長(zhǎng)電池使用時(shí)間。MotionQ技術(shù)可以直接連接到移動(dòng)和位置傳感器,支持多達(dá)10軸加速度計(jì)、陀螺儀和磁強(qiáng)計(jì),不必直接與AP連接。當(dāng)設(shè)備自身發(fā)生方向變化時(shí),通過(guò)使用慣性傳感器數(shù)據(jù)優(yōu)化麥克風(fēng)的性能,提高智能語(yǔ)音的識(shí)別能力,同時(shí)達(dá)到超低功耗,提供最好的用戶體驗(yàn)。
智能語(yǔ)音將擴(kuò)展至穿戴設(shè)備與智能家居
林明璋認(rèn)為,隨著物聯(lián)網(wǎng)與移動(dòng)技術(shù)發(fā)展,語(yǔ)音將成為未來(lái)智能家居的核心,而通過(guò)智能語(yǔ)音完成智能家居終端之間的鏈接控制,可以將用戶的雙手解放出來(lái)。而聲紋和傳感器技術(shù)的進(jìn)步,智能語(yǔ)音將成為穿戴設(shè)備的主要控制方式,語(yǔ)音識(shí)別技術(shù)的應(yīng)用范圍和場(chǎng)景將會(huì)無(wú)限放大。
林明璋表示,從產(chǎn)業(yè)鏈來(lái)看,巨頭們2014年開(kāi)始全面發(fā)力智能語(yǔ)音,而2015年將成為智能語(yǔ)音在硬件與軟件結(jié)合發(fā)展的關(guān)鍵一年,預(yù)計(jì)中國(guó)市場(chǎng)高端旗艦產(chǎn)品將全部具備智能語(yǔ)音功能。