隨著(zhù)第二波智能語(yǔ)音浪潮來(lái)臨,智能揚聲器裝置制造商必須在功能特性和使用者體驗之間找到最佳平衡,同時(shí)保持具競爭力的價(jià)格…電子設計模塊
或許您還沒(méi)有聽(tīng)說(shuō)過(guò),2017年已經(jīng)被稱(chēng)為“語(yǔ)音介面年”了。從年初美國拉斯維加斯國際消費電子展(CES)的“語(yǔ)音啟動(dòng)”成為最受矚目的焦點(diǎn)開(kāi)始,話(huà)題持續延燒到年中在上海舉行的世界行動(dòng)通訊大會(huì )(MWC)。這一稱(chēng)號并進(jìn)一步受到多家網(wǎng)際網(wǎng)路和技術(shù)巨擘的加持,他們不斷加入競賽行列并推出以智能揚聲器為基礎的個(gè)人語(yǔ)音助理。
美國的智能揚聲器
自從2014年亞馬遜(Amazon)智能揚聲器Echo推出以來(lái),這個(gè)市場(chǎng)一直呈指數級成長(cháng)。根據audioxpress.com,在美國,智能揚聲器占家庭音訊硬體類(lèi)別的30%。預計未來(lái)幾年將持續成長(cháng),到2020年將可達到1億美元的規模,其中75%的美國家庭將擁有智能揚聲器。
Google Home揚聲器自去年發(fā)布后,成功地占據了一定的市場(chǎng)份額,但仍遠落后于Echo。根據eMarketer US對2017年的預測,Amazon Echo揚聲器將擁有70.6%的市占率,Google Home約達到23.8%,而剩下的市場(chǎng)將分布于聯(lián)想(Lenovo)、Harman Kardon和LG等市占率更小的參與業(yè)者。圖1:技術(shù)領(lǐng)域的各大巨擘現正競相爭奪您咖啡桌上的一小塊圓形空間 (來(lái)源:Reuters/Harman Kardon)
不過(guò),在A(yíng)pple發(fā)布其高價(jià)位的高階揚聲器——HomePod后,這個(gè)情況即將發(fā)生重大變化。微軟(Microsoft)也將加入這場(chǎng)競賽,但它并非打造自家的揚聲器,而是即將推出一款名為Invoke的Harman Kardon裝置,由Cortana提供支援。今年初,進(jìn)軍該市場(chǎng)的另一重點(diǎn)是Lenovo的Smart Assistant揚聲器,它將會(huì )是Amazon Alexa的新主人。使用者現在可以選擇任何一款由Alexa智能語(yǔ)音服務(wù)提供支援、但不一定由Amazon制造的裝置產(chǎn)品。Lenovo揚聲器的音響系統也將由Harman Kardon支援。
中文智能揚聲器為全球1/5人口敞開(kāi)大門(mén)
同時(shí),在中國,阿里巴巴(Alibaba)宣布推出Tmall Genie X1,正式進(jìn)軍智能家庭揚聲器市場(chǎng)。
Tmall Genie X1It預計不久即將上市,價(jià)格大約75美元,比美國各種裝置更便宜得多。不過(guò),中國市場(chǎng)本身已經(jīng)開(kāi)始競爭了。阿里巴巴的競爭對手之一—線(xiàn)上零售業(yè)的后起之秀——京東商城(JD)與iFlytek合作,在去年發(fā)表玲瓏叮咚系列智能揚聲器。
中國搜尋引擎巨擘——百度(Baidu)則與硬體公司AiNemo合作,在智能揚聲器領(lǐng)域搭建略有不同的選擇。這款稱(chēng)為L(cháng)ittle Fish的裝置是由百度的語(yǔ)音啟動(dòng)作業(yè)系統(OS)——DuerOS提供支援。它與迄今討論的其他產(chǎn)品不同之處在于配備了熒幕和相機。智能機器人可以追蹤使用者的臉部,并使用臉部辨識功能驗證線(xiàn)上購物。它還可以顯示資訊和影像,以回應使用者的查詢(xún)。圖2:百度推出配備熒幕和相機的智能揚聲器,可以在房間周?chē)鷮δM(jìn)行追蹤 (來(lái)源:Baidu)
這與Amazon Echo產(chǎn)品系列的最新產(chǎn)品Echo Show有點(diǎn)類(lèi)似。但相對于Little Fish,Echo Show并不能移動(dòng),所以無(wú)法在房間周?chē)M(jìn)行追蹤。您甚至也無(wú)法手動(dòng)更改熒幕的角度,所以它的限制非常多,但這是美國第一款配備熒幕的智能揚聲器。因此,當我們看到越來(lái)越多模仿原始Amazon Echo的產(chǎn)品出現時(shí),Amazon本身正開(kāi)始轉向新功能。
技能組合是語(yǔ)音助理的差異化關(guān)鍵嗎?
這個(gè)市場(chǎng)的競賽還處于早期階段,而產(chǎn)品彼此間的相似程度令人驚訝。除了些微的設計不同,裝置的外觀(guān)幾乎沒(méi)有任何差異,只有在內部出現一些更有趣的區別。麥克風(fēng)的數量存在相當大的變化,從Google Home中只用了兩支麥克風(fēng)(執行遠場(chǎng)語(yǔ)音提取的最小要求),到Lenovo Assistant支援高達8支麥克風(fēng)。揚聲器的數量和品質(zhì)也不盡相同,在Lenovo和Apple即將推出的產(chǎn)品中,嘗試透過(guò)多聲道高音擴音器、室內校正和音訊波束成形等技術(shù),從而將音訊提升到大幅超越Amazon和Google現有產(chǎn)品的水準。
揚聲器背后的智能控制差異更為明顯。人工智能(AI)平臺在技能組合和可執行的任務(wù)方面并不完全相同。Alexa已經(jīng)取得了15,000多種技能,遠勝于任何競爭對手的產(chǎn)品。根據Voicebot的說(shuō)法,Google Home排名第二,僅支援378種技能。就技能組合而言,未來(lái)可能會(huì )是一大賣(mài)點(diǎn)以及差異化的因素。
另一個(gè)重要方面是基礎AI平臺的“智能程度”。能夠對話(huà)、理解語(yǔ)言的情境以及回答后續問(wèn)題就是很好的例子。衡量這一點(diǎn)比計算技能更困難,但Google Assistant在這方面可能就超越Alexa了。一般來(lái)說(shuō),像Google和百度等搜尋巨擘可以取得大量的資料,在深度學(xué)習方面更有優(yōu)勢,這將有助于其日后的發(fā)展。
目前,AI平臺和實(shí)體揚聲器已經(jīng)整合了,很快地就會(huì )發(fā)生變革。由于A(yíng)mazon和Google已經(jīng)向第三方裝置開(kāi)放其服務(wù)了,因此,揚聲器硬體本身的設計對任何人都是開(kāi)放的。只需借由足以實(shí)現遠場(chǎng)語(yǔ)音拾音功能的解決方案,任何裝置都可以透過(guò)API連接到所選擇的個(gè)人助理,并提供智能語(yǔ)音服務(wù)。這為芯片和裝置制造商開(kāi)啟了大量的機會(huì )來(lái)建構智能揚聲器硬體,以把握任何市場(chǎng)機遇。至于A(yíng)pple,同樣地,該公司仍將Siri保留在自家硬體中。
打造具成本效益的低功耗SoC方案
綜合上述的所有要點(diǎn),我認為這標志著(zhù)第二波智能揚聲器的沖擊。在第二波周期,裝置制造商使用相同的幾種個(gè)人助理平臺,致力于降低成本并實(shí)現大量市場(chǎng)。為此,他們必須在功能特性和使用者體驗之間找到最佳平衡,同時(shí)保持具競爭力的價(jià)格。此外,市場(chǎng)領(lǐng)導廠(chǎng)商將嘗試提升平臺的技能和智能程度,并推出新的特性功能(如熒幕和相機),以取得不同程度成功。就像十年前的智能型手機平臺戰爭一樣,盡管導致許多變化,最終將融合于消費者的達爾文“適者生存”選擇。
語(yǔ)音介面市場(chǎng)正蓬勃發(fā)展中,預計還有更多的公司加入。觀(guān)察Lenovo揚聲器和Invoke也將特別有趣,因為這象征著(zhù)語(yǔ)音助理本身及其消費應用產(chǎn)品之間“分道揚鑣”的開(kāi)始。