亞馬遜 Alexa 的龐大、破局與尷尬

作者 | 發布日期 2019 年 04 月 18 日 8:15 | 分類 3C , Amazon , 周邊 follow us in feedly

無論蘋果、Google 或亞馬遜的新品發表會,還是百度、阿里、華為當下追逐的智慧產品或生態,始終不缺智慧語音的身影。可見智慧語音很熱,且不是一般的熱。然而,智慧語音在多數應用難逃雞肋二字,仍是現實。



儘管在語音辨識能力方面,各一線甚至二、三線廠商,已達 95% 以上的精準度,但就應用來看,仍以泛娛樂為主,難以切中產業應用的痛點,支撐不同產業的剛需。

雖然如此,也不妨礙大公司的戰略定調,以及大規模資金和人員投入。至少,亞馬遜最初決策時,保住 Alexa,放開 Fire 手機業務。

越養越「肥」的 Alexa

談到智慧語音,不得不提的就是智慧音箱,身為智慧音箱的「始作俑者」,亞馬遜 2014 年的令人驚豔,成就了至今仍動盪不安的江湖。

2014 年 11 月,亞馬遜推出全新概念的攜帶類音箱──Echo,相較之前的 Wi-Fi 音箱、藍牙音箱,傳輸協議和實際功能都沒有太大變化,創新點在於將智慧語音技術帶入裝置,使之前在智慧手機未能廣泛應用的智慧語音技術,將一款傳統硬體帶「偏」,從某種程度而言,也帶來智慧裝置的爆發,以及各大巨頭公司先後入局。

戰爭從來就不是從成熟產業興起,而是新興產業,這波是智慧語音,也可說是智慧音箱。

(Source:亞馬遜

至於亞馬遜 2014 年底推出的這款硬體,內測半年後,2015 年 6 月正式發售。據 CIRP 統計數據顯示,2015 年 Echo 全年出貨量達 250 萬台;2016 年銷量再次翻倍,全年銷量激增到 520 萬台。

現在我們看到的亞馬遜 Echo 對手 Google Home 到 2016 年 11 月才發售,掐指一算,晚了將近 2 年。在此之前,國外智慧音箱的市場幾乎全是亞馬遜的「菜園」。

論及亞馬遜這款硬體背後的軟體及技能支持平台,也是現在各大公司的 AI 主角──智慧語音系統,亞馬遜智慧語音系統的人設為 Alexa。

2015 年 6 月,亞馬遜對外開放 Alexa 平台,第三方開發者可在此平台開發基於語音的技能應用。

對此,亞馬遜發表了 Alexa Skills Kit,包含相應 API 及開發工具;亞馬遜還開發了基於 APL 的標準的語言框架,開發者可透過這種語言開發基於語音的應用軟體。

此外,據了解,亞馬遜還設立名為「Alexa Fund」的投資基金,投資 1 億美元鼓勵更多第三方開發者開發基於 Alexa 的軟硬體產品。

至此,亞馬遜試圖透過語音助理 Alexa 及智慧音箱 Echo 打造更龐大的智慧語音生態系統,已一目了然。

從目前拿得到的數據來看,亞馬遜這步棋之後不斷發力,頗見成效:

從硬體產品銷量來看,2017 年,亞馬遜智慧音箱全年銷量為 2 千多萬台;2018 年,亞馬遜智慧音箱出貨量 3 千多萬台。全球銷量始終盤踞全球第一,以 2018 年第四季銷量為例,據 Strategy Analytics 統計數據顯示,亞馬遜全球占比 35.5%(13.7 萬台),Google 占比為 30%(11.5 萬台)。

就智慧音箱銷量而言,起步較晚的 Google 難得成了千年老二,時至今日,Google Home 整體銷量一直未能追上亞馬遜 Echo。

Echo 智慧音箱後,亞馬遜 Echo 自成系列,整體品類進一步擴充,包括 Echo Dot、Echo Spot、Echo Look、Echo Tap、Echo Plus、Echo Sub 等。據 intelligence 在 2018 年初統計數據顯示,Echo全系列占美國智慧音箱整體市占率約 70%。

此外,據 2018 年底亞馬遜數據顯示,截至 2018 年底,Alexa 已接入 4,500 個品牌的 2.8 萬款第三方智慧裝置。

從 Alexa 技能數量來看,截至 2016 年 6 月,基於 Alexa 的技能數為 1,000 個;此後,隨著智慧音箱逐漸被認可,技能數暴增,到 2017 年底,基於 Alexa 的技能數達 2.5 萬個;2018 年底,Alexa 技能平台技能數超過 7 萬個。

除去在智慧家居不斷拓展應用,亞馬遜 2018 年進一步拓展戰線,將車載、旅館一併納入:

2018 年 6 月,亞馬遜宣布推出 Alexa for Hospitality 服務,為旅館場景提供 Alexa 智慧語音服務;

(Source:Amazon Alexa

2018 年 8 月,亞馬遜推出 Alexa 汽車核心 SDK 和 Auto SDK 的開源版,包括 BMW、福特、豐田等汽車製造商已與亞馬遜達成合作,共同整合 Alexa。

從 Alexa Fund 對外投資來看,2017 年 12 月,亞馬遜透過 Alexa Fund 花 9,000 萬美元收購無線鏡頭新創公司 Blink;2018 年 2 月,亞馬遜花超過 10 億美元收購智慧門鈴製造商 Ring;2018 年 9 月,亞馬遜宣布,透過 Alexa Fund 投資南加州房地產公司 Plant Prefab;同月還投資音樂創業公司 Bamboo Learnin、Endel,以及醫療創業公司 Aiva;2019 年 3 月,亞馬遜完成收購路由器新創公司 eero……

數據很漂亮,漂亮到讓人有「智慧語音已成當下主流互動方式」的幻覺。

然而事實是:技術仍在打磨,困難屢屢,尷尬重重。

智慧語音,尚難逃「雞肋」二字

智慧語音這把火之所以經久不滅,甚至有越來越旺的趨勢,是依賴大數據和 AI 技術的持續更新。大數據顛覆了傳統統計學,使大數據採樣在某些領域開始逐漸替代隨機採樣。與此同時,大數據訓練的數據模型在行為預測和場景化應用越來越廣泛,用戶體驗也從最初的「一無是處」到「漸入佳境」。

配有智慧語音系統的硬體種類越來越多,相關硬體銷量也越來越大,用戶訓練的數據模型的數據量也因此不斷增加。基於此形成的良性循環,為設備廠商和軟體服務商帶來更多希望。

然而,目前,智慧語音在多數應用中,仍難逃雞肋二字。

一方面,至今仍沒有現象級 App 產生。智慧音箱至今較廣泛的仍是聽音樂、(兒童)玩簡單的遊戲(成語接龍、猜歌詞等)等娛樂場景,外加定鬧鐘、聽新聞、報天氣等基本家庭應用。

這也是為何各大廠商更傾向將智慧音箱定位於智慧家居入口裝置。

儘管如此,Alexa 優秀開發者 Mark Einhorn 仍認為,「Alexa 平台開放已有 4 年,但至今連一個殺手級 App 也沒有。」

2019 年 3 月,彭博社發表觀點:儘管亞馬遜 CEO 貝佐斯極重視 A​​lexa 的 App 開發,但亞馬遜還是未能打造出欣欣向榮的 App 市場,Google 與蘋果也沒能創造出重磅應用語音 App。

百度智慧生活事業群組(SLG)總經理景鯤之前也表示,「現在是裝置端爆發的時間,還沒有到開發者生態的爆發期,整個生態的發展還需一步步來。」

另一方面,智慧語音的智慧還不夠智慧。聽起來很拗口,但確實也是當下現狀。在諸多需要真 AI,需要進行分析、預測的場景中,現在的數據模型還難以跟上人類思維。

這也是為何當下最為成熟的智慧裝置──智慧手機,寧願不斷升級鏡頭,主打拍照賣點,也不願再將智慧語音助理撿起當賣點,砸重金推廣,倒是耳機、車載支架等邊緣應用場景的周邊裝置率先配齊智慧語音功能,嘗試應用。

畢竟,和停留在童年程度的智慧語音系統交流有多過癮,相信多數人都體驗過。

亞馬遜的變相發力,是「偷聽」團隊,還是治癒系?

目前,大數據仍是智慧語音,甚至整個人工智慧技術的關鍵,更多數據也以為會更精準。現在可見的趨勢是:擁有越多數據,離真相越近。

對此,亞馬遜官方也認為,「 Alexa 透過各種客戶的語音錄音培訓,將有助於確保 Alexa 適合所有人」。

據彭博社 4 月 11 日報導,亞馬遜在全球有一支數千名員工的團隊,監聽 Echo 使用者家中和辦公室等應用場景錄製的錄音,並透過將錄音轉錄、註釋,並反饋到軟體,消除 Alexa 對人類語言理解與實際語義的差距。

彭博社援引知情人士消息,團隊由承包商和全職亞馬遜員工組成,團隊員工簽署了保密協議,禁止他們公開談論計畫。據亞馬遜布加勒斯特辦事處的 2 名工作人員透露,他們每天工作 9 小時,每位評論員每班分析多達 1,000 條音訊片段。

(Source:亞馬遜

據了解,此類數據收集行為在行業屬於常態,部分中國廠商也會透過此類方法收集用戶資訊,以提升智慧語音助理的能力。與此同時,中國大部分智慧音箱都支援用戶創建訓練計畫。

前文有提到,智慧語音系統目前 AI 能力,仍難說有多智慧,而整個智慧語音系統基於模仿人腦神經網路演算法進行語音辨識後的語境預測。儘管如此,面對口語化語境,甚至方言,對智慧語音系統而言,仍需訓練。這也是亞馬遜招募這個團隊的主因。

這樣看來,亞馬遜的目標是訓練出更優秀的數據模型,更像治癒系法師,但在用戶隱私問題提升到相當高度的現在,前有 Facebook、Google 屢屢碰壁,後有自家用戶數據洩露問題,亞馬遜這團隊也難免被定調為「偷聽」團隊。

要想提高語音系統精準度就需要大量用戶數據,要透過正常手段拿到用戶授權這些數據又不太可能(現在大部分授權模式類似 Android App 打開前的授權認證),因而也難說亞馬遜被曝光的這團隊,對用戶而言,可以說是「偷聽」團隊;對 Alexa 而言,則算治癒系。

貝佐斯看好的 Alexa,難坐擁江山

亞馬遜 CEO 貝佐斯 4 月 11 日發表的「2018 致股東信」,這樣介紹 Alexa 過去一年的發展:

「自第一代 Echo 面世以來,用戶已購買超過 1 億台搭載 Alexa 的設備。去年,我們為 Alexa 提供了數十億條訓練數據,使 Alexa 擁有更豐富的知識,也將 Alexa 理解請求和回答問題的能力提高了 20% 以上。我們的開發人員將 Alexa 技能的數量翻了一倍,Alexa 技能數量達到 8 萬多,與 2017 年相比,2018 年用戶與 Alexa 的互動頻次增加了數百億次。2018年,搭載 Alexa 系統的裝置數量也增加 1 倍以上。目前有超過 150 種產品內建 Alexa,包括耳機、PC、汽車及智慧家居設備。」

儘管貝佐斯一再看好 Alexa,也一再投入大量人力、物力,然而緊隨其後的 Google 逐漸趕上。

前文提到,據 Strategy Analytics 的 2018 年第四季智慧音箱銷量統計數據顯示,亞馬遜全球占比 35.5%(13.7 萬台),Google 占比為 30%(11.5 萬台);

此外,Google Assistant 產品副總裁 Manuel Bronstein 在 CES 2019 也放狠話,表示「Google 正在圍繞 Google Assistant 構建類似 Android 的完整生態系統」。

智慧語音潛力巨大,仍需打磨;Alexa 占盡先機,卻難獨自坐擁江山。

(本文由 雷鋒網 授權轉載;首圖來源:Amazon Alexa