在廣告下達 Alexa 指令也不會觸發 Echo 裝置,亞馬遜怎麼辦到的?

作者 | 發布日期 2018 年 02 月 06 日 16:16 | 分類 3C周邊 , 科技趣聞 line share follow us in feedly line share
在廣告下達 Alexa 指令也不會觸發 Echo 裝置,亞馬遜怎麼辦到的?


最近的「超級盃」廣告大賽,亞馬遜那支有關智慧語音助理 Alexa 的廣告又引起討論。

在片中,喜歡罵人的地獄廚神戈登‧拉姆齊、一不留神就開車的脫口秀女星瑞貝爾‧威爾森、自我宣傳個不停的饒舌歌手 Cardi B,以及只聽聲音就嚇人的人魔扮演者安東尼‧霍普金斯等,他們代替突然「失聲」的 Alexa,幫助用戶「解決」提出的各種問題。

為了展現這些新「聲優」賣力工作的場景,90 秒的廣告中,用戶不厭其煩地呼喚了好多次 Alexa:

Alexa,幫我查一下烤乳酪三明治怎麼做?
Alexa,地球到火星有多遠?
Alexa,營造一下氣氛。
Alexa,放點鄉村音樂。
……

「新 Alexa」的回答當然是來搗亂的。不過問題又來了,廣告裡叫了這麼多聲 Alexa,萬一放在旁邊的 Alexa 真的被喚醒了怎麼辦?

這種事情還真的出現過。2017 年的超級盃比賽,Google 也為自己旗下的智慧音箱 Google Home 做了一支電視廣告。片中家人朋友歡聚一堂,然後給 Google Home 下達了開燈、關燈、教自己烹飪美食等指令。

(Source:Flickr/NDB Photos CC BY 2.0)

然後就有網友在網上吐槽

這個廣告讓我家的 Google Home 變成了災難。

廣告不停觸發我的 Google Home!他們應該對「Okay Google」這個指令做一些處理。

不過這次,為了防止這類事情發生,亞馬遜提前做了準備。在這支充滿 Alexa 指令的廣告發表之前,他們就在官網表示:放心吧,這次你們的 Echo 裝置不會被廣告「騷擾」。

祕訣就在於,亞馬遜用了一種名為「聲音指紋辨識」的技術(Acoustic Fingerprinting Technology),能分辨哪些聲音來自廣告、哪些才是用戶的真正指令。

這項技術還得從他們在 2014 年 9 月就註冊的一項技術專利──「語音指令過濾」(Audible command filtering)說起。當時對這項技術的描述是,它可以防止 Alexa「在部分有大批觀眾的電視轉播(如大型體育賽事)時」被喚醒,同樣的情況還有故意搗亂的用戶,以及當無數相似性指令發出時帶來的伺服器過載等。

大體上來說,這項技術主要透過兩條路徑來達成。第一種是,在一條廣告播出前,先把部分片段傳輸至 Echo 裝置,這樣就能讓 Alexa 比較並分辨哪些語音指令才是真實發出。

第二種,則是讓廣告本身發出一種人類聽不見、但 Alexa 可以捕捉的信號,告訴它直接忽略這個喚醒指令。

根據彭博社的報導,大約一年前,名叫 Asphyhackr 的 Reddit 用戶做過一個小實驗,當他把亞馬遜的廣告放到聲音剪輯軟體,發現廣告傳遞的指令音頻大約在 3,000~6,000 赫茲範圍內,這不是一般人會發出的正常說話音頻範圍。因此,他驗證了 Alexa 可以分辨並「忽略」掉這些聲音指令,證實了亞馬遜所說的第二種方法。

除此之外,亞馬遜的發言人還表示,他們已對這則廣告做了一些調整,能最大限度降低 Echo 裝置對電視指令的失誤率,有了聲音指紋技術的加持,大約 80%~90% 的裝置都不會出錯。

這一次,無論廣告中的 Alexa 還是現實中的 Alexa,看來要同時「休眠」了。

(本文由 愛范兒 授權轉載;首圖來源:亞馬遜

延伸閱讀: