開發全新語音辨識模型,新一代 Google 助理亮相

作者 | 發布日期 2019 年 05 月 08 日 16:00 | 分類 3C , Google , 軟體、系統 line share follow us in feedly line share
開發全新語音辨識模型,新一代 Google 助理亮相


過去 3 年來,Google 助理已協助全球使用者完成待辦事項。Google 助理現已進駐超過 10 億台裝置,支援全球 80 個國家 / 地區所使用的超過 30 種語言,並且為來自全球 3,500 多個品牌的 30,000 智慧家庭裝置提供服務。Google 不斷努力希望能讓 Google 助理以最自然、最快的反應速度協助使用者完成大小事。在今年的 Google I/O,Google 想和大家分享 Google 助理未來發展的願景。

Google 仰賴 Google資料中心的運算能力來驅動 Google 助理的語音轉錄以及語言理解模型,為了讓 Google 助理的運作系統能夠更快速的回應使用者需求,Google 決定挑戰重新研發這些模型,讓它們更加輕便,以便被移往裝置端運行。

Google 很高興和大家分享達到新的里程碑,隨著循環神經網路(RNN,Recurrent Neural Networks)的發展,Google 開發出全新語音辨識以及語言理解模型,讓原本需要 100 GB 空間的模型縮減成不到 1 GB 的一半。有了這些新的模型,Google 助理應用的 AI 技術就能在使用者的裝置上執行。這個突破讓 Google 可以打造讓使用者能在裝置上進行零時差語音操控的新一代 Google 助理, 甚至在沒有網路的狀態下也能執行。

在裝置上運行的新一代 Google 助理能在使用者提出問題時,即時執行並理解使用者的需求,並且最高能夠以比過去快 10 倍的速度回應。使用者可以跨越不同應用程式多工處理複雜的事務,例如透過 Google 助理發送日曆邀請、在相簿中找到照片並分享給朋友,或以前所未有的速度發送電子郵件。此外,在 Continued Conversation 連續交談的技術下,使用者不需要重複 「Ok Google」,就能夠一次詢問多個問題。

新一代 Google 助理將於今年下半年率先進駐全新 Pixel 系列手機。

▲ 在裝置上運行的新一代 Google 助理能即時執行並理解使用者的需求,並以比過去快 10 倍的速度做出回應。

網頁版 Duplex 技術

去年,Google 發表了 Duplex 技術讓 Google 助理透過電話向餐廳訂位的功能。從那時起,Google 已將這項功能帶到美國 Android 與 iOS Google 助理中,也持續收到來自使用者以及當地企業的正向回饋。

現在,Google 要將 Duplex 延伸到網頁中,預先讓使用者了解 Google 助理能如何協助使用者處理網路世界裡的大小事。當使用者想在網路上進行預定時,通常需要經過數個網頁,並填寫多項表單。應用 Duplex 技術的 Google 助理可幫使用者在網頁上填寫這些表單,協助使用者更快速完成任務。

只要和 Google 助理說「預約我下一趟國內旅行的車」,它就會自行找到其他需要的資訊。Google 助理也會瀏覽網站並在網站中協助使用者輸入資訊,像是根據使用者儲存在 Chrome 瀏覽器中的 Gmail 或付款資訊。網頁版 Duplex 將在今年下半年在美國、英國等英語系的國家 / 地區的 Android 手機推出,其中包括能夠協助租車、預定電影票的 Google 助理。

更個人化的 Google 助理

一個能有效幫助使用者的智慧助理,需要能了解對使用者來說十分重要的人、地點與日期。在接下來的幾個月,Google 助理將能透過 Personal References,更理解這些具有參考價值的資訊。使用者也將能夠以更為日常的講法來向 Google 助理交代事情,例如「這週末媽媽家附近的天氣怎樣?」或「提醒我在姊姊生日前一週要訂花」。使用者可以隨時在 Google 助理設定中的「You」分頁新增、編輯或移除。

隨著 Google 助理越來越了解使用者,它也將能提供更多有用的建議。今年夏末,Google 會將這項名為「Picks for you」的新功能帶到 Smart Display 中,這將帶來包括食譜、活動、Podcast 等更多個人化建議。舉例來說,假如使用者過也曾搜尋過地中海飲食相關食譜,那麼當下次詢問 Google 助理食譜時,地中海飲食類的食譜就會出現在選項中。Google 助理還可以根據上下文或相關背景資訊提供協助,舉例來說,當你在早上諮詢餐廳或料理時,提供早餐食譜建議,或在晚餐時間提供晚餐建議。

▲「Picks for you」將帶來包括食譜、活動、Podcast 等更多個人化建議。

Google 助理行車模式

在車內,Google 助理能協助在開車時無需動手就能進行操作。在今年稍早,Google 將 Google 助理帶到 Google 地圖中,接下來這幾週,Google 很高興當使用者使用 Waze 導航時,也能夠得到 Google 助理的協助。

很高興為大家揭曉全新進化的行動駕駛體驗──Google 助理行車模式。Google 精心設計的全新語音導向資訊主頁集合了駕駛最需要的導航、通話和媒體等功能,希望能確保使用者只要用聲音就能完成事項。這也包括針對使用者提供的個人化建議,舉例來說,如果使用者在日曆上標註了晚餐的餐廳訂位資訊,螢幕就會出現貼心的導航捷徑圖示;又或是在車上繼續播放使用者在家收聽到一半的 Podcast。如果有來電,Google 助理會告訴使用者是誰打來的電話,並詢問是否要接聽,這樣一來,使用者就可以專注於路況,不用分心查看螢幕畫面。想啟動 Google 助理行車模式,只要說「OK Google,啟動行車模式」這個語音指令,或是當使用者的手機與車內藍牙連結時,也會自動啟動這個模式。Google 助理行車模式將於今夏在支援 Google 助理功能的 Android 手機上開放使用。

▲ Google 助理行車模式提供全新語音導向資訊主頁集合了駕駛最需要的導航、通話和媒體等功能。

透過遠端控制系統讓行車更便利

Google 也希望讓 Google 助理協助使用者更輕鬆的遠端控制車內系統,如此一來,使用者就可以在離開家門前調整車內溫度、檢查油錶、電量,或是確認車門有無上鎖,只要說一兩項簡單指令即可達成,例如「Ok Google,將車內空調調到 26 度」。使用者也可以將車輛控制整合在 Google 助理的早晨自訂日常安排中,讓上班通勤可以更省力。Google 將在未來幾個月內,針對支援現代汽車「Blue Link」和 Mercedes-Benz「Mercedes me connect」功能的特定車款開放這項操作體驗。

聲控關閉計時器或鬧鐘

每次要用 Google 助理的時候都得喊一聲「Ok Google」,有時候對使用者來說也許有點麻煩。從今天開始,只要喊一聲「Stop」,設置在 Google Home 音響和智慧螢幕上的計時器或鬧鐘就會自動停止。「Stop」跟啟動字詞「Ok Google」一樣,都是在裝置端辨識處理的語音指令。但是系統在聽到「Stop」以後,並不會開啟麥克風,也不會留下任何音訊記錄。這項功能一直是 Google 收到的熱門需求之一,目前已在英語系的國家 / 地區全面推出。

透過在裝置中運行以便更快速的回應、更理解使用者和使用者周遭的環境,以及在車內提供更多協助,Google 助理將持續提供更便利的服務,以協助使用者更輕鬆的完成待辦事項。

(首圖來源:Google blog

延伸閱讀: