小心有雷!人工智慧幫你未看先防爆雷

作者 | 發布日期 2019 年 07 月 12 日 8:45 | 分類 AI 人工智慧 , 網路趣聞 follow us in feedly

還記得《復仇者聯盟:終局之戰》上映時,全球掀起的反爆雷活動嗎?聖地牙哥大學研究出一套演算法,可以讓你在被雷到之前,就提前避開這些危險的文章與留言。

「雷」是近年來常見的網路用語,意指「提前洩漏劇情」,為了避免不小心雷到別人,許多網友在討論漫畫、電影、電視劇的時候,都會在貼文和留言加上「防雷分隔線」或是長串空白,以免意外炸傷。但也有些可惡的網友以此為樂,特別喜歡在知名影評人的文章下留言爆雷,讓許多人氣得牙癢癢。

聖地牙哥大學(UC San Diego)的研究團隊,發現《終局之戰》和《冰與火之歌》引發的這個現象後,開發出這套 SpoilerNet,解決這個討人厭的麻煩。

他們利用亞馬遜旗下的閱讀社群網站 Goodreads,收集超過百萬篇評論,這個網站的評論有個特點,每一篇評論都有標註防雷警語的習慣,對讀者來說非常友善,對開發者來說更是一個寶藏。這就像一個完美的資料庫,充滿大量已經下好標記的數據,也是「深度學習」模型最好的學習材料。開發團隊將 130 萬篇評論餵給這個深度學習模型,並讓機器分析「一般字句」跟「爆雷字句」的不同。

以人類直覺來說,很難想像這兩種字句有什麼不同,但機器還真的分辨出來了。SpoilerNet 完成訓練後,開發團隊使用 Google 與 TV tropes(一個大型文化資料維基網站)測試,獲得 92% 正確率。也就是說,它已能幫你避開九成以上的爆雷文,剩下 8% 還有待更多數據幫忙。

開發團隊表示,類似的防雷預警系統,以前也曾出現,但資料庫太小,只有幾千筆,因此不夠精準。深度學習模型加上巨量資料,讓機器更貼近人類用語,並找出人類也無法說明白的差異點。然而深度學習依然有侷限,在文字分析,一些雙關用語常常讓機器混淆,比如說:

(以下有雷,若你還沒看過終局之戰,且預計要看,請快速跳過)

 

 

 

 

 

 

「鋼鐵人死定了」大概不是爆雷,「鋼鐵人死了」就是爆雷。像這樣的判斷力還有待提升,但站在防雷的立場,寧可誤殺不可錯放,未來或許可以加入這樣的敏感度判斷,將可疑字句先當成雷,以免誤傷。

下一個問題就是,一般大眾要怎麼使用這套系統呢?開發團隊表示,這個系統完全可在個人電腦運作,但要貼近使用者習慣的話,他們認為瀏覽器擴充套件比較有機會。儘管他們還沒有想商業化,但他們還是很希望幫助更多人「防雷」,因為團隊成員都是吃過爆雷之苦的過來人。

這套工具未來很可能會落入亞馬遜手裡,並成為旗下網站的好幫手。試想,當下一部神片上映時,有個網站能跟你保證絕不爆雷,讓你不用再關機 3 天直到走出電影院,是不是好棒棒呢?

(首圖來源:pixabay