2016年12月2日 星期五

Google DeepMind人工智慧已可讀懂唇語

匯流新聞網記者/藍立晴綜合報導
Google的人工智慧團隊DeepMind自從戰勝頂尖圍棋棋手又讓AI做出驚人創舉,讓其AI系統觀摩學習5000小時的BBC節目,結果在與人類唇語專家的決戰中徹底打趴人類。


DeepMind與英國牛津大學(University of Oxford)合作開發出這個能讀懂唇語的AI系統,且同樣是運用了機器學習(machine learning)技術。先前匯流新聞網曾報導,該團隊於上月才成功開發讓AI從記憶中「學習」的系統differentiable neural computers(DNC),與Alpha GO不同,不再依賴人類輸入的大量資訊就能學習。

而這套與牛津大學合作開發、能夠讀懂唇語的AI系統則是在觀摩了近5000小時的BBC節目,擷取學習了約11.8萬句話語,接著研究團隊再從3~9月「新播出的節目」中選取隨機的說話場景,並讓此套AI系統與人類唇語專家一決勝負,結果AI的準確率為46.8%;人類唇語專家準確率僅有12.4%,AI又再一次的於新的領域上完勝人類。

〈MIT TECHNOLOGY REVIEW〉指出,AI於唇語方面超越了人類,未來要如何應用也不難想像,這表示將來人們在使用Skype時若因為身旁環境太過嘈雜而覺得聽不太清楚、或者在聽覺上有些困難的人們,他們就只需要看著手機便能夠「聽見」朋友們在說些什麼。

牛津大學與DeepMind團隊日前才開發出一種唇語程式LipNet,其準確率更是高達93.4%(此測驗較為簡單);人類唇語專家則是79.6%;聽覺受損可讀唇語者則是52.3%,未來可望幫助許多聽障人士。


(LipNet的相關影片)

教導AI讀懂唇語未來將可以適用於無數情形,最重要的是能夠幫助到聽覺受損者,消彌人與人之間的溝通障礙。

沒有留言: