赖祥蔚/川普下台后 假新闻仍难解 Al+大数据能终结假讯息吗?

卫生局提醒民众乱传假讯息,将开罚最重300万元。(图/记者唐咏絮翻摄)

赖祥蔚台湾艺术大学广播电视学系教授

假讯息与新闻是2016年川普参选及当选美国总统以来,全世界关心议题。转眼四年多过去,川普已经连任失利而卸任,但是假讯息与假新闻的解决至今仍未有理想方案。

处理假讯息的方式,目前主要是靠人工处理。近年来,不少人试图以及Al大数据辨别假讯息。Al以及大数据能辨别假讯息吗?或许可以从原理及最新发展来分析

假讯息 vs 错误讯息 傻傻分不清?

首先,很多人常常混淆假讯息与假新闻,一般来说,假新闻的制造者必须是新闻媒体范围有限,假讯息的范围则泛指所有讯息。

假讯息(Disinformation)主要针对经过刻意编造,用以伤害特定对象的讯息,意图谋取特定利益。相较来看,有一个类似但不同的概念是「错误讯息」(Misinformation),亦即内容虽有错误,但并非意图伤害而刻意制造的讯息。

机器人可制造假讯息,也可辨识诈骗资讯。(图/翻摄自趋势科技防诈骗达人网站

辨识假讯息 人工+AI+大数据

其次,假讯息可以从两个向度来分类:制造者、内容;制造者,可概分为人工、机器人;内容,则可以概分为文字影像

人工假讯息,人人皆可做到,只是有人敢做、有人不愿做而已。至于Al人工智慧,基础原理之一是「机器学习」(Machine Learning),透过资料库来让机器学习,可以学习如何制造假讯息,当然也可以辨别假讯息。因为透过资料库,所以也是大数据分析。

当前机器人已经成为假讯息操作的主要手法,透由机器人帐号(BOTs)在网路社群散布讯息方式,并巧妙利用演算法提高讯息曝光率

美玉姨使用g0v的「Cofacts真的假的」开放式资料库,分析line群组假消息。(图/实习记者魏雅芬摄)

目前海内外辨别假讯息的方式,都是结合人工与AI及大数据,例如「Fake News Net」主要分析推特上面的假讯息,加入讯息时间与扩散性维度,能够了解讯息传播路径轨迹。「美玉姨」是使用g0v的「Cofacts真的假的」开放式资料库,人工协助查证讯息真伪后写入资料库,以便后续的比对。

有专家指出,可以从文章语汇用字的语言特征、标点符号去辨别是否是假讯息,更认定假讯息通常会使用较低层级、较简单的文字。对此,汪志坚教授的研究很值得一提,刚好可以看出人工与机器人制造的假讯息,在辨别的不同挑战。汪教授使用两个资料库:「Cofacts真的假的」与「新闻小帮手」,后者准确率达到88%;但前者因为不乏来自Line的内容,变化性太大,不像新闻有固定撰写格式,准确率只有67%。

学者分析, 人工制造的假讯息,仍不容易用Al和大数据辨识(图/Pexels)

影像&人工假讯息辨识 待克服难题

综上而言,Al以及大数据如果想要从「形式」去辨别假讯息,主要只能应付由Al以及大数据制造的假讯息。至于人工制造的假讯息,目前还不容易以Al以及大数据直接进行辨别。举例来说,如果人工撰写出某名人生病或是有弊案的讯息,Al以及大数据难以辨别真假,仍然要靠人工查证。

现在Al以及大数据辨别假讯息,仍以文字为主,对于影像的探索很少,例如最新的「深伪(Deep Fake)」技术,现在已经开始普及的REFACE 、Doublicat: Face Swap Pictures等App都可以在影像换脸,真假难辨,这是Al以及大数据辨别真假的一大挑战。

热门点阅》

►「晶片外交」可能吗?财经网美:车用晶片将扩产 台湾要把握机会

陈唯泰/台股急杀破月线 「这3族群」不建议抱股过年

► 台湾少子化》以色列产房爆满不够用!犹太家庭给台湾人的启示(苏育平

► 台湾少子化》薛承泰/与其拿钱跟美国军购 倒不如鼓励生育

● 以上言论不代表本网立场。欢迎投书云论》让优质文被更多人看见,请寄editor88@ettoday.net或点此投稿,本网保有文字删修权。