AI查核假民調 學者:可依據AMITT進行初期探勘的歸類
照片为记者拍摄
每逢选举各种民调就纷纷出现,其中有许多民调让人怀疑是造假,学者建议可以参考「恶意不实资讯与影响力战略技术分析架构(AMITT)」来进行初期探勘的归类。
铭传大学广电系主任杜圣聪接受中华传播管理学会的访谈指出,从荷兰的「公共数据研究室」提供的打击假讯息来看,其程式可以分为以下阶段:输入URL到CrowdTangle,观看其中的假新闻报导网址、分享URL的Facebook页面和社团、观察每一页面或社团的互动次数、分享讯息发布的日期;完成上述步骤后借以辨识具有最高假新闻报导。
按照学者陈百龄归类,防制假新闻主要有惩假、制假、打假、辨假四端。。至于事实查核,陈百龄认为主要有四种工具:(1)消息来源查核工具(2)时间查核工具(3)空间位置查核工具(4)网路监看和典藏工具。
杜圣聪说,查找不实讯息与查找不实民调相仿,均是一种以数位鉴识、AI判读学习与影响力操作狙杀炼分析等相关技术为核心,建立数位信任侦测分析与防护机制。希望链结在地产学研能量,发展有效侦测、滤除、追踪与鉴别解析各类型不实讯息/民调的生成、散播等手法之核心技术;同时整合对应资安新兴应用(例如谣言检视、虚假帐号、内容农场等),接轨产业现有防护方案,落实于实务场域(例如如广电媒体、警政国安、企业运营、民生经济等),促成对应数位鉴识/数位信任产业生态链。
杜圣聪表示,国内资策会的AI处理不实讯息的操作,主要有这八个项目。至于,形成不实讯息在看板层级部分,透过SJ Terp 与 Credibility Coalition 共同创立的不实讯息分析框架,特别是针对资安领域分析骇客时,归纳不同的攻击阶段与技术。也就是所谓的恶意不实资讯与影响力战略技术分析架构(AMITT),包括其阶段、目标与实际执行方式所建构的中文资讯看板,并参照性质层级的七个类目,分别置入不实讯息影响力狙杀链查找之标记,可以有以下的标志。
杜圣聪表示,查找不实民调的概念,也可以参酌AMITT的本土化看板,进行初期探勘的归类操作。未来,不实民调分类器的设计,可分为监督式学习(Supervised Learning)、非监督式学习(Un-Supervised Learning)和半监督式学习(Semi-Supervised Learning)等三种。监督式学习需要标记大量资料,实务上,资料标记需要大量人力,因此,非监督式学习,也引起大家的关注,较差的辨识效果是非监督式学习模式最大的缺点,而半监督式学习则介于两者之间,仅需标记少量资料,三者之间,各有其优缺点,如何在大量人力标记与辨识效果之间取得平衡点,会是实务操作上非常重要的议题。
杜圣聪认为,未来查找不实民调的作法,不妨归类为区块链、深度学习、统计法和传统机器学习等方法。每一项作法的特性说明如下:(一)区块链:顾名思义其为多个区块所组成,每个区块包含前个区块的密码杂凑函式和交易资料,这也使区块内容拥有难以窜改的特性。(二)统计法:通常这类方法会利用多种方法来查找资料中的特性,较为常见方法为资料探勘。(三)传统机器学习:相较于深度学习,这类方法须先将资料特征进行标记才能从资料中找出特定资料。(四)深度学习:为机器学习的一个子领域,由于计算方法类似于人脑中的神经元而得名,不同于传统的机器学习,在特征提取方面深度学习是不需要进行人工标记。
聚传媒