科学家新视野-AI写新闻的技术与风险

2020年5月OpenAI公司发表了具有1750亿个参数人工智慧(AI)语言模型GPT-3,可让电脑产生拟真的文章。其后,英国卫报在2020年9月8日发布一则〈机器人写了这篇文章,你害怕了吗,人类?〉新闻。卫报编辑人员先写一小段文字给GPT-3当作前导文,让GPT-3独立的写出后续500字的文章。卫报指出,比起记者写的新闻稿,编辑GPT-3产生的文章,整体而言花费较少的时间。此例证显示了此项技术,已可进入产业成熟度

AI依据前导文产生的文章,不论是中英文语法几乎完全符合训练语料中的文句结构,语意上也相当通顺。只有在训练资料不足的情况下,需要人工润饰修正明显的逻辑错误。例如,以金庸的14部小说训练AI,生成的文笔看起来像金庸,但不见得符合金庸小说的逻辑。

在三种条件下,AI产的文章,需要人工编辑的机会就越来越低:(1)事先训练AI的语料足够大量品质优良、(2)前导文写得好、(3)前导文的主题在训练语料库里面够丰富。我们团队已做出符合上述三个条件,且可自动生成中文经济新闻,如下:

『根据金管会规划,同一金控下的银行跟金控可以择一参股大陆银行,且参股总额度分开计算,金控「进可攻、退可守」,登陆投资弹性最大,成为两岸金融开放后最大受惠者。据了解,金控旗下的银行子公司,包括台湾银行土地银行合作金库银行、第一银行及华南银行等,都是透过金控子公司,参股大陆银行。至于大陆银行来台参股,银行业者表示,参股对象是否有经营权,还是要看金管会规划,但是参股上限是否放宽,还要看两岸主管机关的规划。』

此篇电脑产生的新闻,一般人已难看出是否为电脑所写,更难以判定内容真假。若AI生成的文章被误用,特别是高风险的内容,如股市新闻,不管内容对错就大量发送,将造成市场资讯混乱。

AI生成的文章若未经人工修正,我们团队可用另外的AI方法侦测,准确率最高可达96%。若AI生成的文章已由人工编修,恐怕难以辨识文章的作者是人类还是AI。因此,若误用AI技术而借助电脑快速地生成大量而未加查证的新闻,其结果将降低大众媒体信任度,此种情况,不得不防患于未然。此项AI先进技术才出来两、三年,进步飞快,只要有大数据,熟悉软体安装与操作,即可做出电脑生成的新闻、文章。此技术对未来的影响,值得关注。

产业界,AI生成文章可以辅助人们提高写作的效率。但在教育界,误用或滥用AI生成的文章可能造成作弊现象。若学生高度依赖AI,而老师学校在无从辨识的情况下给予了不该给的分数,或是授予了不该给的学位。这些可能的弊端,需借助自动侦测系统,来快速辅助鉴定学习历程、学位论文计划书等具高报酬、高影响之文件,是否由电脑AI产生。此类衍生的问题,社会学者法律专家可能得未雨绸缪后续发生的各种情况。