科学家新视野－AI写新闻的技术与风险

2020年5月OpenAI公司发表了具有1750亿个参数的人工智慧（AI）语言模型GPT-3，可让电脑产生拟真的文章。其后，英国卫报在2020年9月8日发布一则〈机器人写了这篇文章，你害怕了吗，人类？〉新闻。卫报编辑人员先写一小段文字给GPT-3当作前导文，让GPT-3独立的写出后续500字的文章。卫报指出，比起记者写的新闻稿，编辑GPT-3产生的文章，整体而言花费较少的时间。此例证显示了此项技术，已可进入产业的成熟度。

AI依据前导文产生的文章，不论是中英文，语法几乎完全符合训练语料中的文句结构，语意上也相当通顺。只有在训练资料不足的情况下，需要人工润饰并修正明显的逻辑错误。例如，以金庸的14部小说训练AI，生成的文笔看起来像金庸，但不见得符合金庸小说的逻辑。

在三种条件下，AI产的文章，需要人工编辑的机会就越来越低：（1）事先训练AI的语料足够大量且品质优良、（2）前导文写得好、（3）前导文的主题在训练语料库里面够丰富。我们团队已做出符合上述三个条件，且可自动生成中文经济新闻，如下：

『根据金管会规划，同一金控下的银行，跟金控可以择一参股大陆银行，且参股总额度分开计算，金控「进可攻、退可守」，登陆投资弹性最大，成为两岸金融开放后最大受惠者。据了解，金控旗下的银行子公司，包括台湾银行、土地银行、合作金库银行、第一银行及华南银行等，都是透过金控子公司，参股大陆银行。至于大陆银行来台参股，银行业者表示，参股对象是否有经营权，还是要看金管会规划，但是参股上限是否放宽，还要看两岸主管机关的规划。』

此篇电脑产生的新闻，一般人已难看出是否为电脑所写，更难以判定内容的真假。若AI生成的文章被误用，特别是高风险的内容，如股市新闻，不管内容对错就大量发送，将造成市场资讯混乱。

AI生成的文章若未经人工修正，我们团队可用另外的AI方法侦测，准确率最高可达96％。若AI生成的文章已由人工编修，恐怕难以辨识文章的作者是人类还是AI。因此，若误用AI技术而借助电脑快速地生成大量而未加查证的新闻，其结果将降低大众对媒体的信任度，此种情况，不得不防患于未然。此项AI先进技术才出来两、三年，进步飞快，只要有大数据，熟悉软体安装与操作，即可做出电脑生成的新闻、文章。此技术对未来的影响，值得关注。

在产业界，AI生成文章可以辅助人们提高写作的效率。但在教育界，误用或滥用AI生成的文章可能造成作弊现象。若学生高度依赖AI，而老师、学校在无从辨识的情况下给予了不该给的分数，或是授予了不该给的学位。这些可能的弊端，需借助自动侦测系统，来快速辅助鉴定学习历程、学位论文、计划书等具高报酬、高影响之文件，是否由电脑AI产生。此类衍生的问题，社会学者、法律专家可能得未雨绸缪后续发生的各种情况。

科学家新视野－AI写新闻的技术与风险

相关资讯