才沒那麼容易被AI取代?ChatGPT與新聞業的相愛相殺

一个老练的记者对于其采访路线上的新闻文稿样态与风格,已经成竹于胸,只要备齐必要的新闻资讯,就可以快速完成公正的报导——而这个去人化的生产流程,正好机器的强项,因而ChatGPT的上线,立即让新闻从业人员开始询问:ChatGPT会为新闻业带来什么样的冲击? 图/电影《惊爆焦点》

ChatGPT在2022年底上线后,被认为是改变社会的新里程碑,其重大突破在于能让机器掌握复杂的人类语言与沟通过程,一面是能够理解我们用日常话语提出的问题,另一面是能消化网上巨量资料,并再生成流畅可读的文字回传答案。ChatGPT能够回答的问题形形色色,包括:

「我给你人事时地物的必要资讯,请汇整后生成一篇完整新闻报导给我。」

这个应用,和新闻业作为资讯中介者(mediator)的定位颇为切近。新闻工作者仅守中立客观报导和忠实传递资讯的原则,尽可能摒除人为判断和主观解释(这留待读者决定),把查访到的资料经过合适的编排,按固定的体例与格式撰写成报导。这是所谓的「纯净新闻」(pure journalism),一度是新闻工作守则,也是至高标准。

也就是说,一个老练的记者对于其采访路线上的新闻文稿样态与风格,已经成竹于胸,只要备齐必要的新闻资讯,就可以快速完成公正的报导。这里指的公正不只是平衡,还包括追求客观的程序:

ChatGPT在2022年底上线后,被认为是改变社会的新里程碑,其重大突破在于能让机器掌握复杂的人类语言与沟通过程。 图/法新社

ChatGPT普及后的新闻工作或新闻业,或许需要更专注在原生新闻的产制。示意图,正在进行现场采访的记者。 图/美联社

▌ChatGPT之前的「机器生成新闻」

而这个固定新闻体例的做法并不是ChatGPT上线后才有的。早期主要是新闻集成(news aggretation)式的媒体,提供一站取用新闻的服务,其中低下者如内容农场固然错误百出,却仍为了追求点击重复推送耸动未经查证的内容,更可恶的是隐瞒撰文者身份和资讯来源让人难以查证,经常成为假新闻的出处;但也有大型入口网站的首页,以能提供即时重大且有品质的新闻取胜,而微软(Microsoft)旗下的MSN就在2020年中,全面采用自动化的新闻集成与编辑程序,原先20余名新闻编辑的聘雇合约因此中止。

更普遍的,我们常用Google News的订阅服务,以及在社群网站像Facebook上被推送的新闻页面,其核心的演算法可以根据个别使用者的数位足迹以及个人资料,捞取并推荐裁剪过的新闻内容,而这个过程并不需要熟悉老读者胃口的资深编辑判断。可以说,机器介入了新闻改写与编辑排版的流程,已经许久,而读者也习以为常了。

然而值得注意的是,自动化新闻集成是早已普遍的应用,但让机器就集成的资料再编写为可读文稿的技术,主要是自然语言处理以及生成(natural language processing and generation),是随着电脑运算速度的提升到晚近才渐成熟。

在ChatGPT上线前,借机器生成内容的新闻类型,主要是文体结构比较制式僵硬、且篇幅较短的纯资讯性报导,特别是转播数据为主的内容,比如运动赛事的即时竞赛成绩、财经新闻中对金融市场各指数的播报、各种天气数据等等。为人熟知的例子是商情新闻通讯社《彭博社》(Bloomberg),为了向金融业客户提供尽可能零时差且准确的资讯,很早就串接金融中心的数据资料库,并大力开发自有的语言模型和机器学习,使资料生成新闻的流程自动化。

就个别新闻工作者而言,短期内使用ChatGPT协助编写新闻,或寻找新闻资料与查证,是提高了工作效率,但这也意味技术门槛进一步被拉低,长期而言是配合业者节约人力的方向前进。示意图,一名记者坐在路易斯安那州议事厅外撰写报导。 图/美联社

示意图。ChatGPT之类的AI技术普及后,可预见将为新闻业节约人力,业者不论主动或竞争压力下被迫,都可以将原本人手完成的工作交给机器,让新闻产出与发布自动化。 图/电影《银翼杀手2049》

不仅于此,随着文字探勘领域中的主题萃取(topic extraction)技术以及关联分析的成熟,《彭博社》的机器已能就「非数据」的纯文字资料进行深度理解,为金融业客户提供见微知着的早期商业情报,也就是在关键事件还在蕴酿、尚未广为报导前,就被机器标定掌握,并生成重点式文章发送给有关客户。

这样的资讯服务,对于需要洞烛机先、或分秒必争的客户非常宝贵,类似的服务还有由前《华尔街日报》研发部门主管马可尼尔(Francesco Marconil)新创的公司AppliedXL专门经营,号称可以为特定产业的顾客提供关键事件发生前的早期讯号,让顾客可以提早因应。

而《美联社》则是早在2017年就展示过类似技术,在《扩增新闻的未来:智慧机器时代的新闻室指引》(The Future of Augmented Journalism: A Guide for Newsrooms in the Age of Smart Machines)报告中,《美联社》提供了长篇文稿及其重点摘要,并请读者自行理解文稿后比对其与摘要间的落差。在读者都认为摘要精确地呈现文稿重点后,《美联社》才宣布摘要是由社内开发的机器自行判读生成的。也就是说,《美联社》在六年前展示的「扩增式新闻」,已能使用机器模仿人类的思索与判断的过程,以及写作(或接近创作)的能力。

值得注意的是,相比于《彭博社》与AppliedXL专治特定领域的资讯处理(意即资讯的规律与结构较容易辨认与模仿),《美联社》业务涵盖的资讯面向与类型更加复杂与全面,如今已常态性地运用AI自动生成新闻。《美联社》自诩为「推进新闻业技术革命的领头羊」,2022年更发布报告《地方新闻用AI:美国新闻业的AI程度调查》(Artificial Intellegence in Local News: A Survey of Newsrooms’ AI Readiness)。

这份报告显示,用自然语言模型自动生成新闻内容的做法,在美国新闻业已经相当普及,报告内文写着:「只要有序地填入资料到预先备妥的表单栏位中,自动写作系统就能够将之汇整并且生成新闻全文。」除此之外,自动生成版面、自动配图配音等等,也都是AI着力之处。

示意图。用自然语言模型自动生成新闻内容的做法,在美国新闻业已经相当普及,除此之外,自动生成版面、自动配图配音等等,也都是AI着力之处。 图/电影《银翼杀手2049》

示意图。若新闻工作者就同业的报导作改写汇整,单就这项工作而言,ChatGPT能用更短的时间、且更准确地完成,方法是由记者或编辑抓取任两篇以上同主题的报导,请ChatGPT汇整后生成指定字数的短稿。 图/电影《云端情人》

▌ChatGPT对新闻业的颠覆改造

简单回溯新闻业导入AI的轨迹后,大概可知如今ChatGPT对新闻业的意义,是完成新闻产制自动化的最后和最艰难的一哩路,也就是非特定领域的大型语言模型(large language model, LLM)的普及应用成真。这本来是《彭博社》、《美联社》戮力开发的独门能力,如今可以被小型媒体甚至个人新闻工作者用在日常工作流程中。举例而言,若新闻工作者就同业的报导作改写汇整,单就这项工作而言,ChatGPT能用更短的时间、且更准确地完成,方法是由记者或编辑抓取任两篇以上同主题的报导,请ChatGPT汇整后生成指定字数的短稿。

除了改造记者编辑个人的新闻工作,ChatGPT对全产业可能带来立即的冲击已经引起普遍担忧:如同可憎的内容农场,入口网站与Google News等新闻集成服务,可以不必再经排序后呈现或推荐原新闻出处,而是自动生成改写后的新闻提供给读者。这样为资讯爆炸时代读者设想的「贴心」服务,不论是平台业提供,或读者自行使用,都截断将读者带回新闻出处网站的导流过程,更可能因平台具备轻易「产制」新闻的能力,而影响甚至取消平台业与新闻业的广告分润机制,使原来经营困难的新闻出版业雪上加霜。

试想:只要有程式可以即时捞取媒体上的新闻,并串接各大机构公关部门的发稿系统,将捞取回来的资料分类喂给ChatGPT并请改写生成新闻,就可以即时地在网路上发布了。若再结合根据原生新闻流量或热门关键字排序呈现的排版程式,或是按个别订户属性,客制化的推送介面,就能为读者更准确地提供新闻服务——即使这个过程既不产出原生内容,也没有付费分担原生内容的生产成本。这对于新闻业经营的伤害显而易见,美国的新闻业者联合会(News Media Alliance)就因此要求,这类再生成新闻的服务应当付费给产制原生新闻的媒体,并且在国会推动相关立法。

综上,ChatGPT的普及应用对新闻业是福是祸呢?它的影响是两面的:一方面为新闻业节约人力,业者不论主动或竞争压力下被迫,都可以将原本人手完成的工作交给机器,让新闻产出与发布自动化。另一方面,是广告营收的分润机制遭到破坏,营业更困难。

就个别工作者而言,短期内使用ChatGPT协助编写新闻,或寻找新闻资料与查证,是提高了工作效率,但这也意味技术门槛进一步被拉低,长期而言是配合业者节约人力的方向前进。不论是经营者或工作者,都是将行业的核心技术能力让位科技公司了。而营业收入与人力支出的节缩,对任何一个产业与工作者来说,都是负向发展的讯号。

营业收入与人力支出的节缩,对任何一个产业与工作者来说,都是负向发展的讯号。示意图,爬梳海量资料、等待消息的记者。 图/电影《惊爆焦点》

如今ChatGPT对新闻业的意义,是完成新闻产制自动化的最后和最艰难的一哩路,也就是非特定领域的大型语言模型的普及应用成真。 图/电影《机械公敌》

但事情未必就往这个竭泽而渔的终局前进。仅管AI可以迅速集成网上公开资讯并编成新闻发布,但总是要有原生新闻供其编写。也就是说,ChatGPT普及后的新闻工作或新闻业,或许需要更专注在原生新闻的产制,以及相关工作程序上——这使记者必须更专注开采一手资料,包括实地调查与访问关键涉事者,或是提出通透的评论洞见,而AI是可作为记者的有力工具;ChatGPT作为新的人机介面,还大大节省了记者操作复杂运算的力气。相对的,二手甚至三手改写的新闻,其价值即将因为机器大量供应与介入工作程序而快速贬损。

由于科技公司提供的新闻服务无法自给自足,不得不倚重新闻媒体提供原生内容,德国大型出版商Axel Springer——《图片报》(Bild)、《世界报》(Die Welt)等德媒的总公司——就对ChatGPT普及后的前景抱持乐观,并表示旗下新闻媒体的数位转型或会造成人力缩编,但「新闻记者、作者、编辑的数量不会裁减,还会投入更多资源」。

专研「新闻自动化」的西北大学学者迪亚科普洛斯(Nicholas Diakopoulos),也抱持类似判断,认为机器不可能取代记者。但条件是记者必须学会数位思考与技能,能够将新闻议题与事件「参数化、模型化、拆解成片段资讯,这样就可以解放机器的潜能,提供新创产品与各种可能」。迪亚科普洛斯的意思是,在新闻业实现「自动化」之后,记者必须学会与机器共存,配合机器的逻辑制作新闻——这意味新闻业仍将存续,但工作模式可能迎来近乎颠覆的巨大改造。

ChatGPT对新闻业来说可谓是把双面刃,端看从业人员如何思考与使用,然而科技公司如何与新闻业达成共好的局面,不会自然发生,而失去活力的新闻业将使民主制度无以为继。在ChatGPT的应用把这个新闻业的困境加重而至存亡之际,政府所应扮演的角色,是杜绝科技公司的资讯服务搭新闻业便车的行为,使科技为人所用,令其转向正向循环的方向前进。

ChatGPT对新闻业来说可谓是把双面刃,端看从业人员如何思考与使用。 图/路透社

责任编辑/赖昀