工具 還是對手?——人工智慧與表演藝術的探索與角力
《AI:当机器人写了个剧本》 (THEaiTRE/提供)
【撰文/本刊编辑部】
如果有只鹦鹉能回答任何问题,我将毫不犹豫宣称牠是智慧生物。
――狄德罗(Denis Diderot)
信不信由你,人工智慧(artificial intelligence,AI)与表演艺术的纠葛已超过百年——在捷克剧作家卡雷尔.恰佩克(Karel Čapek)1920 年的作品《罗梭的全能机器人》(Rossum's Universal Robots)中,「机器人」(robot)一词首度被用来描述这种外型似人,拥有与人类相同思考与行动能力的机械;而剧作中机器人原本设计来服务人类,却「觉醒」而导致人类毁灭的设定,也成了后世科幻作品对人工智慧的经典想像:从《2001 太空漫游》的 HAL 9000 到《魔鬼终结者》的天网,机器一旦开始思考,毁灭人类似乎总是它们的首要任务。
如果我们把人类到底多不该存在先放一边,这类故事原型正好让我们一窥大众对 AI 的终极想像:它们能理解回应世界的变动并解决没有标准答案的问题,最终甚至可能演化出自由意志而做出(就人类看来)叛逆的决定。这种能像人一般认知、思考、学习的 AI,称作通用人工智慧(artificial general intelligence,AGI)或强人工智慧(strong AI)。
黑盒子中的秘密:人工智慧是如何产生「智慧」?
AGI 一直是 AI 研究领域的终极圣杯,现阶段 AGI 离实现也还有段距离(注1);目前日常生活可见的 AI 多是另一种思维的产物:机械无需「真的」有智慧,它们只要能执行所谓的「智慧型任务」就可以了;比如在停车场出入口辨识车牌、在海关验证身分、自动或辅助汽车驾驶等等。这类 AI 被称作应用人工智慧(applied AI)或弱人工智慧(weak AI),基本上只能在人类的明确命令下执行单一任务,于此范畴外,则通常一无所知。尽管如此,弱人工智慧仍不时震惊世人,特别在弈棋这个常跟「智力」联想在一起的领域——比如 1997 年深蓝击败西洋棋王卡斯帕洛夫,或 2016 年 AlphaGo 击败围棋九段李世乭。但不论 AlphaGo 围棋下得再好,不经过重新训练,它并无法直接与人对弈其他棋类,更别说执行下棋以外的任务。
2022 年以前,强弱人工智慧的区别仍相当明显,但随着以 ChatGPT 为首的生成式 AI (generative AI)(注2)进入大众视野,两者边界似乎变得有些模糊——能有模有样回答几乎任何问题的聊天机器人,狄德罗会毫无疑义认为它们有智慧吗?就算我们把「谷歌停职员工声称 AI 有灵魂」或「聊天机器人向纽时专栏作家疯狂示爱」这类惊悚故事只看作花边新闻,2023 年 5 月一则货真价实的研究报告指出:在一项超过 150 万人参与的线上测试中,玩家能在两分钟聊天时间内,正确辨识机器人的准确度只有 60%——只比二选一瞎猜的 50% 机率好上一些。(注3)
即使几乎骗倒人类,许多主流 AI 研究者仍认为 ChatGPT 等一众聊天机器人不过只是能唯妙唯肖模仿人类的「随机鹦鹉」(stochastic parrots)——它们并不理解自己在说什么,只是根据学习过的巨量文本照样造句。然而也有另一派声音主张,真正的「理解」并不存在,「我们都只是随机鹦鹉」(注4),智慧是结果,不是源由——根本上,这就是自柏拉图以来即一直莫衷一是的「二元论」争辩的延续。
有趣的是,近年 AI 发展所仰赖的基础模型,仿似针对这道经典哲学难题的模拟实验:这种称作类神经网路(artificial neural network)(注5 )的演算模型,试图在物理机制上模仿大脑的运作,它们由巨量的神经元与突触构成复杂的多层网路结构,并借由大量训练素材,透过回馈机制增强或抑制突触的强度,来进行「学习」(注6)。2010 年后随着硬体运算能力的成长以及「深度学习」(deep learning)演算法的发明,类神经网路得以突破规模限制,达到接近人脑的复杂程度,从而展现出惊人的理解及回应能力——不过遗憾的是,这不表示数千年来的难题已然得解——就像解剖人脑没法找出智慧的源头,我们也无法透过分析类神经网路得知它们如何(或有没有)产生智慧:神经网路「学会」的知识或思想,分布在数以百亿计的神经元以及数以兆计的突触组合里,分析此等数量级的综合行为,基本上是不可能的任务。
生成式AI创作 现正进行中
不管 AI 是否真有智慧,会不会有天(有意无意)毁灭人类,对一般大众来说,这大抵还是件「交给大人去烦恼的事」,毕竟光是日常生活可见的冲击,就已十足令人忧心——想想网红的 deepfake 换脸事件,人类在道德灰色地带学习新工具的速度,只怕 AI 看了也瞠目结舌。而生成式 AI 对创作本质的动摇,更引起许多创意工作者的忧惧。创作曾被认为是人类智慧最重要的堡垒(想想创作牵涉多少不同的心智活动,认知、共感、表达、判断⋯⋯),现在却受到前所未有的挑战——从 2022 年游戏设计师杰森.艾伦(Jason M. Allen)以 Midjourney 绘制的画作《歌剧院空间》(Théâtre D’opéra Spatial)获得比赛首奖,引爆「AI 创作到底算不算艺术」的论战;到 2023 年好莱坞大罢工,ChatGPT 被认定是编剧工作权的重大威胁——这些争议,尚且是在创作者普遍认为 AI 创作能力还远不及人类的情况下发生的,而随着 AI 的突飞猛进,创作者又将面对怎样的未来?
另一方面来说,从古希腊的机器神到当代的 VR 艺术,新科技所带来的新工具、新媒介、与新生活型态,往往激发更多创作的素材与创意的可能。利用 AI 来创作已是行之有年的尝试:AI 作曲软体 AIVA 早在 2016 年便得到法国 SACEM 认证,成为世界上第一个被版权机构认证的虚拟作曲家;AI 编舞的历史更加悠久,1960 年代便有第一套 AI 编舞工具出现,近年来则有匈牙利编舞家瓦伦西亚.詹姆斯(Valencia James)的 AI_am 计划、英国编舞家韦恩・麦奎格(Wayne McGregor)跟 Google 合作的 Living Archive 计划等等,从不同面向探索 AI 辅助编舞的可能;而 2021 年,AI 也在捷克完成了第一个登台的编剧作品,《AI:当机器人写了个剧本》(AI: When a Robot Writes a Play)(注7),作为佩恰克的机器人剧作诞生百年的庆祝活动,此剧以现场直播的方式,于疫情期间在线上首演。
美国剧场导演安妮.多森(Annie Dorsen)可能是最早利用 AI 作为媒材的创作者之一:多森从 2010 年开始与程式设计师合作,创作了一系列以 AI 为主角,称作「演算法剧场」 (algorithmic theater)的作品。系列首作《哈啰你好》(Hello Hi There)唯二的「演员」是两台笔记型电脑,它们安坐在长满青草的土堆上,每晚即兴漫谈着人性,内容场场不同。(注8)AI 行为难以预测的特质,也成为许多后继者利用的素材,从英国杨维克剧院(Young Vic Theatre)2021 年推出的《AI》,到 2023 年在纽约外百老汇登场的音乐剧《毛皮与启示录》(Fur and Revelations),AI 各自在现场扮演即兴创作文本或音乐的角色;2022 年在德国上演的歌剧《逐流人生》(Chasing Waterfalls)更是一口气集上述大成——AI 不仅共同撰写文本、音乐,还在场上担任演员╱歌者(注9);全剧更包含4分多钟的即兴片段,完全由 AI 现场作曲、演奏、演唱完成。
艺术产制的未来会发生什么事?
尽管身为 AI 创作的先行者,多森对 AI 入侵的前景却十分悲观。在 2023 年结合 ChatGPT 创作的最新讲演(lecture performance)作品《盗火者普罗米修斯》(Prometheus Firebringer)演出后,多森甚至表示:「即使目的是为了批判它们,我对使用这些工具来创作依然感到矛盾,我怀疑我以后还会这么做。」
2024 年 1 月新出炉的研究则捎来更不祥的讯息:这项针对近 2800 位顶尖 AI 研究者的调查(注10)显示,平均来说,研究者预测 AI 在 2027 年便能模仿特定作曲家写出新曲,到 2030 年,AI 便可能写出登上《纽约时报》排行榜的畅销小说。且莫惊慌(或欣喜)——畅销小说未必等于深刻的艺术,就像好莱坞罢工现场的抗议标语所言:「ChatGPT 没有童年创伤」(注11),艺术家担心的或许不是 AI 能创作出旷世巨作,而是 AI 依循娱乐化公式大量产出,没有深刻意义与价值,甚至徒具某种模仿风格的作品,将会劣币驱逐良币;而由 AI 模仿的廉价「赝品」,甚至可能排挤正牌艺术家的生存空间。
或许 AI 创作的大举入侵无可避免,但我们不妨换个角度想想(或至少安慰自己)——AI 可能可以制造出唯妙唯肖,教宗穿羽绒服的照片,但它们会觉得这些照片有趣,乃至起心动念去「创作」它们吗?这也许是 AI 天生的缺陷——对没有肉体,生命近乎无穷与不朽的 AI 来说,真可能共情人类,对天地悠悠生老病死怆然涕下吗?当然 AI 仍在飞速发展,一切言之尚早;但假设在创作动机与美学观点上,AI 终需人类的咏唱与召唤,那真正会天翻地覆的或许不是创作,而是创作的产程:随着创作门槛降低,艺术创作将会更加去菁英化及普及化——许多传统职位会消失,但大众或许会迎接创意更加百花齐放,人人都能成为艺术家的未来。
(注)
1. 某些乐观的预测认为 2030 年 AGI 有机会实现,而如何监管 AGI 不至于毁灭人类,当然也是学界当前如火如荼的研究课题。
2. 生成式 AI 的训练重点在于如何产生内容;相对来说,像前述的车牌辨识或棋类应用,则专注在训练 AI 如何「做出正确决定」,后者通常被称作判别式 AI(discriminative AI)。
3. 这项由以色列公司 AI21 Labs 进行的研究基本上实作了人工智慧领域最经典的思想实验:「图灵测试」(Turing test),在 1950 年由20世纪最重要的数学家及计算机科学家之一——艾伦・图灵(Alan Turing)提出,原论文中称之为「模仿游戏」(那部以图灵为主角的电影便是依此命名);其假设是:「若一台机器能透过传输装置与人类对话而不被辨识出身分,便可称其具有智慧。」换言之,只要一具机器看起来有智慧,那么它便是有智慧的。
4. OpenAI 的执行长 Sam Altman 在 ChatGPT 推出5天后在推特上说:「我是一只随机鹦鹉,你也是。」
5. 不论是 ChatGPT 使用的大语言模型(large language model,LLM)或是 Midjourney 使用的生成对抗网路(generative adversarial networks,GAN),都是建立在类神经网路上头。
6. 相对来说,早年的 AI 发展,大多建立在「模仿人类的理性思考」上,比如透过预先编写好的的规则进行决策,或借由统计模型及训练资料学习特定情境与模式。其中一个主因是人脑太复杂了——在电脑硬体的能力及相关理论模型尚未成熟时,模拟人脑不论在理论或实务规模上都不可行。
7. 在戏剧构作 David Košťák 提供的场景设定与台词引导下,整个剧本大约有 90% 的台词由称作 THEaiTRobot 的 AI 工具生成。这个工具建立在 ChatGPT 的前代模型 GPT-2 上,theaitre.com 有提供免费试用,以及此剧本的全文下载。
8. 当年当然还没有 ChatGPT 甚至其前身,多森与研究者使用的是早期 AI 的方法,预先编写规则,让聊天机器人能根据上文选择对话,进行即兴对谈。值得一提的,AI 的谈资主要取材自 1971 年傅柯与乔姆斯基关于人性的经典电视辩论,再加上莎士比亚、圣经,及 YouTube 的影片评论等等。
9. 透过影像呈现。
10. 《数千位 AI 作者谈 AI 的未来》(Thousands of AI Authors on the Future of AI ),刊登在该月的《电脑与社会》(Computer and Society)期刊上。
11. 编剧的内部笑话,意指没有童年创伤,就写不出好剧本。
【完整内容请见《PAR表演艺术杂志》2024年3月号;订阅PAR表演艺术电子版】