书摘精选》深度伪造与「有图有真相」时代的终结
其实伪造的影像并不是新玩意儿。自照相术发明以来,人们就开始利用技术来伪造相片。(示意图/shutterstock)
2013年秋天,伊恩.古德费洛(Ian Goodfellow)与大学实验室伙伴在酒吧举行欢送派对。大家就座,开始猛灌精酿啤酒。酒过三巡,古德费洛已有些微醺,这群研究员开始争论什么才是制造能够自我创造相片写实影像的机器之最佳途径。他们知道可以训练一套神经网路来辨识影像,然后逆向操作,使其产生影像。但它只能产生一些精细、有如相片的影像,这样的结果实在难以令人信服。
不过古德费洛的伙伴们有一个主意。他们可以对神经网路产生的影像进行统计分析──辨识特定像素的频率、亮度,以及与其他像素间的关系。然后将这些分析结果与真正的相片进行比对,这样就可以显示神经网路哪里出错了。问题是他们不知道该如何将这些资料编码输入他们的系统之中──这可能需要数十亿的统计次数。
古德费洛提出一个完全不同的解决之道。他解释,他们应该做的是建立一套能够向另一套神经网路学习的神经网路。第一套神经网路制造影像,企图欺骗第二套神经网路认为这是真的。第二套会指出第一套的错误,第一套于是继续尝试欺骗,就这样周而复始。他表示,如果这两套相互对抗的神经网路对峙得够久,他们就能制作出写实的影像。
但是古德费洛的伙伴们并不认同。他们说这主意甚至比他们的还烂。同时,若非他已有些醉了,古德费洛可能也有同感。「要训练一套神经网路已经够难了,」清醒时的古德费洛可能会这么说,「你不可能在正在学习演算法的神经网路中训练另一套神经网路。」不过他在当时完全相信可以做到。
当天晚上他返回公寓,他摸黑坐在床边的桌前,仍然有些微醺,笔记型电脑萤幕的光反射在他脸上。「我的朋友是错的!」他不断告诉自己,同时用其他计划的旧编码来拼凑他所说的两套对抗的神经网路,并且开始以数百张相片来训练这套新装置。几个小时后,它开始显现他所预期的效能。生成的影像很小,和一片指甲一样,而且还有一些模糊。不过它们看来就和相片一样。他后来表示,他完全是运气来了。「如果它不成功,我可能就会放弃了。」他后来在发表此一概念的论文中将它称作「生成对抗网路」(generative adversarial networks,GANs)。自此之后,他成为全球人工智慧研究圈口中的「GAN之父」。
2014年夏天,他正式加入谷歌,当时他已在积极推广GAN,强调这有助于加速人工智慧的研发。他在说明概念时,往往会以理查.费曼为例。费曼曾在教室黑板上写道:「我创造不出来的东西,我就不了解。」古德费洛相信费曼此一名言除了人类之外,也可以适用于机器:人工智慧创造不出来的东西,它就不了解。他们指出,创造,能够帮助机器了解周遭的世界。
「如果人工智慧可以用逼真的细节去想像世界──能够学习如何想像逼真的影像与逼真的声音──这样可以鼓励人工智慧学习现实存在的世界结构,」古德费洛说道,「它能帮助人工智慧了解所看到的影像与所听到的声音。」如同语音、影像辨识与机器翻译,GAN代表深度学习又向前迈进一大步。或者,至少深度学习的研究人员是这么认为。
脸书人工智慧研究中心主任杨立昆(Yann LeCun)在2016年盛赞GAN「是深度学习近二十年来最酷的概念」。古德费洛的成就激发出许多围绕其概念的计划,有的是加以改进,有的是据此进一步发展,有的则是发起挑战。怀俄明大学的研究人员建造一套系统,能够产生细小但是完美的影像,包括昆虫、教堂、火山、餐厅、峡谷与宴会厅。辉达(NVIDIA)的一个研究团队则是建造一套神经网路,可以将一幅显示炎炎夏日的相片影像转变成死气沉沉的冬日。加州大学柏克莱分校的研究小组则设计出一套系统,能够将马匹的影像转变成斑马,把莫内的画变成梵谷的画。这些都是科技界与学界最受人瞩目与最有趣味的研发计划。
可是,就在这时,世界发生剧变。
2016年11月,唐纳.川普赢得美国总统大选。美国生活与国际政局随之出现天翻地覆的变化,人工智慧也难以幸免。几乎是立即出现的冲击,政府开始打压移民引发人才流动的忧虑。在美国就读的国际学生已在减少之中,如今更是大幅锐减,对外国人才依赖甚重的美国科学与数学界也因此开始受创。「我们是开枪打自己的脑袋,」西雅图著名的艾伦人工智慧研究所(Allen Institute for Artificial Intelligence)的执行长说,「我们不是打在脚上,是脑袋。」
一些大企业已在扩张他们的海外研发作业。脸书分别在蒙特娄与杨立昆的家乡巴黎设立实验室。川普政府移民政策所带来的威胁在2017年4月就已显现,距离他上任不过三个月。与此同时,「深度学习运动之父」杰弗瑞.辛顿(Geoffrey Hinton)帮助成立向量人工智慧研究所(Vector Institute for Artificial Intelligence)。这是多伦多的一所研发育成机构,设立资金达一亿三千万美元,其中包括美国科技巨擘如谷歌与辉达的挹注。此外,加拿大总理贾斯汀.杜鲁道(Justin Trudeau)也承诺以九千三百万美元来扶持在多伦多、蒙特娄与爱德蒙顿的人工智慧研发中心。
年轻的研究员莎拉.萨波尔(Sara Sabour)是辛顿一位关键性的合作伙伴,她的事业历程足以说明人工智慧圈内的国际色彩是多么容易受到政治影响。2013年,在伊朗的谢里夫理工大学(Sharif University of Technology)完成电脑科学的学业之后,萨波尔申请到华盛顿大学深造,攻读电脑视觉与其他方面的人工智慧,校方接受了她的申请。但是美国政府却拒绝给予签证,显然是因为她在伊朗长大与就学的关系,而且她所要攻读的领域,电脑视觉,也是潜在的军事与安全科技。第二年,她成功进入多伦多大学,之后追随辛顿加入谷歌。
在此同时,川普政府持续阻挡移民进入美国。「现在看来是美国企业获益,」亚当.席格(Adam Segal)说道,他是美国外交关系协会(Council on Foreign Relations)有关新兴科技与国家安全的专家,「但是就长期来看,科技与就业机会都不会在美国实现。」
但是人才的迁移还不是川普入主白宫所造成的最大变化。自选举一结束,国内媒体就开始质疑网上假讯息对选举结果的影响,引发社会大众对「假新闻」的忧虑。起初祖克柏试图消除这样的关切,他在选举的几天后于矽谷的一个公开场合,轻描淡写地表示,选民受假新闻左右是一个「相当疯狂的想法」。但是许多记者、立法者、名嘴与公民都不予苟同。
事实上此一问题在选举期间十分猖獗,尤其在脸书的社交网路,有数以万计,甚至可能是百万计的网民,分享一些虚假编造的故事,这些故事的标题例如「涉嫌希拉蕊电邮泄密案的联邦调查局人员被发现死亡,显为谋杀后自杀」或是「教宗方济各支持川普竞选总统震惊世界」。脸书后来揭露有一家与克里姆林宫关系甚密的俄罗斯公司,花了超过十万美元向470个假帐户与页面买网路广告,散播有关种族、枪枝管制、同性恋权利与移民等方面的假讯息,此一事件使得公众更感关切。与此同时,社会大众的忧虑也投射到GAN与其他相关的科技上,使它们以完全不同于过去的面貌成为世人焦点:这些科技看来是产生假新闻的管道。
然而人工智慧科学家当时的研究却完全是在助长这种看法。华盛顿大学的一支团队,利用神经网路制作出一段冒用欧巴马说话的影片。中国一家新创企业的工程师则利用相同的科技让川普说中文。其实伪造的影像并不是新玩意儿。自照相术发明以来,人们就开始利用技术来伪造相片。不过由于新式的深度学习可以自我学习这些工作──或者至少部分的工作──它们使得这样的编辑变得更容易。政治人物与活动、民族国家、社会运动人士、不满分子往后不需要雇用大批人手来制造与散播假图片和假影片,他们只要建造一套神经网路就能自动完成这些工作。
在美国总统大选期间,人工智慧的图像操作潜能距离完全发挥仍有几个月的时间。当时GAN只能产生如指甲大小的图像,而要将字句置入政治人物的口中仍需要罕有的专业技能,更别说其他一些费力的工作了。不过,在川普胜选一周年时,辉达在芬兰实验室的一支团队开发出新款GAN,称作「渐进式GAN」,可以利用对抗式的神经网路制造出实际尺寸的图像,包括植物、马匹、巴士与自行车,而且几可乱真。不过这项科技最受瞩目的是它能够制造人脸。在分析数千张名人照片后,辉达这套系统可以制造出看来像是某位名人,但其实并不是的人脸图像──一张看来像是珍妮佛.安妮斯顿(Jennifer Aniston)或席琳娜.戈梅兹(Selena Gomez)的脸孔,而实际上并非真人。这些被制造出来的脸孔看来都像真人,有他们自己的皱纹、毛孔、暗影,甚至个性。
「这项科技的进步速度太快,」菲利浦.艾索拉(Phillip Isola)说道,他是帮助开发此类科技的麻省理工学院教授,「刚开始时是这样的,『好吧,这是一项有趣的学术性问题,你不可能用来制造假新闻,它只能产生一些略显模糊的东西。』结果却演变成『噢,你真的可以制作出像照片一样逼真的脸孔。』」
在辉达宣布此一新科技的几天后,古德费洛在波士顿一间小会议室发表演说,演说的几分钟前,一位记者问他该科技的意义何在。他指出他知道其实任何人都早已可以用 Photoshop 来制造假图像,不过他也强调,重点是使得这项工作更为容易。「我们是促使已经具有可能性的事情加速实现。」他说道。
他解释,随着这些方法的改进,「有图有真相」的时代也将结束。「从历史来看,这其实有些侥幸,我们能够依赖影片作为事情曾经发生过的证据,」他说道,「我们过去常常是根据谁说的、谁有动机这么说、谁有可信度、谁又没有可信度,来看一件事情。现在看来我们又要回到那个时代。」可是中间会有一段很艰难的过渡期。「遗憾的是现今世人不太会批判性思考。同时大家对于谁有可信度与谁没有可信度都比较倾向于从族群意识去思考。」这也代表至少会有一段调整期。「人工智慧为我们打开了许多我们不曾打开的门。我们都不知道在门的另一边会有什么东西,」他说道,「然而在此一科技方面,却更像是人工智慧关闭了我们这一代人已经习惯打开的门。」
调整期几乎是立即展开,某人自称为「深度伪造」(Deepfakes),开始将一些名人的头像剪接至色情影片中,然后再上传至网路。这个匿名的恶作剧者后来把能搞出这些花样的应用程式公开,这类影片立刻大量出现在讨论板、社交网路与如 YouTube 的影音网站。如 Pornhub、Reddit 与推特等平台赶忙禁止这种行为,但是此一操作与相关概念已渗透进入主流媒体。「深度伪造」也变成一个专有名词,意指任何以人工智慧伪造,并在线上散播的影片。
(本文摘自《AI制造商没说的秘密》/时报出版)
【内容简介】我们打造的AI天才,已经可以打败人类的天才。
我们该放任AI发展到何种境地?当国家利益、股东价值、科学家理念和个人安全产生冲突,掌握划时代科技的企业如何取舍?
首部以AI科学家为主轴的报导文学,用最贴近我们的视角,揭露人工智慧的机会、局限与威胁。伊隆.马斯克认为,人工智慧正以令人担忧的速度进步,他说:「如果科学家开发一套打击垃圾邮件的系统,该系统最终可能会认定,最佳方法就是消灭全人类。」但谷歌的赖瑞.佩吉和脸书的马克.祖克柏则认为,对人工智慧有如偏执狂的忧虑,有碍于数位乌托邦的实现。AI的发展到底该不该受到监控,成了一个争议不断的议题。
自从一名因为脊椎问题终生无法再坐下的科学家杰弗瑞.辛顿,点燃了微软、谷歌、脸书、百度等科技巨头的抢才大战。迄今,AI已与我们息息相关,除了日常应用,也正在与军事武器搭上线。一旦发展成熟,军事冲突的规模势必远大于过去,发动速度之快也将超乎人们的理解。然而,谁有权做这影响数十亿人口的决策?又是谁在参与此一决策?
从隐私疑虑到军事武器,科学家曾被蒙在鼓里,摸不清发明作何用途,而参与其中的企业选择对大众保持沉默。一项强大的工具,可以使之为善,也可以使之为恶。当我们在为AI的进展感到赞叹,有些威胁也正在悄悄萌芽。
【作者简介】凯德.梅兹Cade Metz
《纽约时报》科技记者,主跑人工智慧、自动驾驶车、机器人、虚拟实境、量子运算与其他新兴领域。在《纽约时报》之前,他是《连线》杂志的资深特约撰稿人。
本书是根据他八年来在《连线》和《纽约时报》从事人工智慧报导时,对逾四百人所做的采访,还有专为本书所做的上百次访问。书中的大部分人物,他都采访了不只一次,有些甚至是好几次。为了说明与求证一些事件与细节,他也引用了许多公司和个人的资料与电子邮件。每一项事件与重大细节(例如收购价格),都获得至少两个资料来源的证实,而且往往更多。
【译者简介】王晓伯
曾任职国内主要财经媒体国际新闻中心编译与主任多年,着有《华尔街浩劫》、《葛林史班:全世界最有权力的央行总裁》(合著),译作包括《光天化日抢钱》、《我们为什么要上街头?》、《海森堡的战争》、《小王子的宝藏》、《向领导大师学激励》、《群策群力的领导智慧》等。
《AI制造商没说的秘密》/时报出版