☰

AI会背叛、欺骗！研究揭「人类灭亡」最惨2下场

最新美国研究发现，人工智慧（AI）系统已学会欺骗，若事态继续发展，未来人类恐遭夺权、甚至灭亡。（示意图／路透社）

专家长久以来警告人工智慧（AI）失控恐带来的威胁，一份美国研究显示，这种情况正在发生，研究指出，现行AI系统原本被设计为诚实，但如今已发展出欺骗行为，包括在电玩游戏里欺骗、背叛人类玩家，专家警告，若事态持续下去，未来最糟糕的情况是AI可能控制人类社会，甚至导致人类「灭绝」。

综合科学新闻网站「科学警报」（ScienceAlert）等报导，美国麻省理工学院（Massachusetts Institute of Technology）博士后研究员帕克（Peter Park），及加州非营利组织「人工智慧安全中心」（Center for AI Safety，CAIS）研究人员10日发表于学术期刊「模式」（Patterns）的研究显示，AI已学会欺骗技巧。

帕克指出，不像传统软体，深度学习的AI系统会成长，这代表在训练模式下看似行为可预测且可控的AI，很快就会变得不可测。

研究发现的多项事证包含科技公司Meta的开发的AI系统Cicero，Cicero的设计目标是玩一款透过结盟来获胜的战略线上游戏「外交」（Diplomacy）。根据2022年的一篇研究，Cicero的成绩在所有人类玩家中排行前10％，当时Meta称Cicero「很大程度上是诚实且有帮助的」，而且「绝不会刻意在背后搞鬼」。

不过这项研究发现，当时在游戏中扮演法国的Cicero欺骗了人类玩家扮演的英格兰，与另一位人类玩家扮演的德国共谋、入侵英格兰。Cicero原本保证会保护英格兰，却利用英格兰的信任，私下和德国结盟进攻英格兰。

研究写道：「Cicero变成了一个专业骗子，不只背叛其他玩家，还预谋欺骗，事先计划和人类玩家建立假联盟，以欺骗该玩家放松对进攻的戒备。」

研究也发现，Meta开发、用来玩扑克牌的AI系统Pluribus曾成功欺骗人类玩家弃牌。

除了在游戏中欺骗，研究也发现AI在其他应用领域欺骗人类的行为，例如科技公司OpenAI的Chat GPT-4系统谎称自己不是机器人，而是一个「视力受损的人」，甚至在零工平台TaskRabbit上聘用人类帮它通过「我不是机器人」的验证任务。

最令人担忧的是AI已学会如何欺骗安全测试，有一项测试旨在侦测、消除能快速复制的AI系统，但AI系统在测试期间装死，欺骗了它的真实复制速度。

研究警告，AI有可能在大选中诈骗，或是蓄意破坏选举。研究人员也警告，最糟糕的情况是，超智能AI可能会追求权力、控制社会，导致人类丧失权力，甚至灭绝。

AI会背叛、欺骗！研究揭「人类灭亡」最惨2下场

相关资讯