AI会背叛、欺骗!研究揭「人类灭亡」最惨2下场

最新美国研究发现,人工智慧(AI)系统已学会欺骗,若事态继续发展,未来人类恐遭夺权、甚至灭亡。(示意图/路透社)

专家长久以来警告人工智慧(AI)失控恐带来的威胁,一份美国研究显示,这种情况正在发生,研究指出,现行AI系统原本被设计为诚实,但如今已发展出欺骗行为,包括在电玩游戏里欺骗、背叛人类玩家,专家警告,若事态持续下去,未来最糟糕的情况是AI可能控制人类社会,甚至导致人类「灭绝」。

综合科学新闻网站「科学警报」(ScienceAlert)等报导,美国麻省理工学院(Massachusetts Institute of Technology)博士后研究员帕克(Peter Park),及加州非营利组织「人工智慧安全中心」(Center for AI Safety,CAIS)研究人员10日发表于学术期刊「模式」(Patterns)的研究显示,AI已学会欺骗技巧。

帕克指出,不像传统软体,深度学习的AI系统会成长,这代表在训练模式下看似行为可预测且可控的AI,很快就会变得不可测。

研究发现的多项事证包含科技公司Meta的开发的AI系统Cicero,Cicero的设计目标是玩一款透过结盟来获胜的战略线上游戏「外交」(Diplomacy)。根据2022年的一篇研究,Cicero的成绩在所有人类玩家中排行前10%,当时Meta称Cicero「很大程度上是诚实且有帮助的」,而且「绝不会刻意在背后搞鬼」。

不过这项研究发现,当时在游戏中扮演法国的Cicero欺骗了人类玩家扮演的英格兰,与另一位人类玩家扮演的德国共谋、入侵英格兰。Cicero原本保证会保护英格兰,却利用英格兰的信任,私下和德国结盟进攻英格兰。

研究写道:「Cicero变成了一个专业骗子,不只背叛其他玩家,还预谋欺骗,事先计划和人类玩家建立假联盟,以欺骗该玩家放松对进攻的戒备。」

研究也发现,Meta开发、用来玩扑克牌的AI系统Pluribus曾成功欺骗人类玩家弃牌。

除了在游戏中欺骗,研究也发现AI在其他应用领域欺骗人类的行为,例如科技公司OpenAI的Chat GPT-4系统谎称自己不是机器人,而是一个「视力受损的人」,甚至在零工平台TaskRabbit上聘用人类帮它通过「我不是机器人」的验证任务。

最令人担忧的是AI已学会如何欺骗安全测试,有一项测试旨在侦测、消除能快速复制的AI系统,但AI系统在测试期间装死,欺骗了它的真实复制速度。

研究警告,AI有可能在大选中诈骗,或是蓄意破坏选举。研究人员也警告,最糟糕的情况是,超智能AI可能会追求权力、控制社会,导致人类丧失权力,甚至灭绝。