OpenAI推五级评估系统!评估AI能力达到什么水平

7月12日消息,OpenAI设计了一个五级评估系统,用于追踪人工智能软件在超越人类能力上的开发进展。这反映了该公司最新的尝试,旨在增进公众对AI安全性和未来的理解。

一位发言人透露,OpenAI在周二的全员会议中向员工介绍了这一新的分类系统。OpenAI还计划将这些信息分享给投资者及公司外部的其他人士。目前OpenAI被广泛认为是构建更强大人工智能系统的领军者之一。

OpenAI的系统划分了五个等级,按一到五的数字由低到高排列等级。具体来说,这五个等级分别是:

最低一级:聊天机器人(Chatbots),能够使用自然语言进行对话的人工智能

二级:推理者(Reasoners),可以解决人类级别问题的人工智能

三级:智能主体(Agents),能够代表用户采取行动的人工智能

四级:创新者(Innovators),能助力发明创新的人工智能

最高五级:组织(Organizations),能够执行复杂组织任务的人工智能

OpenAI的高管向员工透露,公司目前认为自己处在第一级,但正处于即将进入第二级“推理者”阶段的边缘。这一级别的系统能像一个博士一样,在没有任何工具的情况下执行基本问题解决任务。

在同一次会议上,公司领导展示了一个涉及其GPT-4人工智能模型的研究项目,据一位不愿透露身份的知情人士称,OpenAI认为该模型展现了一些类似人类的推理新技能。对于这次演示,发言人表示OpenAI始终在内部测试新功能,这在业界是常见的做法。

多年来,OpenAI一直致力于构建所谓的通用人工智能(AGI)——从理论上讲,这种计算机系统在大多数任务上的表现能超过人类。然而,这样的系统目前还不存在。OpenAI首席执行官萨姆·奥特曼(Sam Altman)曾预测,AGI可能在未来十年内实现。

关于如何确定达到AGI的标准,AI研究者们一直在进行讨论和探索。在2023年11月的一篇论文中,谷歌DeepMind的几位研究员提出了一个包括五个级别的AI框架,其中包括像“专家”和“超人”等级别。这个排名系统与汽车行业用来评估自动驾驶汽车自动化程度的系统类似。

据了解,OpenAI五级评估系统由公司高层领导制定,目前仍在不断完善中。公司将从包括员工、投资者及其董事会在内的多方面收集反馈,并可能随时间调整这些级别。(小小)