Anthropic 新推 Claude 或将掌控您的电脑?

要是因为某些原因,您想把个人电脑的完全控制权交给人工智能模型,那现在通过 Anthropic 就能做到。

周二,这家得到亚马逊支持的 OpenAI 竞争对手发布了它的 Claude 3.5 Sonnet 模型的新版本。这个模型能在您的桌面上完成一系列基础任务,像输入按键和鼠标点击之类的,这样它就能使用您安装的任何可能的应用程序了。

Anthropic 的首席科学官贾里德·卡普兰(Jared Kaplan)跟《连线》(Wired)说:“我觉得咱们要进入一个新时代啦,在这个时代,模型能用上您个人用的所有工具来完成任务。”

这次更新是 Anthropic 在行业竞赛里的动作,目的是把商业人工智能模型从聊天框的限制里解脱出来,让它变成成熟的“人工智能代理”。

“AI 代理”是一个有点模糊的术语,用于描述旨在使用软件并像人类一样执行其他计算机任务的以生产力为导向的 AI 模型,其通用性程度各不相同。

有些,比如认知 AI 的德文(Devin),是专门为编程设计的。Anthropic 则把它的 AI 代理当作全能型产品来营销,声称它可以浏览网页并使用任何网站或应用程序。您用它做什么取决于您:它们可以是技术任务,如编程,也可以是更简单的任务,如旅行计划。

例如,在《连线》描述的一个演示中,克劳德被要求与朋友计划一次在日出时参观金门大桥的旅行。AI 打开网络浏览器,在谷歌上查找一个好的观赏点以及其他细节,并将旅行添加到日历应用程序中。令人印象深刻,但《连线》指出,它没有涵盖其他有用的细节,比如到底怎么实际到达那里。

在另一个演示中,Claude 收到建立一个简单网站的提示,它借助微软的 Visual Studio Code 完成了这一任务。它甚至打开了一个本地服务器来测试刚刚创建的网站。在创建过程中出现了一个小错误,不过在得到提示后,人工智能纠正了代码。

不管这项技术看上去前景多么好,人工智能模型在可靠性方面依旧存在难题,特别是在编写代码方面——Anthropic 的也不例外。

甚至在一个涉及预订航班和修改预订的简单测试中,据 《TechCrunch》 的报道,Claude 3.5 Sonnet 成功完成的这类任务还不到一半。

尽管它们可能很笨拙,但这类人工智能代理也带来了明显的安全风险。您会希望这种实验性的、有时不可预测的技术在您的计算机文件里到处探查并使用您的网络浏览器吗?

Anthropic 表示,像这样发布它们将有助于人工智能代理更安全——不过,也许是让您付出代价。

据TechCrunch报道,Anthropic 在一份声明中写道:“我们认为,让当今更有限、相对更安全的模型访问计算机要好得多。这意味着我们可以开始观察和从这个较低级别出现的任何潜在问题中学习,逐步并同时建立计算机使用和安全方面的缓解措施。”