本周人工智能领域:代理服务震撼登场

代理来了——说的就是人工智能代理。

本周,Anthropic 发布了其最新的人工智能模型,这是 Claude 3.5 Sonnet 的升级版,可以通过点击和输入与网络和桌面应用程序进行交互——非常像一个人。它并不完美。但正如 Anthropic 所称,带有“计算机使用”功能的 3.5 Sonnet 可能会给工作场所带来变革。

至少,这是宣传的重点。

Anthropic 的新模型是否名符其实,还有待观察。但其到来表明了 Anthropic 在新兴的人工智能代理市场的雄心壮志,一些分析师认为,到 2030 年,该市场价值可能接近 500 亿美元。

Anthropic 并不是唯一一家投入资源开发人工智能代理的公司,广义上讲,人工智能代理可以自动完成以前必须手动执行的任务。微软正在测试可以使用 Windows PC 预约等的代理,而亚马逊正在探索可以主动购买的代理。

组织在生成式人工智能方面可能犹豫不决。但到目前为止,他们对代理相当乐观。本月《麻省理工科技评论洞察》的一份报告发现,49%的高管认为代理和其他形式的高级人工智能助手将带来效率提升或成本节约。

对于 Anthropic 及其竞争对手构建“智能代理”技术来说,这无疑是个好消息。

人工智能的构建或者运行,成本都不低。

比如说,据说 Anthropic 正在筹募数十亿美元的风险投资,而 OpenAI 近期完成了一轮 65 亿美元的融资。

但我想知道如今大多数智能代理是否真能达到被炒作的那种效果。

在一项旨在测试人工智能代理协助航空公司订票任务能力的评估当中,新的 3.5 Sonnet 成功完成的任务还不到一半。

在另一项涉及产品退货等任务的单独测试里,3.5 Sonnet 大约有三分之一的次数失败。

再次强调,新的 3.5 Sonnet 并不完美,Anthropic 对此也欣然承认。

但很难想象一家公司能长期容忍这么高的失败率,从某种程度上讲,雇一个秘书反倒更容易。

不过,企业还是表现出愿意尝试人工智能代理的意愿,哪怕只是为了跟上潮流。

根据创业加速器 Forum Ventures 的一项调查,48%的企业开始部署人工智能代理,另外还有三分之一的企业正在“积极探索”智能代理解决方案。

一旦这些早期采用者让智能代理运行上一段时间,我们就能瞧瞧他们的感受了。

有关数据抓取的抗议:包括演员凯文·贝肯、小说家石黑一雄和音乐家罗伯特·史密斯在内的数千名创意人士签署了一份请愿书,反对未经授权将创意作品用于人工智能培训。

Meta 测试面部识别技术:Meta 表示,它正在扩大面部识别测试,将其作为一项反欺诈措施,以打击名人诈骗广告。

Perplexity 遭起诉:新闻集团旗下的道琼斯和《纽约邮报》已起诉不断发展的人工智能初创公司 Perplexity,据报道该公司正在寻求融资,原因是出版商称其为“内容盗窃统治”。

OpenAI 的新聘人员: OpenAI 聘请了其首位首席经济学家,即前美国商务部首席经济学家亚伦·查特吉,以及新的首席合规官斯科特·斯考尔斯,他之前是优步的合规负责人。

ChatGPT 登录 Windows 系统:在其他 OpenAI 新闻中,OpenAI 已开始 为某些客户群体预览 ChatGPT的专用 Windows 应用程序,ChatGPT 是其人工智能驱动的聊天机器人平台。

xAI 的应用程序编程接口(API):埃隆·马斯克的人工智能公司 xAI 已为 Grok 推出了一个 API,Grok 是为 X 上的多项功能提供支持的生成式人工智能模型。

米拉·穆拉蒂的新动态:据报道,前 OpenAI 首席技术官米拉·穆拉蒂正在为一家新的人工智能初创公司筹集资金。据说该企业将专注于基于专有模型构建人工智能产品。

世界各地的军队对于在作战区域部署人工智能,或者已经在部署的情况,表现出极大的兴趣。毫无疑问,这是有争议的事情,而且根据非营利组织 AI Now 研究所的一项新研究,这也是一种国家安全风险。

该研究发现,如今部署于军事情报、监视和侦察方面的人工智能已构成危险,原因是其依赖个人数据,而这些数据可能被对手窃取并武器化。共同作者写道,它还存在一些目前无法解决的漏洞,例如偏差和产生幻觉的倾向。

该研究并非反对军事化的人工智能。但它指出,确保军事人工智能系统的安全并限制其危害将需要创建与商业模型分离和隔离的人工智能。

本周在生成式人工智能视频方面是非常忙碌的一周。不少于三家初创公司发布了新的视频模型,每个都有自己独特的优势:Haiper 的Haiper 2.0、Genmo 的Mochi 1和 Rhymes AI 的Allegro。

但真正吸引我注意的是 Runway 推出的一款新工具,叫Act-One。Act-One 生成“富有表现力”的角色表演,使用视频和语音记录作为输入来创建动画。一名人类演员在镜头前表演,Act-One 将其转化为人工智能生成的角色,并保留演员的面部表情。

确实,Act-One 本身算不上一个模型,它更像是用于引导 Runway 的Gen-3 Alpha视频模型的一种控制手段。

人工智能初创公司Suno因涉嫌未经许可在受版权保护的歌曲上训练其音乐生成工具而被唱片公司起诉,它不希望再有法律上的麻烦。

至少,这是我从 Suno 最近宣布的与内容 ID 公司 Audible Magic 的合作中得到的印象,一些读者可能从YouTube 的早期就认识这家公司。Suno 表示,它将使用 Audible Magic 的技术来防止其 Covers 功能上传受版权保护的音乐,该功能允许用户创作任何歌曲或声音的混音。

Suno 已经跟唱片公司的律师讲了,它觉得用于训练其人工智能的歌曲属于美国的合理使用原则。