谷歌发布开源大模型,并非最前沿技术,称怕被滥用

2月22日消息,美国时间周三,谷歌宣布将开源其聊天机器人部分代码,这部分技术之前一直是保密的。

谷歌在一篇博客文章中宣布,将公开两种人工智能语言模型——Gemma2B和Gemma 7B,旨在帮助外部公司和独立软件开发者开发出与谷歌Bard相似的在线聊天机器人。尽管这两个模型并非谷歌最前沿的技术,但据该公司表示,它们有能力与行业内的许多顶尖系统竞争。

去年,Meta公开了其聊天机器人的核心代码,引起了一些竞争对手的担忧。他们担心Meta可能正向公众发布一些未被广泛了解,甚至可能具有风险的技术。然而现在,谷歌也正沿着相似的路径前进,这表明反对公开人工智能(AI)技术的公司正在遭受行业内部的压力。

与Meta的做法类似,谷歌也认为,公开所谓的大语言模型技术的好处远大于其潜在风险。

谷歌DeepMind的产品管理总监特里斯·沃肯丁(Tris Warkentin)在接受采访时表示:“我们希望重新吸引第三方开发者社区的注意,并确保基于谷歌模型的人工智能系统成为现代AI系统建设的行业标准。”

不过,谷歌同时强调,目前没有计划免费发布其旗舰人工智能模型Gemini,因为Gemini的效率更高,若被滥用,可能带来的负面影响也将更大。本月,谷歌开始对使用其最强大的Gemini模型的用户实施收费。通过将其作为在线服务提供,谷歌能够更严格地控制该技术的使用。

与此同时,由于担心人工智能技术可能被用于传播虚假信息、仇恨言论及其他有害内容,OpenAI等公司对其产品支持的技术和软件的保密性加强。而Meta与法国初创公司Mistral等认为,开源代码——即自由共享代码是更安全的做法,因为这允许外部人员发现技术问题并提供解决方案。

Meta的首席人工智能科学家杨立昆(YannLeCun)认为,消费者和政府可能会对少数几家公司(如谷歌、微软和Meta)控制的人工智能技术持反对态度。他质疑道:“你希望每个人工智能系统都被几家强大的美国公司所控制吗?”

过去,谷歌曾经开源了许多领先的人工智能技术,包括聊天机器人的基础技术。然而,在面对OpenAI的竞争压力时,谷歌对这些技术的构建方式采取了更加保密的态度。但是,谷歌负责开发者关系的副总裁珍妮·班克斯(Jeanine Banks)表示,鉴于开发者兴趣的激增,公司决定再次免费提供其人工智能技术。

在准备公开Gemma技术时,谷歌强调已努力确保这些技术的安全,并明确禁止使用它们来传播虚假信息和其他有害内容。沃肯丁说:“我们确保在专有和开放领域尽可能发布完全安全的技术。对于Gemma2B和Gemma 7B,我们采取了非常安全和负责任的方法,确保这些产品能在行业中占有一席之地。”

尽管谷歌采取了多项安全措施,但这些技术的滥用风险仍然存在。谷歌允许用户下载已训练好的系统,这些系统能够从互联网上收集大量的数字文本。研究人员将此过程称为“权重释放”,指的是系统在数据分析过程中学习到的特定数学值。通常,分析这些数据需要大量的专用计算机芯片和巨额资金支持,而这些资源对多数组织和个人来说是不可得的。(小小)