综述|小企业大模型——法国人工智能初创公司的“开源”之道

新华社北京9月8日电 综述|小企业大模型——法国人工智能初创公司的“开源”之道

新华社记者崔可欣

如果说2023年的人工智能(AI)叙事始于ChatGPT引爆网络,那么2024年法国科技初创企业米斯特拉尔人工智能公司(Mistral AI)则以不俗表现引人注目。

米斯特拉尔人工智能公司2023年4月诞生于巴黎,创始人是三名曾在硅谷工作的“90后”。首席执行官兼创始人阿瑟·门施曾是谷歌旗下“深层思维”公司的研究员,主要研究语言模型。另两名创始人——纪尧姆·朗普勒和蒂莫泰·拉克鲁瓦此前任职于脸书母公司“元”的AI团队。三人曾是大学同窗。

米斯特拉尔人工智能公司主要开发基于自然语言处理、机器视觉和深度学习的生成式AI技术。成立仅一年多,60人左右的团队已推出数款AI语言模型。目前,该公司正在加速发展自然语言处理技术,尤其关注多语种能力,以反映欧洲语言的多样性。据英国《金融时报》6月报道,该公司在新一轮融资中获得6亿欧元投资,公司估值接近60亿欧元。法国总统马克龙曾多次公开表达对米斯特拉尔人工智能公司的赞许和支持,相信它有潜力成为欧洲AI领域的领军者。

米斯特拉尔人工智能公司自成立以来始终坚持开源策略,目标是创建与竞品性能相匹敌的AI模型,但以更低成本提供给客户,同时以更开放的姿态实现技术共享。目前,该公司已推出的模型有Mistral 7B、Mistral 8x7B,以及性能接近GPT-4、成本却低很多的Mistral Large等。

在大语言模型领域,选择开源还是闭源一直都是颇具争议的话题。开源软件是指源代码在公共领域供所有人使用、修改和分发,任何人都可以审核和验证模型的安全性;而闭源模型则主要由一些大型科技公司开发和维护,拥有充足的资金和专业团队,能够提供高质量稳定的服务,同时在数据隐私控制方面更为严格。

门施认为,开源模式不仅可以加速科技发展,也更有利于这项技术的广泛应用和安全使用。“这(开源模式)就好比一种基础设施可以转化为任何类型的应用。我相信用户需要创造差异化,也需要深入掌握这项技术。而想要做到这一点,唯一途径就是拥有完全透明的访问权限。”

然而,在参与全球大语言模型领域商业竞争的压力下,米斯特拉尔人工智能公司能否将开源进行到底,遭到业界质疑。开发者们发现,该公司最新推出的Mistral Large 2并不是传统意义上的开源模型,商用应用仍需付费。

为回应质疑,门施今年3月接受法国《世界报》采访时表示,团队将继续“双管齐下”,一方面坚持开源策略,另一方面通过商业行为来资助高成本的研发投入和人才招募。

他今年5月接受美国《时代》周刊访谈时也提到,团队会始终坚持在开源领域保持领先的模型,同时提供一些付费服务,“我们的初衷未曾改变”。(完)