亚马逊云科技陈晓建:没有一个模型适用于所有场景

4月8日报道,近日,2024亚马逊云科技举办生成式AI沟通会,亚马逊云科技大中华区产品部总经理陈晓建等专家就生成式AI的相关问题与媒体深度交流。

陈晓建认为,尽管大模型非常重要,但仅靠大模型远远不够,企业需要一系列周边的能力来正确、合理、安全、高效地使用大模型,这就是亚马逊云科技一系列产品所提供的价值所在。

据介绍,亚马逊云科技在生成式AI领域提供三层技术栈,从最底层的高性能基础设施,到中间层提供最广泛的基础模型选择,这些模型来自多个提供商,客户可以在此基础上定制这些模型,同时保持他们自己的数据私有和安全,并与其他在亚马逊云科技上的工作负载无缝集成。最上层的是应用GenAI技术的开箱即用的云服务。

亚马逊云科技认为“没有一个模型可以适用于所有业务场景”,所以AmazonBedrock提供各种基础模型供客户选择:既有知名的开源模型,如StableDiffusion XL、Llama、Mistral7B和Mixtral8*7B,也有如AnthropicClaude 3、AI21labsJurassic、CohereCommand、AmazonTitan等非开源模型。

值得一提的是,亚马逊和Anthropic在生成式AI领域进行广泛的深度合作,Anthropic将亚马逊云科技作为首选云服务提供商,此前,亚马逊对Anthropic已完成40亿美元投资。

具体来讲,Anthropic在AmazonBedrock上提供的Claude3系列模型是全球最领先的大模型之一,共包含三个模型:具有几乎即时响应能力且最紧凑的Claude3 Haiku;在技能与速度之间达到理想平衡的Claude3 Sonnet;以及为处理高度复杂任务设计的最智能模型Claude3 Opus。

通过现场演示,我们了解到,Claude3现已具备多模态能力——Claude3可以接收基于图像的输入,能力与其他前沿模型大致相同,并且延迟低于其他多模态模型(尤其是Claude3 Haiku)。Claude3能够降低幻觉,提升回答准确率,比如,在处理挑战性开放问题(100QHard)上准确性明显提升,并且减少错误答案。

与此同时,Claude3系列模型均提供200K超长上下文准确召回,针对某些特殊场景,还会开放支持1Mtoken的上下文窗口。

在场景方面,Claude3系列模型在内容续写、代码辅助、电商商品描述撰写、长文本知识召回总结方面表现优秀。“大模型第一批真正受益的用户是什么呢?就是代码编写和程序员。程序员本身具备更容易理解大模型的能力,像AmazonCodeWishperer,在亚马逊内部得到了广泛的使用,更不用提外面海量的编程员的群体了。”陈晓建谈到。

他还介绍了AmazonBedrock如何把大模型的能力,比如Claude3的能力提供给用户,总结起来是4点,首先是知识库功能KnowledgeBases for Amazon Bedrock,为基础模型和Agent提供来自企业私人数据源的上下文信息,用于检索增强生成(RAG),以提供更相关、更准确和更个性化的响应。其二,是代理功能Agentsfor Amazon Bedrock,使生成式AI应用能够使用自然语言来执行多步骤的业务任务。其三,实现负责任AI的Guardrailsfor Amazon Bedrock,允许客户根据应用程序特定要求和负责任的AI策略来管理用户体验。最后,合规,AmazonBedrock是基于全面的数据保护和隐私保护构建的,传输中数据和静态数据都会被加密,数据不会与模型提供者共享,也不会用于改进基础模型。

在对话中,谈及应用创新,陈晓建表示,Midjourney是生成式AI的现象级应用,是文生图赛道最具竞争力的选手。2023年2月份,它就在Discord上拥有超千万的社区成员。在去年9月,Midjourney就成功实现年盈利2亿美元。这些成功的生成式AI初创企业在做生成式AI模型的时候,非常多的使用了云计算的相关资源,去帮助他们快速地把业务推向终端用户。这一点上,像亚马逊云科技这样的云计算提供商给这些初创企业提供了非常多的安全和弹性的资源,帮助他尽快将业务从烧钱阶段到找到自己的运营模式,快速找到自己的客户群。(定西)