☰

斯坦福大模型评测榜：Claude 3第一

三言科技6月23日消息，日前，斯坦福大学基础模型研究中心发布大规模多任务语言理解能力评估排行榜，其中，综合排名前十的大语言模型中有两款来自中国厂商，分别是阿里巴巴的 Qwen2 Instruct（72B）和零一万物的 Yi Large（Preview）。

排名如下：

1、Claude 3 Opus（20240229）： Anthropic（美国，亚马逊投资）

2、GPT-4o（2024-05-13）：OpenAI（美国）

3、Gemini 1.5 Pro：谷歌（美国）

4、GPT-4（0613）：OpenAI（美国）

5、Qwen2 Instruct（72B）：阿里巴巴（中国）

6、GPT-4 Turbo（2024-04-09）：OpenAI（美国）

7、Gemini 1.5 Pro（0409 preview）：谷歌（美国）

8、GPT-4 Turbo（1106 preview）：OpenAI（美国）

9、Llama 3（70B）：Meta（美国）

10、Yi Large（Preview）：零一万物（中国）

相关资讯

▣ 斯坦福抄袭国产大模型始末
▣ OpenAI竞争对手Anthropic官宣Claude 3大模型
▣ Claude 3 Sonnet模型已登陆Amazon Bedrock
▣ 智源最新模型评测：百度文心大模型4.0登顶闭源榜
▣ 福布斯大学排行 UC Berkeley跌落榜首与斯坦福并列第2
▣ 智源最新模型评测：百度文心大模型4.0登顶闭源榜超GPT-4o等
▣ 斯坦福AI项目作者对抄袭中国大模型致歉承诺撤下相关模型
Anthropic公布可同時處理一本長篇小說內容的大型自然語言模型Claude 3
▣ 全球科技早参丨OpenAI竞争对手官宣Claude 3大模型
▣ Anthropic大模型测评首超GPT-4
▣ 承认、道歉、删除！斯坦福AI团队抄袭中国大模型
▣ Anthropic发布“GPT-4 对手”Claude 2大语言模型
▣ 斯坦福团队回应抄袭清华系大模型：是一种“不恰当的借鉴”，承诺撤下所有相关模型
▣ AI早知道｜Claude推类GPTs功能Projects；阿里巴巴Qwen-2成全球开源大模型榜首
▣ 超越GPT-4，斯坦福团队手机可跑的大模型火了，一夜下载量超2k
《封神榜3》评测报告
▣ 斯坦福AI项目套壳中国大模型被抓包，抄袭团队致歉并承诺撤下相关模型
▣ 小K播早报|OpenAI竞争对手Anthropic官宣Claude 3大模型纳斯达克中国金龙指数跌近4%
▣ 炸锅！斯坦福AI团队，被曝抄袭中国大模型！各方最新回应
▣ 国产大模型被抄袭事件告终斯坦福团队致歉并撤下模型面壁：知错能改，善莫大焉
▣ 斯坦福AI研究团队已正式道歉涉嫌抄袭大模型已被撤下
▣ OpenAI竞争对手Anthropic发布其AI模型Claude 3.5
▣ OpenAI的劲敌发了一款新模型，Claude 3.5 Sonnet多模态能力超过GPT-4o
▣ 全球140+大模型全方位评测结果出炉，智源评测体系发布
Anthropic釋出新款聊天機器人服務模型Claude 3.5 Sonnet 標榜性能超越OpenAI的GPT-4o
▣ 百川智能发布超千亿大模型Baichuan 3，中文评测超越GPT-4
▣ “OpenAI劲敌”与亚马逊强强联合! Claude大模型将接入Alexa
▣ 斯坦福放榜！反串『甄嬛』的西安男生成最大『黑马』
▣ 首个AI大模型高考全卷评测结果发布

DMCA | PRIVACY | s@bg3.co