OpenAI 公司推出 MLE-bench 新基准
10 月 12 日讯,科技媒体 The Decoder 昨日(10 月 11 日)发布博文,报道称 OpenAI 公司推出 MLE-bench 新基准,旨在评估 AI 智能体在开发机器学习解决方案方面的能力。该基准包括 75 个 Kaggle 竞赛,旨在衡量自主 AI 系统在机器学习工程中的进展。这些竞赛涵盖了多个领域,包括自然语言处理、计算机视觉和信号处理等等。(IT之家)
相关资讯
- ▣ OpenAI 推出 SWE-bench Verified 基准,更准确评估代码生成表现
- ▣ OpenAI推出代码生成评估基准
- ▣ OpenAI和Meta准备推出具有“推理”能力的新AI模型
- ▣ 中国科技公司推出多款模型与OpenAI的Sora竞争
- OpenAI執行長創立的新創公司 推出新版本個人虹模式別資料裝置
- ▣ OpenAI對手 推出新模型
- ▣ 人工智能初创公司Writer推出新模型与OpenAI竞争 估值达19亿美元
- ▣ OpenAI不open!这些中国公司出手
- ▣ OpenAI推出ChatGPT全新界面canvas
- 籌資65億美元 OpenAI推動轉型營利公司
- ▣ AI初创公司Anthropic推出AI基金 加速技术革新大潮
- ▣ OpenAI将开源SimpleQA新基准,以衡量大模型真实性
- ▣ OpenAI前首席科学家llya成立新公司
- 6月基金公司调研忙 这些公司被瞄准!
- ▣ OpenAI推美人工智慧基建
- ▣ OpenAI:推出企业定制 GPT-4 新功能
- ▣ OpenAI宣布推出名为canvas的新界面
- ▣ 李开复AI大模型公司零一万物面向OpenAI用户推出迁移服务
- ▣ OpenAI创始人支持的加密货币初创公司将推出衍生品交易所
- 微軟宣布與法新創公司Mistral合作推動AI 雖然投資OpenAI被盯上
- ▣ 微软据悉准备推出新的人工智能语言模型,同谷歌和OpenAI竞争
- ▣ OpenAI 前首席科学家 Ilya 宣布成立新公司
- ▣ OpenAI计划推出GPT Store
- ▣ OpenAI 推出 meta-prompt 工具
- 习考察电池公司 陆拟推新能源基建
- ▣ 债基审批暂停?多家基金公司否认,有基金公司债基已被告知核准材料
- ▣ 全球科技早参 | 创业仅11周,OpenAI前首席科学家新公司估值超350亿元;OpenAI 基础设施计划曝光
- OpenAI推出新模型 輸入提示可達300頁
- ▣ 用GPT-4“自我纠错” OpenAI推出新模型CriticGPT