☰

微调 GPT-4o AI 模型新维度，OpenAI 开放图片视觉微调功能

IT之家 10 月 2 日消息，OpenAI 公司昨日（10 月 1 日）发布博文，宣布为 GPT-4o 模型引入视觉微调（vision fine-tuning）功能，除了文本之外还支持微调图像。

OpenAI 表示自开放微调 GPT-4o 以来，数十万开发者使用数据集（仅文本）微调了该模型，从而提高了驾驭某些特定任务的能力。

OpenAI 在博文中展示了一些合作伙伴的微调案例：

Garb ：通过视觉微调，提升了交通标志定位准确性 20% 和限速标志定位 13%。

Automat：成功率从 16.60% 提升至 61.67%，并在信息提取任务中 F1 分数提升 7%。

Coframe：通过微调提升了网站生成的一致性和布局正确性 26%。

OpenAI 宣布项所有付费用户开放视觉微调功能。

在 2024 年 10 月 31 日之前，每天免费提供 100 万训练 token，用于针对 GPT-4o 模型进行图片微调。

2024 年 10 月 31 日之后，GPT-4o 微调训练收费，每 100 万训练 token收费25 美元（IT之家备注：当前约 176 元人民币）

推理每 100 万 token 输入收费 3.75 美元（当前约 26.3 元人民币）

推理每 100 万 token 输出收费 15 美元（当前约 105 元人民币）。

相关资讯