微调 GPT-4o AI 模型新维度,OpenAI 开放图片视觉微调功能
IT之家 10 月 2 日消息,OpenAI 公司昨日(10 月 1 日)发布博文,宣布为 GPT-4o 模型引入视觉微调(vision fine-tuning)功能,除了文本之外还支持微调图像。
OpenAI 表示自开放微调 GPT-4o 以来,数十万开发者使用数据集(仅文本)微调了该模型,从而提高了驾驭某些特定任务的能力。
OpenAI 在博文中展示了一些合作伙伴的微调案例:
Garb :通过视觉微调,提升了交通标志定位准确性 20% 和限速标志定位 13%。
Automat:成功率从 16.60% 提升至 61.67%,并在信息提取任务中 F1 分数提升 7%。
Coframe:通过微调提升了网站生成的一致性和布局正确性 26%。
OpenAI 宣布项所有付费用户开放视觉微调功能。
在 2024 年 10 月 31 日之前,每天免费提供 100 万训练 token,用于针对 GPT-4o 模型进行图片微调。
2024 年 10 月 31 日之后,GPT-4o 微调训练收费,每 100 万训练 token收费25 美元(IT之家备注:当前约 176 元人民币)
推理每 100 万 token 输入收费 3.75 美元(当前约 26.3 元人民币)
推理每 100 万 token 输出收费 15 美元(当前约 105 元人民币)。