GPT-3.5 Turbo开放微调功能,GPT-4也将支持

日前OpenAI方面宣布,GPT-3.5 Turbo已支持自定义微调,企业和开发者可以使用自己的数据,结合业务用例来构建专属的ChatGPT。对此该公司表示,“自GPT-3.5 Turbo发布以来,开发者和企业都要求能够定制模型,为用户创造独特且差异化的体验。此次更新将使得开发者能够定制更适合其用例的模型,并大规模运行这些定制模型”。

据OpenAI方面透露,经过早期测试表明,经过微调的GPT-3.5 Turbo可以在“某些狭窄任务”上达到或超过GPT-4的能力。同时该公司还表示,GPT-4的微调功能也将于今年秋季推出。

对此英伟达高级科学家Jim Fan表示,这是自插件应用商店以来,OpenAI方面发布的最重大产品更新,“我期待着来自各行各业的新应用接二连三地出现”。

据悉,通过微调功能,企业和开发者可以显著提升GPT-3.5 Turbo的性能,包括提高模型可控性、从而使其能够精确地遵循指令,例如开发者可以要求其始终以给定的语言进行响应。或是提高模型一致地格式化响应的能力,开发者可以通过微调更可靠地将用户提示转换为高质量的JSON代码片段,以供自己的系统使用。以及磨练模型输出的“感觉”,例如它的语气,以便更好的与品牌形象相符。

此外,微调后的GPT-3.5 Turbo还可以在缩短提示的同时确保性能不会大幅改变,以加快API调用、并降低成本。据OpenAI方面透露,“早期测试人员通过对模型本身的指令进行微调,将提示词大小减少了90%”。

目前微调通常分为四步完成,分别为准备数据、上传文件、创建一个微调任务,以及使用一个微调模型。但需要注意的是,为了在微调过程中确保安全性,OpenAI方面强调,所有微调数据都必须通过“审核”API和GPT-4支持的审核系统,以查看是否与其安全标准相冲突。同时OpenAI方面也表示,微调API的传入和传出数据完全归客户所有,他自己或任何其他机构都不能使用这些数据来训练其他模型。

而在价格方面,微调费用主要分为初始训练费用和使用费用,其中初始训练费用标准为0.008 美元/1K Tokens,使用输入费用标准为0.012美元/1K Tokens,使用输出费用标准则为0.016美元/1K Tokens。举例而言,如要对10万Tokens的训练文件进行微调、并训练3个epochs,则预计成本为2.40美元。

【本文图片来自网络】