☰

价格暴跌！GPT 出了个大招

昨天我看了下 OpenAI 举办的首届开发者大会，有一个感受，AI 的发展速度可能超出了我们对它的理解和认知。

说实话，看完正常发布会我是非常激动的，有点重新感受到 2011 年的那种憧憬。

Sam 作为 CEO 在会上宣布了基于 GPT-4 的重磅更新以及 ChatGPT 的最新能力。

更重要的是，使用价格暴跌！

我第一次在文章里给你们介绍 ChatGPT 是去年的 11 月份，到现在差不多正好一年的时间。

当时为了解决很多人无法上手使用的问题，我还特意写了一篇保姆级教程放在了这篇文章里：《》。

从去年的无人问津，到今年 3 月份的持续发酵，再到后来各大互联网大厂宣布战略跟进，这一年的变化和进展都非常大。

在可预见的未来，以 GPT 为技术进化方向的应用和产品化将成为一个巨大的潜在机会。

总的来说，这次 OpenAI 共放出了三个大招，分别是GPT-4 Turbo、新模态 API 服务、定制化 GPT。

先说第一个大招，GPT-4 Turbo。

名称里的这个 Turbo 用得很巧妙，熟悉汽车的读者知道，排量后面的 T 代表的就是 Turbo，也就是涡轮增压的意思，比如 2.0T。

显然，2.0T 是比 2.0 更强大的一种动力组合模式。

同理，GPT-4 Turbo 也是在 GPT-4 上的一个升级，不过我觉得叫 GPT-4T 更有那味儿。

相较于 GPT-4 来说，GPT-4 Turbo 支持 128k 的上下文，这个量相当于一本 300 页的书，而之前的 GPT-4 只支持 8k，提升 16 倍。

同时，输入价格暴跌三分之二，现在只有 0.01 美金；输出价格也降到了原来的一半，只有 0.03 美金。

目前，最新的知识库更新到了 2023 年 4 月，简单说就是更聪明了。

对于 GPT-3.5 也同样做出了升级，性能更强，价格更低，所包含的信息和知识库更新。

另外，还有一组数据我觉得也是值得关注的。

截至目前，ChatGPT 目前周活跃用户超过 1 亿，全球有 200 万开发者在使用他们的 API 在开发应用，且有 92% 的世界 500 强企业在使用他们的服务。

这种情况是我在之前的几轮技术周期里没有看到的，比如前几年的区块链、Web 3 以及元宇宙。

再说第二个大招，新模态 API 服务。

GPT-4 Turbo 具备图像输入的能力，而且可以根据图像进行分析，产出分析内容，还可以自动分析带图形图像的文档。

开发者可以调用 API 将 DALL·E 3 集成到产品内，实现根据需求的图像生成业务，每张图片的生成价格按 0.04 美元起，大概不到 3 毛钱人民币。

要知道，你全职雇一个设计师的成本可比这个 API 调用成本高多了。

除了图像能力的升级，OpenAI 还提供了文字转语音的 API 服务。

通过 TTS 模型实现自然语音文件生成，1000 个字符转换价格是 0.015 美元，大概 1 毛钱人民币。

如果你经常阅读我的文章，那应该会记得我之前推荐过一款叫 AirChat 的产品。

AirChat 能实现不同语言间的自动翻译和语音生成，而且几乎复制了我的语音语调，这种产品的应用空间非常大。

根据介绍，之后还会支持自动语音识别的模型 Whisper v3，那时候能力就会更强大了。

接着是第三个大招，定制化 GPT。

这个能力被 OpenAI 定义为 GPTs，在我看来十分强大。

同时，这也是我最期待的一项新能力，它支持用户创建一个定制版的 ChatGPT，适用于那些有说明、扩展知识和行动的场景。

比如，我在产品星球里回答了近 2600 个问题，这些问题基本涵盖了产品经理学习、工作、成长中的方方面面，而我的答案也基本做到了尽可能的覆盖。

但是，每次都会新的、类似的、重复性的问题产生，而我也需要反复回答，这并不是一个高效的解决方案。

如果我能基于 GPTs 生成一个属于我的定制化 GPT，比如就叫「TR-GPT」，那这个模型就可以成为另一个虚拟的我。

TR-GPT 可以通过学习这些问题和答案来具备自主回答能力，这样就能模仿我的思维方式和行为去完成目标。

这么一来，我的效率就大大提升了。

可能乍一听会觉得很复杂，可当我看过现场的演示视频后，或许人人都有属于自己的 GPT 时代即将到来。

OpenAI 的 CEO Sam 通过直接和 ChatGPT 对话的方式生成了一个他想要的定制化的 GPTs，而且现场测试成功。

你只需要告诉 ChatGPT 你要提供一个什么能力，然后上传你的知识库文档，就可以快速构建一个 GPTs。

其实要理解 GPTs，就可以类比于移动互联网时代的 App。

我看后期 OpenAI 也打算推出 GPT 商店，就类似于苹果的 AppStore，这同样是个非常重要的信号。

当 AI 应用百花齐放的时候，各行各业又会迎来一个技术驱动的发展周期，互联网产品也会迎来重做一遍的机会。

说实话，看完这场发布会我还是挺激动的，不仅看到了很多新能力，也看到了很多新的可能性。

在如今这个不确定性增强的时代，在现在这个互联网被唱衰的当下，技术迭代正在给人带来希望。

我一直说，技术才是互联网发展的第一驱动力，只要技术迭代不停止，那互联网就不会陨落。过去的很多个周期，基本都证明了这一点。

很高兴看到这样的改变，也为这个行业的从业者增加了信心。

可以预见的是，国内的各大互联网大厂都会加大在这方面的基础设施建设和投入，而其他的中小厂和创业者也会迎来应用化的春天。

只不过，我们还需要一些时间。

在这段时间内，不焦虑、不迷茫、向前看、做准备，就是我们每一个想登上这艘大船的人最应该做的。

当新事物出现时，我们可以不认可、可以不理解、可以质疑反对。但是，我们不能忽视它。

未来，总是以一种我们认知外的形态出现的。

················· 唐韧出品 ·················

安可时刻

上次用 AirChat 这款产品时，它可以模仿我的声音进行多语言间的翻译转化和朗读。

昨天还体验了另一款名叫 HeyGen 的 AI 产品，它可以做到视频的多语言翻译和生成。比如，我录制一段中文视频，它可以翻译成一段我朗读的英文视频，包括语音语调和口型都十分真实。

如果想更及时更早获取关于 AI 产品的信息和动态，可以加入我们星球，我会第一时间在那里分享。

价格暴跌！GPT 出了个大招

相关资讯