价格暴跌!GPT 出了个大招

昨天我看了下 OpenAI 举办的首届开发者大会,有一个感受,AI 的发展速度可能超出了我们对它的理解和认知。

说实话,看完正常发布会我是非常激动的,有点重新感受到 2011 年的那种憧憬。

Sam 作为 CEO 在会上宣布了基于 GPT-4 的重磅更新以及 ChatGPT 的最新能力。

更重要的是,使用价格暴跌!

我第一次在文章里给你们介绍 ChatGPT 是去年的 11 月份,到现在差不多正好一年的时间。

当时为了解决很多人无法上手使用的问题,我还特意写了一篇保姆级教程放在了这篇文章里:《》。

从去年的无人问津,到今年 3 月份的持续发酵,再到后来各大互联网大厂宣布战略跟进,这一年的变化和进展都非常大。

在可预见的未来,以 GPT 为技术进化方向的应用和产品化将成为一个巨大的潜在机会。

总的来说,这次 OpenAI 共放出了三个大招,分别是GPT-4 Turbo、新模态 API 服务、定制化 GPT。

先说第一个大招,GPT-4 Turbo。

名称里的这个 Turbo 用得很巧妙,熟悉汽车的读者知道,排量后面的 T 代表的就是 Turbo,也就是涡轮增压的意思,比如 2.0T。

显然,2.0T 是比 2.0 更强大的一种动力组合模式。

同理,GPT-4 Turbo 也是在 GPT-4 上的一个升级,不过我觉得叫 GPT-4T 更有那味儿。

相较于 GPT-4 来说,GPT-4 Turbo 支持 128k 的上下文,这个量相当于一本 300 页的书,而之前的 GPT-4 只支持 8k,提升 16 倍。

同时,输入价格暴跌三分之二,现在只有 0.01 美金;输出价格也降到了原来的一半,只有 0.03 美金。

目前,最新的知识库更新到了 2023 年 4 月,简单说就是更聪明了。

对于 GPT-3.5 也同样做出了升级,性能更强,价格更低,所包含的信息和知识库更新。

另外,还有一组数据我觉得也是值得关注的。

截至目前,ChatGPT 目前周活跃用户超过 1 亿,全球有 200 万开发者在使用他们的 API 在开发应用,且有 92% 的世界 500 强企业在使用他们的服务。

这种情况是我在之前的几轮技术周期里没有看到的,比如前几年的区块链、Web 3 以及元宇宙。

再说第二个大招,新模态 API 服务。

GPT-4 Turbo 具备图像输入的能力,而且可以根据图像进行分析,产出分析内容,还可以自动分析带图形图像的文档。

开发者可以调用 API 将 DALL·E 3 集成到产品内,实现根据需求的图像生成业务,每张图片的生成价格按 0.04 美元起,大概不到 3 毛钱人民币。

要知道,你全职雇一个设计师的成本可比这个 API 调用成本高多了。

除了图像能力的升级,OpenAI 还提供了文字转语音的 API 服务。

通过 TTS 模型实现自然语音文件生成,1000 个字符转换价格是 0.015 美元,大概 1 毛钱人民币。

如果你经常阅读我的文章,那应该会记得我之前推荐过一款叫 AirChat 的产品。

AirChat 能实现不同语言间的自动翻译和语音生成,而且几乎复制了我的语音语调,这种产品的应用空间非常大。

根据介绍,之后还会支持自动语音识别的模型 Whisper v3,那时候能力就会更强大了。

接着是第三个大招,定制化 GPT。

这个能力被 OpenAI 定义为 GPTs,在我看来十分强大。

同时,这也是我最期待的一项新能力,它支持用户创建一个定制版的 ChatGPT,适用于那些有说明、扩展知识和行动的场景。

比如,我在产品星球里回答了近 2600 个问题,这些问题基本涵盖了产品经理学习、工作、成长中的方方面面,而我的答案也基本做到了尽可能的覆盖。

但是,每次都会新的、类似的、重复性的问题产生,而我也需要反复回答,这并不是一个高效的解决方案。

如果我能基于 GPTs 生成一个属于我的定制化 GPT,比如就叫「TR-GPT」,那这个模型就可以成为另一个虚拟的我。

TR-GPT 可以通过学习这些问题和答案来具备自主回答能力,这样就能模仿我的思维方式和行为去完成目标。

这么一来,我的效率就大大提升了。

可能乍一听会觉得很复杂,可当我看过现场的演示视频后,或许人人都有属于自己 的 GPT 时代即将到来。

OpenAI 的 CEO Sam 通过直接和 ChatGPT 对话的方式生成了一个他想要的定制化的 GPTs,而且现场测试成功。

你只需要告诉 ChatGPT 你要提供一个什么能力,然后上传你的知识库文档,就可以快速构建一个 GPTs。

其实要理解 GPTs,就可以类比于移动互联网时代的 App。

我看后期 OpenAI 也打算推出 GPT 商店,就类似于苹果的 AppStore,这同样是个非常重要的信号。

当 AI 应用百花齐放的时候,各行各业又会迎来一个技术驱动的发展周期,互联网产品也会迎来重做一遍的机会。

说实话,看完这场发布会我还是挺激动的,不仅看到了很多新能力,也看到了很多新的可能性。

在如今这个不确定性增强的时代,在现在这个互联网被唱衰的当下,技术迭代正在给人带来希望。

我一直说,技术才是互联网发展的第一驱动力,只要技术迭代不停止,那互联网就不会陨落。过去的很多个周期,基本都证明了这一点。

很高兴看到这样的改变,也为这个行业的从业者增加了信心。

可以预见的是,国内的各大互联网大厂都会加大在这方面的基础设施建设和投入,而其他的中小厂和创业者也会迎来应用化的春天。

只不过,我们还需要一些时间。

在这段时间内,不焦虑、不迷茫、向前看、做准备,就是我们每一个想登上这艘大船的人最应该做的。

当新事物出现时,我们可以不认可、可以不理解、可以质疑反对。但是,我们不能忽视它。

未来,总是以一种我们认知外的形态出现的。

················· 唐韧出品 ·················

安可时刻

上次用 AirChat 这款产品时,它可以模仿我的声音进行多语言间的翻译转化和朗读。

昨天还体验了另一款名叫 HeyGen 的 AI 产品,它可以做到视频的多语言翻译和生成。比如,我录制一段中文视频,它可以翻译成一段我朗读的英文视频,包括语音语调和口型都十分真实。

如果想更及时更早获取关于 AI 产品的信息和动态,可以加入我们星球,我会第一时间在那里分享。