ChatGPT界面大更新,开始卷应用了?这次想灭谁?

作者 | Jessica邮箱 | JessicaZhang@pingwest.com

就在OpenAI宣布获得史上最大规模66亿美元融资的第二天,又推出了自ChatGPT问世两年来的首次重大界面更新“canvas(画布)”。

canvas是一个全新设计的交互界面,专为写作和编程任务设计。不再局限于传统的聊天模式,而是通过在标准对话框旁开启的独立窗口,提供一个用户与ChatGPT的深度协作空间,共同创建和优化项目。

它基于特别训练的GPT-4o构建,用户可以直接在这里编辑文本或代码。选定任何需要修改的部分,ChatGPT就会基于上下文环境给出精准的优化建议。系统还提供了包含调整文本长度、更改阅读水平、代码审查修复、添加等在内的快捷菜单。此外,通过 “返回”按钮,用户可以轻松恢复之前的工作版本。

打开canvas很简单:在模型选择器中选择“GPT-4o with canvas”,只需输入“使用canvas…”或“启动canvas…”之类的提示,新窗口就会弹出。当ChatGPT检测到可能有帮助的场景时,无需用户调用,canvas也会自动打开。

具体来看看它的各项功能。

1

canvas辅助写作

canvas可以根据指令为你生成一个项目初稿,供你与AI一起编辑,也可以对现有草稿进行优化。适合长文章、报告、策划案或电子邮件等内容撰写。

内置5项实用的写作快捷功能:

建议编辑:由ChatGPT提供行内建议和反馈。

调整长度:将文档长度扩充或精简。

更改阅读水平:调整阅读水平,范围涵盖从幼儿园、中学、大学到研究生。

最终润色:全面检查语法、清晰度和一致性。

添加emoji:添加相关表情符号以增强趣味色彩。

例如以下视频中,用户先上传笔记至canvas生成博客内容,再为第一段添加举例让表述更丰富和润色题目,最后调至“大学阅读水平”。不到一分钟,粗略零散的笔记就变成了一篇完整的结构化博客文章。

硅星人也浅试了一下,在canvas里让GPT写一篇介绍OpenAI本周新闻的文章,然后翻译为中文。可以看到中文稿直接覆盖原英文生成,而不是以问答形式另起对话。

进一步用“建议编辑”补充内容后,分别生成“Graduate School”和“Kindergarten”版本来对比看看差异。

除了AI智能改进之外,还能直接在原文调整字体加粗、斜体、字号等格式。

简单来说,canvas拓展了一种与ChatGPT的全新交互方式。集成多种工具,让用户在聊天和文档编辑之间无缝转换,轻松将对话中的想法变为成熟的最终版本。在一个平台完成全套写作过程,有效避免了工作流的中断。

1

用canvas编程

与写作类似,编程也是一个需要反复迭代的过程,且对逻辑的严密性有更高的要求。为了帮助开发者更高效完成代码编写和调试,canvas 也配备了一些相关的便捷功能,包括:

代码审查:ChatGPT提供编建议,供用户批准或拒绝,帮助优化代码质量。

添加logs:插入print日志输出,帮助开发者跟踪程序运行情况,方便调试。

添加comments:为代码添加注释,便于理解代码。

修复错误:自动检测并修复代码中的问题,减少调试时间。

代码移植:将现有代码转换为不同编程语言,如JavaScript、Python、Java等,便于跨语言开发。

下面的demo展示了在canvas界面生成Rust语言的API Web服务器,并进行代码优化和全局审查的过程。

1

使用o1-preview输出的合成数据特别训练

OpenAI对canvas集成的GPT-4o进行了专门训练,使其能够在创作过程中担任更积极的协作者角色,并且具备更好的上下文感知能力。

为此,研究团队开发了“在写作和编程任务中自动触发画布、生成多样化内容类型、执行有针对性的编辑、重写文档、提供内嵌批注与建议”等核心功能。

训练方法上,应用了他们一直强调的合成数据生成技术,从o1-preview模型中提取输出,帮助GPT-4o针对目标功能进行后期训练。这一方法使ChatGPT能够快速提升写作质量,并适应新的用户交互模式,无需依赖人工生成的数据。

(如果担心自己上传的内容被OpenAI用于模型训练,记得到用户设置里关闭“数据共享”选项。)

1

canvas集成模型评估

为了评估模型表现,OpenAI进行了超过20项内部自动化测试。

其中一个关键挑战是定义何时触发canvas功能。研究团队教会模型在处理复杂写作任务时正确触发画布,比如“撰写博客文章”,而避免在类似“帮我做一道晚餐食谱”这样的简单问答中过度触发。经过优化后,GPT-4o在写作任务中的正确触发率达到83%,编程任务的正确率更高,达到了94%。

第二个挑战是模型在canvas被触发后的编辑行为。比如在用户明确选择特定文本时进行有针对性的编辑(targeted edit),其他情况下则倾向于重写(rewriting)。结果显示,特别训练后的GPT-4o在针对性编辑上的准确率比基线模型提高了18%。

此外,团队还通过人工评估验证了模型生成高质量评论的能力。相比零样本提示的GPT-4o,canvas集成的模型在评论准确性上提升30%,在评论质量上提升16%。

1

OpenAI开始卷应用

可用性方面,canvas测试版已对Plus和Team用户开放,下周起扩展至教育及企业用户,最终会让所有用户都能免费访问。

OpenAI表示,canvas目前仍处于早期阶段,但他们计划迅速提升其功能。对于那些需要频繁编辑和修改的复杂任务,让canvas成为传统聊天界面的有力补充,实现“更自然”的人机协作愿景。

Canvas并不算OpenAI掀起的全新交互模式,也离最理想的AI与人类交互形态还很远。而且,在canvas身上,用户能看到很多OpenAI对手已经做出来的产品形态的影子。它就像Anthropic的Artifacts工具及AI代码编辑器Cursor等明星应用产品功能的大杂烩,然后在这些基础上做了一些细节的升级。

很明显,卷应用是OpenAI新的发力方向。此前OpenAI其实在应用的交互体验和细节设计上都有些迟缓,这家公司在GPT模型依然能保持领先的阶段,并没有体现出对产品的重视。现在模型能力的格局已经完全不同,不仅差距缩小,而且当前多家大模型和消费级AI提供商都将可编辑工作空间作为生成式AI的最新突破点。

除了上面提到的几款应用,此前谷歌不仅将Gemini集成到Docs,它的NotebookLM近期创新的AI播客功能也大受好评,现在OpenAI也加入了进来。

随着大量资金仍在流向硅谷的AI公司,消费者在未来一年内可以期待更多基于现有工具的结构性实验新品推出。只不过这个过程里,OpenAI变得更像一个追随者,而非引领者了。