谷歌 NotebookLM 因音频功能走红背后

据一位产品经理称,此前鲜为人知的谷歌创建的人工智能研究和笔记工具在添加了音频功能后“真正走红”,该功能可以将笔记转换为类似播客的音频,其结果在网上疯传。

NotebookLM 于去年首次发布,是一款人工智能工具,能够帮助用户与自身的文档进行交互——允许他们上传一系列文件,并根据该内容获得摘要和解释。

但最近几周,该应用在添加了一项名为“音频概述”的功能后,开始受到更多主流公众的关注,该功能使用户能够为其上传的文件创建音频摘要,但采用的是对话式、类似播客的格式,包含一男一女两种声音。

使用该工具的各种结果在网上迅速传播,为该应用带来了新用户。

现在,谷歌实验室的产品经理拉伊扎·马丁(Raiza Martin)是领导构建 NotebookLM 的人员之一,她表示,用户渴望能对利用该工具所创建的音频概述类型拥有更多编辑控制权。

“这是一个非常激动人心的时刻,因为自从我们推出它以来,推特、Reddit 甚至我们的 Discord 里的每个人都在说‘我想要调节按钮’,特别是对于更多的声音,或者‘我想要改变长度’,”她告诉 PA 通讯社。

“每个人都想改变一切,我们肯定会解决这个问题。我们正在迅速推出一些功能,以使人们拥有更多控制权,但我们正在认真考虑首先推出哪些控制功能。”

NotebookLM 此后已推出更新,使用户能够调整他们希望在源笔记中特别涵盖的主题或领域。

马丁女士补充说:‘我老是被问到“这个工具是为谁准备的”或者“谁是你们的目标受众?”大多数时候,我都这么思考这个问题:这个人的职业是啥?他们怎样把它运用到日常生活里?’

而且我觉得我们特别特别幸运,因为去年我们把 Notebook 作为 Project Tailwind 推出的时候,我们只是推出了这个工具,没有任何这类假设,就是想弄清楚人们会怎么用它。

她说,这种没有特定目标受众的情况表明,该应用程序可能适用于任何“在电脑上工作”的人,特别是在音频摘要方面,开发该应用程序的团队已经听闻有人像收听播客那样收听音频概述来帮助自己消化笔记。

“特别是对于音频,我觉得我们的一个关键看法是,有很多工作需要你消化大量信息——而且不仅仅是工作——学习者、各个年龄段的学生、教育工作者……基本上,如果你在电脑上工作,这是你可能会觉得有用的东西,”她说。

“我从很多人那里听说,他们使用它的方式是先听音频,然后写下自己的问题,这让我想到了人与人、技术、信息、知识之间神奇的和谐之处,我认为我们只是处于这能带来什么的起点。”

NotebookLM 并未像为其提供支持的谷歌旗舰人工智能助手 Gemini 那样高调推出,但马丁女士表示,这款笔记工具新获得的名气意味着这个“谷歌真正的实验产品”正在拥有更严谨的产品路线图。

“关于我们如何推进持续发布这件事,我想说,我认为在过去的一年里我们学到了很多”,她说。

“而且我认为我们想要继续推进的方式是切实稳定这种体验,并且仍有许多工作要做,试图将其与普通人关联起来,并让其真正具备相关性。

“所以我认为,虽然我们正在开展的特色工作令人兴奋,但我觉得当下正是着手解决如何使其更便于使用这一问题的恰当时机。

“因为不管怎样,这并非我们众多注意力的聚焦之处,不过如今我们有了更多的兴趣,更多的用户,那就让它变得容易得多吧。”