谷歌推出为人工智能文本添加水印的新技术

谷歌正在将 SynthID Text 这项能让开发者为生成式人工智能模型生成的文本添加水印并进行检测的技术全面推出。

SynthID Text 能够从人工智能平台 Hugging Face 以及谷歌更新的 负责任的生成式人工智能工具包 进行下载。

“今天,我们正在将我们的 SynthID Text 水印工具开源,”该公司在 X 上的 一篇帖子 中写道。“免费提供给开发者和企业使用,它将帮助他们识别由人工智能生成的内容。”

那么它是如何工作的?

给定一个提示,比如“你最喜欢的水果是什么?”,文本生成模型会一次预测一个“标记”,也就是预测哪个“标记”最有可能跟在另一个之后。标记是生成模型用来处理信息的基本构建块。它们可以是单个字符、单词,或者是短语的一部分。

该模型为每个可能的标记分配一个分数,即其在输出文本中出现的百分比概率。谷歌表示,SynthID Text 通过“调节生成标记的可能性”在这个标记分布中插入了额外的数据。

“模型的单词选择的最终分数模式与调整后的概率分数相结合,被当作水印,”该公司在博客文章中写道。“将这种分数模式与有水印和无水印文本的预期分数模式进行比较,帮助 SynthID 检测文本是由人工智能工具生成的,还是可能来自其他地方。”

谷歌声称,自今年春天以来已与其 Gemini 模型集成的 SynthID Text 不会损害文本生成的质量、准确性和速度,甚至对于被裁剪、释义或修改的文本也能发挥作用。

但这家公司也承认其水印技术存在一定的局限性。

例如,SynthID Text 在处理短文本、从其他语言重写或翻译而来的文本以及对事实性问题的回答时表现欠佳。该公司解释说:“对于事实性提示的回答,在不影响事实准确性的前提下,调整令牌分布的机会较少。” “这包括像‘法国的首都是什么?’这类提示,或者像‘背诵一首威廉·华兹华斯的诗’这种几乎没有或毫无变化预期的查询。”

谷歌并不是唯一一家致力于人工智能文本水印技术的公司。OpenAI 多年来一直在研究水印方法,但因技术和商业方面的担忧而推迟了其发布。