OpenAI称《纽约时报》花钱请人破解ChatGPT以获取诉讼证据

鞭牛士报道,2月28日消息,据CNBC报道,OpenAI 要求法官驳回《纽约时报》就部分内容对其提起的诉讼,指控该媒体公司「花钱请人破解 OpenAI 的产品」,例如 ChatGPT,为其案件生成 100 个侵犯版权的示例。

在周一向曼哈顿联邦法院提交的一份文件中,OpenAI声称,《纽约时报》进行了数万次尝试才得出高度异常的结果,并且该公司使用了公然违反 OpenAI 使用条款的欺骗性提示。

「普通人不会以这种方式使用 OpenAI 的产品。」OpenAI 在文件中写道。

OpenAI 在文件中声称的黑客攻击也可以称为即时工程或红队,这是人工智能信任和安全团队、伦理学家、学者和科技公司对人工智能系统漏洞进行压力测试的常用方式。这是人工智能行业的常见做法,也是提醒公司注意系统内问题的一种流行方式,类似于网络安全专业人员对公司网站的弱点进行压力测试的方式。

「在这份文件中,OpenAI 没有否认,也不能否认,他们在未经我们许可的情况下复制了数百万份《纽约时报》的作品来构建和支持其商业产品。」苏斯曼·戈弗雷 (Susman Godfrey) 合伙人兼首席法律顾问伊恩·克罗斯比 (Ian Crosby) 表示。

他补充道,OpenAI 奇怪地错误地描述为黑客,只是利用 OpenAI 的产品来寻找他们窃取和复制《纽约时报》版权作品的证据。这正是我们所发现的。事实上,OpenAI 的抄袭规模比投诉中列出的 100 多个例子要大得多。

该文件提交之际,OpenAI 与出版商、作家和艺术家之间就使用受版权保护的材料进行人工智能训练数据展开了一场更广泛的斗争,其中包括备受瞩目的《纽约时报》诉讼,一些人认为这是该行业的分水岭时刻。该新闻媒体于 12 月提起诉讼,旨在阻止微软OpenAI 造成了数十亿美元的损失。

过去,OpenAI 曾表示,如果没有版权作品,不可能训练顶级人工智能模型。

「因为今天的版权几乎涵盖了人类的每一种表达方式——包括博客文章、照片、论坛帖子、软件代码片段和政府文件——如果不使用受版权保护的材料,就不可能训练当今领先的人工智能模型。」OpenAI 在一份报告中写道。

OpenAI上个月在英国提交了文件,以回应英国上议院的质询。

「将训练数据限制在一个多世纪前创建的公共领域书籍和绘图可能会产生一个有趣的实验,但不会提供满足当今公民需求的人工智能系统。」OpenAI 在文件中继续说道。

就在上个月,在瑞士达沃斯,OpenAI 首席执行官 Sam Altman 表示,他对《纽约时报》的诉讼感到惊讶,称 OpenAI 的模型不需要根据出版商的数据进行训练。

「我们实际上不需要对他们的数据进行训练。」奥特曼在彭博社在达沃斯组织的一次活动中表示。「我认为这是人们不理解的事情。任何一种特定的培训来源,对我们来说都没有太大的推动作用。」

尽管一个发行商可能不会对 ChatGPT 的运营能力产生影响,但 OpenAI 的文件表明,许多发行商选择退出的决定可能会产生影响。

近几个月来,该公司开始向出版商寻求允许将内容用于培训数据。

该公司已经与拥有 Business Insider、Morning Brew 和其他媒体的德国媒体集团 Axel Springer 达成了协议,据报道,该公司还正在与 CNN、福克斯公司和《时代》杂志就其作品授权进行谈判。

OpenAI 在文件中写道:我们预计与其他公司正在进行的谈判很快就会产生更多的合作伙伴关系。

在文件及其博客文章中,OpenAI 强调了其针对出版商的选择退出流程,该流程允许媒体禁止该公司的网络爬虫访问其网站。但 OpenAI 在文件中表示,这些内容对于训练当今的人工智能模型至关重要。

「虽然我们期待继续开发额外的机制,赋予权利持有人选择退出培训的权利,但我们正在积极与他们合作,寻找互惠互利的安排,以获得原本无法访问的材料,并以以下方式展示内容:超出了版权法允许的范围。」该公司写道。