您的音乐或被用于AI音乐生成,合法吗?

如果您还没听说过生成式人工智能的巨大影响,那您可真是“两耳不闻窗外事”啦。

是的,在极短的时间内,让人眼花缭乱,整个创意学科都被颠覆,新的商业帝国崛起,还引发了一系列伦理问题。大多数普通旁观者都被惊到了。

最近,Suno 和 Udio 这两家公司上了头条,它们当下引领着人工智能音乐的新领域:全长歌曲生成器。

大型语言模型(LLMs),这种成就这些神奇之事的技术,完全依赖数据。

图像生成器靠图像来“训练”,文本生成器“吞掉”书籍和文章,音乐生成器分析成千上万的音乐作品来提取有意义的模式。

“在很多这类生成式人工智能公司中,我们发现一个问题,就是他们不想分享自己的训练数据,”人类艺术运动的高级顾问、科幻作家、天体物理学家兼民俗学者莫伊亚·麦克蒂尔博士说道。

尽管有这种不确定性,用受版权保护的内容来训练音乐模型已成了公开的秘密。

简单地说:没有太多免费使用的库存音乐,而且可用的也不是很鼓舞人心。因此,要生成一首过得去的流行音乐模仿作品,您需要一个基于大量高质量商业音乐的模型。

据美国唱片业协会(RIAA)称,这正是 Suno 和 Udio 所做的。

代表“三大”唱片公司——环球音乐集团(UMG)、索尼和华纳唱片——美国唱片业协会(RIAA)于今年 6 月提起了一项诉讼,声称“存在几乎难以想象规模的故意版权侵权行为”。该诉讼为每项被侵权作品寻求高达 15 万美元的赔偿,这对 Suno、Udio 以及其他人工智能歌曲生成器构成了生存威胁。

美国唱片业协会(RIAA)提出的指控似乎也有充分的支撑。在最近的一个专栏中,曾是 Stability AI 音频副总裁、如今是非营利组织 Fairly Trained 首席执行官的埃德·牛顿 - 雷克斯(Ed Newton-Rex)展示了利用 Suno 平台生成著名歌曲的近似复制品是多么容易。但不仅仅是大牌艺术家应该感到担忧。从公共网站抓取数据的工具无处不在,新兴艺术家发布在 YouTube、Soundcloud 或类似平台上的音乐很可能已被用于训练数据。

当被问及她的音乐是否可能被吸入大型语言模型时,萨曼莎·陶伯(Samantha Tauber)回答说:“总是有这种可能性。”陶伯以她虚构的另一个自我 VNCCII 而闻名,她对前沿技术并不陌生;她职业生涯的大部分时间都在拥抱它。从 3D 虚拟形象,到元宇宙,再到区块链,陶伯将技术融入了她的艺术和围绕 VNCCII 的虚构宇宙中。

谈到人工智能,她明确表示自己对这项技术本身没意见:“我不反对人工智能,我支持人工智能——只要它支持并尊重创作的完整性。从艺术家的角度来看,如果有人没有明确许可,而这些模型在未经同意的情况下基于作品进行训练,我认为这是不对的。”

Suno 则不同意。在一份夸张的法律文件中,该公司平息了谣言,几乎承认其服务是基于商业音乐构建的,并声称这样做构成“合理使用”。

“合理使用是针对版权侵权索赔的一种抗辩,”在加州大学洛杉矶分校教授音乐商业相关课程的音乐律师乔纳森·拉尔(Jonathan Larr)说道。“你说的是:‘我肯定侵权了,但我的侵权是可以的,因为这是合理使用。’”

一般来说,合理使用豁免通常适用于教育、新闻报道或学术研究等领域。在这种情况下,Suno 关于合理使用的论点基于这一主张,即他们的模型不会复制音乐作品,只是“聆听”它们并从中“学习”——就像初出茅庐的歌曲作者在创作原创曲调前,可能会像这样从最喜欢的乐队的过往作品中汲取影响和灵感。

这里的一个关键症结在于,在许多情况下,人工智能歌曲生成器的输出意在与它们所训练的歌曲在商业上竞争。RIAA 的诉讼列举了一些实例,其中,用户已经“在音乐流媒体服务上发布 Udio 生成的输出,它们将与真实的、受版权保护的录音竞争播放量。”

Suno 的首席执行官 Mikey Shulman 在向《公告牌》发表的一份声明中回应称,公司的模型“旨在生成全新的输出,而不是记忆和重复现有的内容。这就是我们不允许用户提示提及特定艺术家的原因。”

对于 Suno 的合理使用法律策略是否会奏效,意见似乎存在分歧。一些预见到了人工智能歌曲生成器将被清算,另一些人则认为该公司的论点有真正成功的机会。

正如 Larr 所指出的,即使按照音乐版权法出了名的复杂标准,合理使用的主张也是“模糊不清”的,并且通常是根据具体情况决定的。在 Larr 看来,Suno 的情况看上去很薄弱,但他赶紧补充道:“我必须承认我在这里有自己的偏见;我与艺术家合作,我不希望艺术家创作的音乐被人工智能生成的音乐排挤。除了我自己的偏见,我真的不确定——合理使用的案例很难预测。”

这种极不稳定的法律环境当然并没有阻止公司向前推进——事实上,许多人将这种不确定性视为在监管机构做出反应之前将产品推向市场的黄金机会。

最近,微软人工智能首席执行官穆斯塔法·苏莱曼(Mustafa Suleiman)把开放网络上的创意内容比作“免费软件”,并暗示,除非另有说明,否则任何在网上公开发布的内容都属于合理使用的范畴。这种观点值得关注,因为微软现在已经将 Suno 直接集成到其人工智能副驾驶服务中。同样,前谷歌首席执行官埃里克·施密特(Eric Schmidt)在斯坦福大学讲话时对学生说:“如果(产品)成功了,那么你就雇一大群律师来收拾残局。但如果没人使用你的产品,那么你窃取所有内容也没关系。”

这种观点,如此直白地表达出来令人震惊,表明了一种久经考验的商业模式,这种模式已渗透至硅谷的最高层。“当我看到处于领导地位的人传播这种信息,大声说出那些私下的想法,并承认他们试图在法律和规则出台之前迅速行动以谋取利润时,我非常担心,”麦克蒂尔(McTier)回应道。“这很糟糕,这是非法的,对我们的社会不利。”

在辩论的另一方,有人表示,像生成式人工智能这样的开创性技术在一个更规范的环境中是为了创新而创新所面临的法律障碍很少,这种环境禁止这种可疑的行为。

然而,正如人工智能音乐先驱霍利·赫恩登(Holly Herndon)和马特·德赖赫斯特(Matt Dryhurst)所指出的,至少在欧盟的情况下,“只要您没有将模型本身商业化,在互联网上对任何内容进行模型训练用于个人和创造性用途都是合法的。因此,对于那些希望创作艺术或表达自己的人来说,几乎没有创造性的限制。合法的问题是,我们是否对私人公司将没有分享利润预期的人的数据货币化施加常识性限制。”

凭借开创性的 Holly+声乐模型等项目,赫恩登和德赖赫斯特多年来一直处于人工智能音乐对话的前沿。他们的新展览 《呼唤》将于 10 月在伦敦蛇形画廊开幕,邀请公众与一个基于 15 个英国合唱团训练的声乐模型互动。它不仅在艺术方面具有创新性,还暗示了人工智能模型所引发问题的替代解决方案。

与蛇形画廊合作,赫恩登和德赖赫斯特建立了他们所谓的“数据信托实验”。两人表示,他们现在“正在与合唱团社区合作,建立一个开创性的数据治理基础设施,让代表性不足的创意人员对他们的数据拥有更大的集体控制权和代理权。”

“我们对于能逃脱什么不太感兴趣,”赫恩登和德赖赫斯特继续说道。“更感兴趣的是证明人工智能训练可以是积极的总和和同意的。我们认为,从长远来看,没有理由不能拥有基于同意数据训练、免费使用并向其训练对象返还利益的非常强大的人工智能模型。”

展望未来,拉尔(Larr)看到了早期围绕音乐盗版的斗争可能重演;针对像 Napster 这样的平台采取的法律行动最终为获得授权的流媒体平台创造了空间来接管。“得有一种授权机制,音乐家的音乐创作得有报酬,”他说。“我认为,如果这能导致出现一个类似 Spotify 的、获得授权的对等平台,成为主导的人工智能音乐公司,那将是积极的一步。当然,关于 Spotify 如何补偿艺术家有很多抱怨,但那是另一个话题。”

RIAA 的这场诉讼堪称一个分水岭时刻。如果人工智能音乐公司凭借合理使用原则获得法律庇护,从而能在任何及所有内容上训练其模型,那这在整个音乐行业都会引发巨大反响。同时,重要的是要记住,RIAA 的胜诉对于人工智能歌曲生成器来说并非灵丹妙药。

就像各大唱片公司起诉人工智能公司未经许可使用受版权保护的音乐那样,他们同时还在跟其他科技巨头商谈为极其相似的项目授权音乐。各大唱片公司会超越底线,用已故艺术家生成歌曲来与在世艺术家竞争吗?某些唱片公司会在未经艺术家同意的情况下,将他们拥有权利的音乐授权用于人工智能训练吗?历史告诉我们,当涉及到金钱时,各大唱片公司很少站在小人物一边。

“我看到好多未来的路最终都走到了类似的地方,”麦克蒂尔(McTier)警告道。“那个地方是艺术家觉得把他们的作品放出来不安全,因为可能会被这些生成器抓取。他们可能没有足够的市场来推出他们的作品,因为已经被人工智能生成的内容饱和了。而听众、观众,如果他们不知道某样东西是由人工智能还是由他们尊敬和钦佩的人创作的,最终会对音乐和艺术场景失去很多信任。”

这不是一个美好的明天图景,也并非不现实。无论是否获得授权,人工智能歌曲生成器都将继续存在,我们都需要弄清楚如何与它们共存。如果艺术家和粉丝希望音乐有一个不同的未来,他们不能指望这种变化来自高层;他们需要为之奋斗。

“这是我的营生,”陶伯(Tauber)着重说道,她正准备推出她的首张专辑。“作为一名艺术家,你只是不知道你的艺术会发生什么,但你必须继续创作,你不能因为担心你的作品会被用于训练数据而停止。创造力是现存的最高形式的智慧之一,如果你把它输给了人工智能,那么作为人类,我们的功能到底是什么?”