從AI輔助音樂創作專利技術思考使用者創作的原創性
※如欲转载本文,请与北美智权报联络
陈秉训/国立政治大学科技管理与智慧财产研究所教授
以AI辅助创作音乐不是梦,国内有公司推出以AI辅助创作音乐的APP。问题在于著作权法能否保障APP使用者所创作的音乐。本文欲借由该APP背后的AI技术,即新型专利第M578439号,与使用者操作分析等为基础,以讨论使用者著作之原创性。
技术背景
新型专利第M578439号所采用的AI技术为利用卷积神经网路(convolutional neural network,CNN)、或递归神经网路(recurrent neural network,RNN)的长短期记忆(long short-term memory,LSTM)模型之演算法程式,为深度学习技术之延伸。
深度学习技术所采取「人工神经网路」的演算法,其基础是线性函数:h(x) = b + θ1x1 + ... + θnxn = b + Σθixi (i=1 ~ n),h为模型,xi为变数,θi为对应于xi的权重,b为偏差)。基本的神经网路由输入层、至少一层隐藏层、及输出层所依序排列而组成,又称「完全连接前馈式网络」(fully connected feedforward network)。
如图1所示,输入层由线性函数的数个xi,即输入数值或输入节点,所构成。一组输入节点的组合可配对一组权重θi组合Σ,而产生一个输出节点h,或可称「神经元」。同一组输入节点组合可对应数个权重组合,而以矩阵运算产生一组输出节点组合。如图2所示,隐藏层的输入节点组合可以是前一层的输出节点组合;输入节点合组的节点数可由前一层的权重组合个数来操控。如图3所示,各权重与其对应的输出节点间可插入一个激活函数(activation function,AF),即非线性函数,其功能在限缩输出值在某一个范围内。
图1:基本的神经网路,
图2:有隐藏层的神经网路
图3:激活函数的神经网路
专利技术
本件专利所提出的「自动词曲创作系统」包括曲调分析引擎11、歌词分析引擎13、风格选择单元14、歌词选择单元15、及曲调选择单元17,如图4所示。
曲调分析引擎11和歌词分析引擎13是AI技术的核心。曲调分析引擎11为神经网路12程式为基础,并根据多媒体资料库20(音乐网站资料库)的流行音乐与其排名为资料而进行分析,进而学习「受欢迎音乐的曲调架构」并产生流行音乐的曲调组合,以建构曲调组合模型111(内含多个曲调集)。歌词分析引擎13则利用多媒体资料库20的音乐排名顺序及文字资料库(诗词资料库)21的热门浏览率等二项资讯,并同样以神经网路12程式来分析「受欢迎音乐的歌词架构」及「来自该文字资料库21的词句架构」,以建构歌词组合模型131(内有多个歌词集)。
图4:新型专利第M578439号说明书的图示
关于歌曲分析,神经网路12程式根据流行音乐的「前奏、主歌、导歌、副歌、过渡、及尾奏」的排列模式,「借由能量结构变化、频谱结构变化、音阶变化、时间长短变化、音量大小、乐器复杂度、歌词内容、及频率重复等」,以「判断其为主歌或副歌」;「再分析主副歌、发音分类、属性、及平仄顺序」,或「透过隐藏马可夫模型(Hidden Markov Model,HMM)」以「机率建构乐理模型并经过调整」,如此以「找出各种不同曲风属性中受欢迎的曲调集」,进而「建构出该曲调组合模型111」;最后,「可借由使用者的意见回馈」以「调整或保留各该曲调组合模型111」。
隐藏马可夫模型是以机率观点来解析符号序列,其透过「可观察层的观测序列」(observation sequence)推得出「隐藏层的状态序列」(state sequence)。操作时,必须假设隐藏层的「状态」,以透过可观测的符号(例如音符或其频率),来找到隐藏层从「一状态」转到「下一状态」的机率。
关于歌词分析,神经网路12程式亦利用如同其进行歌曲分析时之方法,来「找出各种不同风格属性中受欢迎的歌词集」,并「建构该歌词组合模型131」,进而由「使用者的意见回馈」以「调整或保留各该歌词组合模型131」。但专利说明书内未提到如何以隐藏马可夫模型进行歌词分析。
从专利说明书对曲调分析引擎的描述中,可粗略理解乐易创AI的音乐创作过程。该AI对流行音乐有一定的分析模式,其将歌曲分为前奏、主歌、导歌、副歌、过渡、及尾奏等部分。不过,专利说明书未揭露各部分之意义,而是在乐易创的网站上有解释[1]。另因相关程式的具体内容不明,故仅能假设所产生的旋律或歌词是一连串的数位资讯。
使用者创作过程之描述
为分析著作权相关议题,有必要叙述「乐点APP」的使用过程[2]。首先,该APP要求使用者就「整首设定」、「词」及「曲」等三类事项中进行参数选择。在「整首设定」部分,有「歌曲模板」和「个人喜好」;前者提供歌曲结构的选项:短曲、「主歌-副歌」、「主歌1-主歌2-副歌」、与「主歌1-副歌1-主歌2-副歌2」;后者目前未有选项。
在「词」部分,有「主题」和「子主题」;前者提供歌词主题的选项,而每个主题有各自的子主题;例如「旅行情怀」主题包括「山」、「水」和「海」等三个子主题、「恋爱」主题包含「初恋」、「暗恋(单恋)」、「告白」、「热恋」与「分手与思念」等五个子主题。在「曲」部分,有「曲风」、「情绪」和「乐器」等三个分别独立的参数;「曲风」有「抒情」和「快歌」,「情绪」可选择「快」或「慢」,「乐器」则可挑「钢琴」、「电子琴」和「吉他」。
在使用者就「整首设定」、「词」及「曲」等三类事项决定好参数后,该APP即针对「主歌」部分与「副歌」部分分别提供四组歌词的选项,而每组歌词乃四段歌词段落之组合。该些歌词乃为该APP伺服器端之内建词库所提供的歌词,且都是CC(creative commons)授权而可自由使用与修改。使用者可依照该APP所给定的歌词组选择一组,而得到一对的主歌歌词和副歌歌词。另使用者亦可修改该APP所给定的歌词,或自行创作歌词;但一段歌词的「字数」会被该APP限制在一个范围内,非使用者可决定。
完成歌词后,该APP继续给「主歌」部分与「副歌」部分等各四组旋律的选择。使用者可从四组旋律中选取一组,并接受该旋律。但使用者亦可就选好的旋律进行修改,而可针对该旋律之任一个音符给予「调整音高」与「调整音长」之变动。完成旋律后,该APP接着建议三个编曲。使用者可由该三个编曲中择一,并采纳该编曲。而使用者或可修改所选取的编曲,而调整该编曲的「音阶」及「速度」等之升降。
完成编曲后,该APP即协助使用者完成一首流行音乐著作。如果使用者不喜欢AI系统所提供的成果,其仍可使用该APP的编辑工具来调整旋律。最后,使用者可以替该音乐著作命名,并在该APP的资料库中留下记录,包括创作者名字、与版权资讯(作词人、作曲人、及二者之版权比率),而该记录的资料于「工研院台湾版权管理区块链」注册。
原创性分析
使用者著作因涉及人类的精神活动,而有取得原创性之可能。「乐点APP」的操作过程乃就音乐著作的结构(即个别AI著作的编排形式)、系统所回馈的AI著作选项等做选择,此创作过程类似「编辑著作」,即若「就资料之选择及编排具有创作性者」可「以独立之著作保护之」[3]。因此,关于使用者著作,其原创性争议可从编辑著作的角度来思考。
此外,尽管AI著作本身不具原创性,但不代表使用者著作必然没有原创性。以电脑程式著作为例,最高法院于98年度台上字第868号民事判决指出,自「电脑程式著作列入著作权保护之对象以来,随电脑科技之日新月异,对于非文字之结构、次序及组织、功能表之指令结构、次级功能表或辅助描述、巨集指令、使用者介面、外观及感觉,是否均在著作权保护之范围,审理之法院自应或委由鉴定机关将(主张享有著作权保护之人之受保护)电脑程式予以解构」,以「过滤或抽离出其中应受保护之表达部分」,但「将具有高度抽象性之思想或概念等公共财产及基于效率或电脑软硬体功能外部因素所限制部分,予以滤除」。
电脑程式著作基本上系由受保护部分(即应受保护之表达部分)和非受保护部分(即具有高度抽象性之思想或概念、基于效率或电脑软硬体功能外部因素所限制部分等)所构成,但此不影响其原创性之认定。同理,使用者著作即使系由不具原创性的个别AI著作所组成,其整体仍可取得著作权保护。
备注:
(1) http://letronmusic.com/news_detail.php?id=93。
(2) 以1.8.8版为例。
(3) 最高法院91年度台上字第940号民事判决/理由。
华邦电子公司制程工程师
联华电子公司制程整合研发工程师
台湾茂矽电子公司专利工程师
禹腾国际智权公司专利工程师
威盛电子公司专利工程师
亚太国际专利商标事务所专案副理
美国圣路易华盛顿大学智慧财产暨科技法律法学硕士
政治大学法律科际整合研究所法学硕士
台湾大学化工所硕士
台湾大学化工系
延伸阅读&电子报订阅连结:
【详细内容请见《北美智权报》357期;欢迎订阅《北美智权报》电子报】