EN

阿巴斯·拉特瓦拉:生成式人工智能的发展更需要强有力的版权保护规则

2025-02-10 174

摘要:

文章聚焦了生成式人工智能(AI)蓬勃发展的背景下,版权保护规则与数据透明度的重要性这一议题。文章认为,促进AI发展的最佳途径在于其内容训练活动应遵循现有的知识产权法规;各国不应削弱版权规则,而应向在本国市场推广AI模型的开发者提出实质性要求,即保持训练内容的透明度。


以下是根据现场速记整理的演讲全文:


一、 当前人工智能和音乐的现状:优势与劣势

技术变革始终是推动音乐行业发展的核心动力。从黑胶唱片的诞生,到CD的普及,再到MP3的兴起,到流媒体经济时代音乐版权权利人与技术服务商之间开展授权,使得全球音乐资源触手可及。在这股科技浪潮中,AI的融入无疑为音乐产业增添了更多可能。近年来,AI工具已广泛应用于音乐创作的各个环节,从帮助作曲和母带制作、到智能管理播放列表、深化粉丝互动和提升用户体验,科技对音乐的影响无处不在。

生成式AI的兴起促进了唱片公司与AI公司间的积极合作。例如,Pink Floyd乐队的Dave Gilmore与索尼音乐联手,为粉丝打造了一场令人赞叹的AI视听盛宴。这些合作都是为了优化音乐生态系统而进行的,是在获得授权并尊重版权的基础上,通过建立合作伙伴关系在市场中实现共赢的。但遗憾的是,我们也看到了一些非法利用AI技术的不良行为:

第一,未经授权的声音克隆和深度伪造行为。艺人的声音、形象、姓名及肖像在未经许可的情况下被克隆合成,这种行为引发了一系列不良后果。目前,已有不法分子利用这项技术对大量用户实施欺诈,从中非法获利。例如,有人制作并发布了虚假的Frank Ocean预发行曲目,致使粉丝们误信为真而花钱购买。这类现象不仅限于音乐行业,其他行业具有社会影响力的人物“克隆”也出现了滥用情况,产生了广泛且恶劣的社会影响。

第二,大型生成式AI模型中的侵权行为。生成式AI开发者在未获权利人授权、未支付版权费的情况下,大量使用受版权保护的内容(如音乐作品和录音制品)来“训练”其模型。尤为讽刺的是,这些模型的产出往往正是基于其最初擅自使用的内容,甚至还要与原内容在市场上进行竞争。在全球范围内,针对此类的侵权案件已屡见不鲜,其中美国案件数量尤为庞大,中国也出现了一些相关案例。例如,2024年6月,我们的唱片公司会员在美国对Suno和Udio采取了法律行动,诉由是他们未经授权复制了受版权保护的录音作品,用来训练生成式AI模型,构成了对这些录音版权的大规模侵犯。这一案例清晰明了地展示了被告行为的侵权性质,它既不属于合理使用范畴,也不符合任何例外情形。

目前,技术滥用的现象正在逐步改善,滥用者的不当行为正面临法律的追究与严厉制裁。然而,如果引入广泛的文本与数据挖掘(TDM)例外[1],上述诸多严重问题行为有可能被合法化,这无疑将给版权保护和社会秩序带来更大的挑战。


二、生成式人工智能背景下,稳固的版权保护规则的重要性

首先,版权规则本身是推动文化与技术可持续发展的关键力量。以音乐产业为例,过去十年间,音乐产业始终积极拥抱新技术带来的机遇,不断探索多元化的许可模式,与科技公司紧密合作,推动许可创新,这在流媒体市场表现尤为突出。流媒体市场的许可机制使得全球消费者能够随时随地获取并享受音乐内容。这种类似的协作不断延伸,也在音乐公司与负责任的AI公司建立的伙伴关系中得到体现。

在AI语境下,版权许可同样广泛应用于新闻、图片、电影等众多领域。这些既存及新兴的商业合作关系表明,强化版权保护与推动高质量、以人类为中心的AI发展并非相互排斥的两个目标。恰恰相反,有意义的AI发展离不开新颖、创新的内容供给。版权规则所确立的专有权为新作品的创作提供了坚实的动力,促使AI提供者与版权人能够在公平合理的基础上展开合作,并确保版权人能从AI使用者对其作品的使用中获得合理的报酬。这正是构建一个良性循环的关键:创作者能够持续创新和创作,而AI提供者能在自由协商的条件下获取新内容。

其次,若采用宽松的TDM例外规则来削弱知识产权保护的基本原则,将对音乐生态和长期创新构成威胁。此举不仅会损害创作者的合法权益,还会直接导致AI应用输出物的质量下降,进而影响其在公众中的认可度。毕竟,高质量的训练内容是构建高质量AI系统的核心要素,其重要性堪比AI公司在技术人才、算力等领域的巨额投资。削弱版权保护无疑会打击创作者创作新作品及投资者的积极性,进而阻碍AI模型的持续进步与发展。而且,一个广泛且开放的商业性TDM例外与各国际条约所规定的三步检验法存在冲突。

第三,尽管AI开发者构建模型并非单纯为了音乐内容本身,而是为了创造出具有商业吸引力的产品,并从中变现,但音乐等版权内容不同于未经授权即可被擅自使用的数据。相反,AI开发者与其他版权内容使用者一样,应当先与版权所有者进行许可协商,特别是与那些有能力开展大规模许可的版权所有者(如音乐行业,其中数字音乐服务传播着数以亿计的录音制品便是力证)进行协商。若开发者的业务依赖于他人享有版权的作品,那么获取版权方的授权是其业务运营的必要支出。相较于AI开发者在许可协商中可能产生的支出成本,广泛的版权例外给版权所有者带来的潜在损害要大得多。

而且,没有证据表明通过TDM例外来要求版权人让渡权利能有效激励对AI研发的投资。实际上,那些在AI研究、投资及建设方面领先的国家,诸如中国、美国和英国,并未在其国内法中纳入延伸式TDM版权例外的情况,它们的投资项目也并未因此受阻。在做出投资决策时,人才的获取及商业的确定性才是重要考量因素。总的来说,一个允许AI提供者未经授权且无偿使用受版权保护的材料进行TDM例外的策略,并不能为国家经济带来长远的正面效应。相反,它会对创造力和创新造成难以弥补的伤害,将严重阻碍创意产业的健康发展,波及国家文化、消费者,也会损害AI提供商自身的利益。

随着AI技术的不断发展,版权保护的重要性愈发受到人们的关注。中国作为版权与知识产权保护领域的先锋国家之一,国家互联网信息办公室所制定的相关法规堪称全球典范。这些法规不仅强调了尊重版权的必要性,还明确指出,使用版权内容进行AI训练的行为需要事先获得授权。

近期,英国曾考虑削弱其版权制度,引入一项广泛的TDM例外条款,但经过广泛的咨询与论证后,英国政府最终决定放弃这一做法,认为此举对英国AI行业的长远发展并无实质性助益,反而会对本国的文化产业造成不利影响。此外,澳大利亚、印度等众多国家政府也纷纷强调,授权使用版权内容对于AI模型的训练至关重要。同时,包括七国集团(G7)、二十国集团(G20)、经济合作与发展组织(OECD)等在内的多个国际组织会议也承认了尊重知识产权的必要性。由此可见,版权保护规则不仅不会阻碍创新,反而有利于创新,这一观点已在全球范围内得到了广泛的认可与支持。


三、增强人工智能透明度,筑牢版权保护防线

为了维护严格的规则,避免版权保护水平的降级,政府需要对生成式AI开发者施加透明度要求,要求他们公开用于模型训练的内容信息。

鉴于生成式AI模型是大规模吸收、复制和挪用受保护内容,且过程复杂不透明,我们几乎无法确定内容是否被不当使用或是否侵犯了版权。这些模型在训练上具有巨大的、不透明的黑匣子性质,所以我们迫切地需要新的解决方案,要求生成式AI链条中的关键主体遵循合理的数据治理原则,特别是保存并披露记录,以便权利人能够识别其权利是否受到侵犯,无论这种侵犯是无意的还是有意的。

以上观点正逐渐得到越来越多的政府认可。其中,欧盟在2024年8月生效的《欧盟人工智能法案》最具代表性。值得强调的是,法案要求不仅适用于在欧盟境内进行模型训练的服务,也明确了只要服务在欧盟市场上提供,就必须遵守欧盟法律,无论模型无论在哪里训练。同时,法案要求AI模型开发者公开其训练内容的细节摘要,以便权利人有效行使权利。

(2024年12月4日于“第四届著作权集体管理论坛”)

(著作权归演讲者所有,未经许可,请勿转载)


注:

[1] 文本与数据挖掘 (TDM) 是一项广泛用于检索和分析内容的技术。1988年《版权、工业品外观设计和专利法》(CDPA)第29A条规定了仅适用于非商业研究的TDM例外。当权利人明确表示保留其作品用于这些目的的权利时 (即选择退出) ,TDM 例外通常不适用。