文本与数据挖掘(TDM)例外(并非仅指“三步检验法”)并不允许所有未经许可的人工智能开发

时间:2025-11-11

来源:The IPKat

作者:Eleonora Rosati

类型:商标;专利;版权;域名


涉及国家/地区:欧盟

发布时间:2025-11-11

技术领域:{{fyxType}}

关于人工智能训练的诸多讨论,主要围绕在特定条件下允许文本与数据挖掘(TDM)的版权例外范围展开。读者们都知道,欧盟版权体系规定了两个此类例外(《数字单一市场版权指令》第3条和第4条)。在英国,2014年依据《信息社会指令》第5条第(3)款(a)项引入了文本与数据分析例外,目前该国正在考虑进行潜在的法律改革。在欧洲以外,日本(《版权法》第30 - 4条)和新加坡(《2021年版权法》第244条)等国的版权法中也存在TDM例外。在美国,围绕未经许可的人工智能训练正在进行的诉讼,正在检验合理使用原则的边界。正如全球讨论所显示的,关键问题并非人工智能训练是否与版权相关(如今已毫无疑问——如果曾经有过疑问的话——它是相关的),而是如何在一方面保障权利人的控制权,与另一方面人工智能开发者未经许可使用版权作品和其他受保护客体之间取得平衡。换句话说:许可与例外。


TDM并不等同于人工智能

正如在其他地方更详细讨论过的,重要的是要明确,没有任何版权例外——包括允许TDM的例外——涵盖人工智能开发的全部内容。所有现有的TDM例外(包括上述提到的例外)仅涵盖特定的受限行为。例如,欧盟的两个TDM例外都涵盖为TDM目的而进行的提取和复制行为,但均未延伸至后续受限行为(详见此处)。人工智能训练——默认情况下——需要制作副本,结果是多次触发了复制权。为避免产生疑问,根据相关立法和判例法的措辞,这一专有权涵盖“任何形式”的复制。因此,无论制作的副本是永久性的还是仅仅是暂时的,都无关紧要。如果在开发人工智能模型的过程中某个环节制作了副本,那么该副本就是版权相关的复制行为的结果。因此,那些认为人工智能模型开发过程不涉及版权相关复制行为的观点——无论是基于副本是“中间”副本,还是认为人工智能模型仅仅是受到现有作品和客体的“启发”,甚至引用思想/表达二分法并主张复制仅涉及作品的“非表达性”部分——从技术角度和版权法角度来看,都是不正确的。下图提供了人工智能模型开发阶段可能涉及版权相关行为的简化指南:

https://tmimage2.kangxin.com/group1/M00/8D/00/wKgKIWkUH_-AOMzZAAEHIwmDL-4856.png

“三步检验法”并非“后门”

然而,一些知名评论者认为,现有的例外(如欧盟的TDM例外)只要不将“三步检验法”解释为“在通用人工智能训练场景中宣告TDM条款不适用的后门”(M·森夫特莱本,《欧洲的TDM例外是否适用于通用人工智能训练?尽管有三步检验法?》(克卢沃版权博客),2025年10月1日),就可以完全涵盖未经许可的人工智能开发。像所有例外一样,TDM例外也必须符合“三步检验法”,并且在英国,还需符合合理使用原则。因此,《数字单一市场版权指令》第7条第(2)款并未引入“额外规则”或要求。它重申了一个基本事实,该事实源于国际法:例外必须仅限于某些特殊情况,这些情况不得与受保护内容的正常利用相冲突,并且不得不合理地损害权利人的合法权益。


“三步检验法”由三个累积性要求组成,需要按照其逻辑顺序进行评估,即作为步骤来评估。在确定某一特定例外是否不合理地损害了相关权利人的合法权益之前,有必要考虑该例外是否与受保护内容的正常利用相冲突,并且在此之前,还要考虑该例外是否仅适用于某些特殊情况(世界贸易组织,《美国——第110(5)条》,第6.160段;另见世界知识产权组织管理的版权及相关权利条约指南和版权及相关权利术语词汇表,第85段)。


从“三步检验法”/合理使用要求角度看人工智能训练

将上述所有内容应用于人工智能训练,不仅不存在(涵盖人工智能训练每个环节的)TDM例外(或开放式的合理使用原则),而且考虑到“三步检验法”/合理使用的要求,也不可能存在这样的例外。需要明确的是:并非所有的人工智能案例研究都能以相同方式处理,包括从版权角度来看。例如,帮助医生进行诊断评估的人工智能工具,与创作歌曲并与人类创作的歌曲竞争甚至取代其地位的人工智能服务是不同的。不同的解释将(i)可能使例外的适用范围远远超出“某些特殊情况”——因此从一开始就使其不符合要求,因为如前所述,“三步检验法”的步骤必须按顺序考虑——并且(ii)似乎明显与第二步和第三步相悖。


不与正常利用相冲突

“正常利用”的概念既包括现有的许可实践,也包括新兴或潜在的市场。世界贸易组织专家组在《美国——第110(5)条》的决定中明确阐述了这一点。当一项例外有可能减少与受保护作品相关的销售量或其他合法交易量(《ACI Adam》案,第39段),直至免责的使用行为与未免责的使用行为进入经济竞争——哪怕是潜在的竞争——时,那么该条款就与“三步检验法”的第二步不相容(《美国——第110(5)条》,第6.181段)。


这也与英国的合理使用原则和美国的合理使用原则相一致。


根据英国法律,最重要的公平性因素是涉嫌侵权的用途与版权作品所有者对作品的利用之间的竞争程度。这种竞争应理解为延伸至任何可能影响版权作品价值的活动形式。


在美国最高法院的《戈德史密斯》案中,法院通过引用《坎贝尔》案指出,根据合理使用原则的第一个因素(“使用的目的和性质”),核心问题是该使用是否取代了原告的作品,还是增添了新的内容,并且具有超出符合衍生作品要求所需的进一步目的和性质。如果原始作品和二次使用具有相同或高度相似的目的,并且后者是商业性的,那么这很可能不利于认定构成合理使用。至于合理使用原则的第四个因素(“使用对版权作品的潜在市场或价值的影响”),这要求不仅考虑作品的实际市场/价值,还要考虑其潜在市场/价值。


上述指导原则在美国首例未经许可的人工智能训练案件《汤森路透》案中得到了令人信服的适用,在该案中,巡回法院法官比巴斯裁定被告未经授权使用原告的内容构成侵权。


沿着类似的思路,在《卡德雷》案中,法官查布里亚指出,“在大多数情况下”,如果预期生成的人工智能模型将为其开发者带来数十亿甚至数万亿美元的收入,那么未经许可使用受保护内容进行训练将被视为非法。如果为了训练目的需要这样做,那么声称这些公司无法“想出一种补偿版权持有者的方式”将是“荒谬的”。法官还批评了阿尔苏普法官在《巴茨》案中早先发布的命令,特别是他似乎忽视了人工智能生成内容充斥市场所产生的巨大替代效应,以及对未来创作激励的削弱。


鉴于上述情况,人们不禁要问,正如一些评论者所建议的,要求人工智能开发者从权利人那里获得许可,为何会对权利人造成损害。特别是考虑到,目前针对训练目的的许可市场——包括个人许可和集体许可——已经存在并且正在迅速发展(详见下文)。


不造成不合理损害

版权法的一项既定原则是,根据版权法授予的专有权是财产性的(符合《欧盟宪章》第17条第(2)款),并且具有预防性。根据《伯尔尼公约》的规定,保护既包括享有此类权利,也包括行使此类权利。反过来,“三步检验法”分析的第三个方面并不意味着只需要考虑经济损害,以至于仅获得报酬而没有控制权就是一种“双赢”。


与欧洲法院一贯的判例法相一致,如前所述,版权中的专有权具有预防性,而例外确实是对这一规则的例外。此外,仅仅将专有权降级为获得报酬的权利,是否能为权利人提供足够强大的谈判地位,以使他们能够就其权利的使用获得适当的报酬,这是值得怀疑的。如果不是这样,将专有权降级为获得报酬的权利似乎会导致“不合理损害”,即使在仅考虑经济损害的情况下也是如此。


正如阿诺德法官(当时他尚为法官)在《Tixdaq》案中所解释的, “三步检验法”的最后一步“需要考虑比例性,并在版权所有者的合法权益与例外所服务的对立方利益之间取得平衡”。


结论

过去几年,全球少数几个司法管辖区已经采纳了有限的例外,允许在特定条件下进行文本与数据挖掘。目前,这些规定的边界大多尚未经过检验,并且至少在短期和中期内,还将继续出现更多的诉讼。


尽管如此,针对人工智能训练的许可市场正在迅速发展。据媒体报道,权利人和人工智能开发者之间已经达成了协议,特别是在新闻媒体领域(如阿克塞尔·斯普林格集团、《金融时报》、赫斯特集团和路透社与开放人工智能公司和微软的合作,以及普利萨传媒集团与开放人工智能公司和珀普利克西蒂公司的合作)和音乐领域(包括稳定人工智能公司推出的获得许可的稳定音频2.0模型,或ElevenLab公司与Merlin公司和Kobalt公司合作推出的Eleven音乐),并且似乎还会有更多的合作出现。


集体管理组织也一直在开发和推出针对通用人工智能的集体许可。例如,版权清算中心(CCC)、版权许可机构(CLA)和瑞典音乐版权管理协会(STIM)都已经推出了相关许可。


所有这些都表明,从实践角度来看,未来例外的适用性很可能仅限于“某些特殊情况”和人工智能开发中非常有限的阶段。因此,许可而非例外,似乎是兼顾人工智能发展和与版权保护达成所需“公平平衡”的最实用且——最重要的是——最可行的框架。


来源:https://ipkitten.blogspot.com/2025/10/tdm-exceptions-not-just-three-step-test.html

本文原文为英文,中文为机器翻译,仅供参考,如有问题或建议,欢迎随时与我们联系。

Title
x
{{message}} 忘记密码? 免费注册
{{message}} 已有账号? 返回登录

注册完成