针对“研究”和“学习”目的开展的人工智能训练的版权例外情形与合理使用抗辩：一项新的学术研究

时间：2025-08-29

来源：The IPKat

作者：Eleonora Rosati

类型：版权

涉及国家/地区：全球

发布时间：2025-08-29

技术领域：{{fyxType}}

在简·奥斯汀所处的时代，或许许多人的脑海中都铭记着某种观念，时至今日，对于一些或多或少开明的人来说，这种观念依然成立。然而，在人工智能（AI）时代，还有另一个或许更为普遍认可的真理：人工智能模型需要大量“数据”进行训练，才能为开发者带来好运。

此类“数据”往往包含受版权、相关权利和/或特殊权利（包括数据库权）保护的内容。原因不难理解：利用高质量的文本、音频、视频和图像进行训练，包括报纸文章、专业词曲作者创作的歌曲和作品、视频制作者和生产公司的视听内容、艺术家和摄影师的作品等，可使训练出的模型生成高质量、最新且准确的结果。

在此背景下，探讨如何在版权法下的许可与例外情形之间取得平衡，已成为一个具有全球相关性的议题。过去几年，一些国家已经：

制定了法定例外情形，允许在特定条件下进行文本与数据挖掘（TDM），例如日本（《版权法》第30 - 4条）、新加坡（《2021年版权法》第244条）、英国在作为欧盟成员国期间（《版权、设计和专利法》第29A条）、其他欧盟成员国，以及欧盟通过《数字化单一市场版权指令》（DSM指令）采取的行动；

讨论进行法律改革，以引入文本与数据挖掘的例外情形（如中国香港地区），或扩大现有例外情形的适用范围（如英国）；

未考虑制定任何新立法。美国就属于后一种情况，其现有的1976年《版权法》第107条规定的合理使用原则，过去一直并将继续用于判定未经许可的文本与数据挖掘和人工智能训练活动的合法性。

在欧盟层面，迄今为止，大部分关注都集中在DSM指令第4条上，包括在英国可能进行的改革背景下，这或许是因为与指令第3条相比，第4条由于未对文本与数据挖掘的受益者和目的加以限制，因而被认为具有更广泛的关联性和适用性。

在此背景下，需要提出以下四点看法：

首先，文本与数据挖掘可能是人工智能训练过程的一部分，但它既不等同于人工智能训练，也不涵盖人工智能训练的全部内容，包括在版权和相关权利限制范围内的行为。

其次，从欧洲（包括欧盟和英国）的角度来看，仅聚焦于DSM指令第4条来处理未经许可的文本与数据挖掘和人工智能训练问题，是短视的。正如汉堡地方法院在LAION案中的判决所表明的那样（IPKat相关报道链接1、链接2），DSM指令第3条也有可能被大量且不恰当地用于未经许可的文本与数据挖掘及后续的人工智能训练实践。这主要有两个关键原因：指令本身明确允许例外情形的受益者与第三方（包括商业人工智能开发者）合作；以及“研究机构”和“科学研究”等关键概念可能存在（过度）宽泛的解释。汉堡法院未对这两个方面进行详细考量，而是直接判定被告组织符合德国对该欧盟条款转化规定中研究机构的资格，有权获得保护。此外，法院还不当地将文本与数据挖掘的概念（这正是DSM指令第3条所涵盖的内容）与人工智能训练的概念混为一谈。总体而言，过度专注于第4条以及该条款第3段中围绕权利保留的技术和法律复杂性，会分散人们对以下情况的注意力：商业人工智能开发者可能会转而关注DSM指令第3条，以探索并测试他们在多大程度上可以与第3条的受益者合作，而无需受到第4条的限制，特别是权利保留的可能性。

第三，近期有人呼吁放宽欧盟版权规则以促进“研究”，似乎欧洲议会议长本人也提出了此类呼吁，她还宣布将提出立法提案，“让欧洲再次成为创新之都”。

第四，英国政府关于版权与人工智能的咨询活动近期刚刚结束，目前正等待官方回应。如果最终不进行改革，那么《版权、设计和专利法》第29A条的适用将在很大程度上取决于法院对“研究”概念以及其中“非商业性”要求的理解。

新的学术研究

基于上述情况，我应国际唱片业协会的要求开展了一项学术研究，该研究刚刚发表在《欧洲风险规制杂志》上。我研究了未经许可的人工智能训练活动是否能够以及在多大程度上能够不依赖转化为国内法的DSM指令第4条，或英国假设的例外情形改革体系，而是依靠目前看来可能被忽视的抗辩理由来开展。

这里特别提到了研究与教育例外情形，尤其是DSM指令第3条和《信息社会版权指令》（InfoSoc指令）第5(3)(a)条，后者还需结合DSM指令第5条进行解读。

研究还探讨了其他司法管辖区的情况，包括美国以及像韩国和新加坡这样采用了开放式合理使用风格抗辩的国家，以确定未经许可的人工智能训练（包括看似以研究或教育/学习为目的的训练）是否可能被视为合法。

主要研究发现

该研究探讨了两个关键问题：

在何种情况下，未经许可的人工智能训练可被视为等同于“研究”，甚至是在“教学”背景下的学习；以及商业人工智能开发者是否能够利用上述条款。

最终，这两个问题的答案都是否定的：不存在能够完全涵盖未经许可的人工智能训练活动的例外情形或开放式抗辩理由。

虽然未经许可的文本与数据挖掘在特定条件下可能属于例外情形的涵盖范围，但对于未经许可的人工智能训练而言，情况可能并非如此。这不仅是因为后者涉及的行为超出了欧盟和英国法律下可能适用的例外情形的范围，还因为它违背了合理使用分析中的关键因素。

该研究得出结论，为了解决并消除与人工智能训练相关的法律风险，包括最初以“研究”和“学习”为目的进行的训练，采用许可方式已经并将最终成为不可避免的选择，对于那些寻求在欧盟推出其模型的开发者来说尤其如此。

本文原文为英文，中文为机器翻译，仅供参考，如有问题或建议，欢迎随时与我们联系。

{{it.fileName}}

{{item.truncatedText}} {{item.basicDescription&&item.basicDescription.slice(0,70)}}{{item.basicDescription&&item.basicDescription.length>70?"...":""}}

关键词

{{it.keyword}}