时间:2025-09-02
发布时间:2025-09-02
过去几年间,生成式人工智能(AI)迅猛发展,这些系统在生成类似人类的文本、图像和音频表达方面的能力迅速提升。OpenAI的GPT-4(大型语言模型)、Stability AI的Stable Diffusion(文本转图像生成器)和Meta的MusicGen(可控音乐生成转换器)等旗舰模型,彰显了该技术的巨大飞跃。这些系统迅速吸引了庞大的用户群体。然而,它们也引发了关于跨司法管辖区侵犯版权作品风险的紧迫问题。
主要关注点集中在训练阶段,大多数生成式人工智能系统会摄入海量数据集,其中往往包含大量未经版权所有者明确授权的版权作品。例如,对Books3数据集的调查显示,其中包含19.1万本盗版书籍——许多仍在版权保护期内——这些书籍被用于开发Meta的LLaMA和彭博GPT等模型。类似争议也出现在其他数据集上,如The Pile,这是一个包含从众多在线资源库抓取的虚构和非虚构作品的数据集。这种未经授权使用版权作品进行训练的做法,引发了关于直接侵权的重大法律问题,目前在国际上正通过不同视角展开激烈辩论和深入探讨。
尽管训练过程本身的合法性是一个涉及美国“合理使用”原则(或欧盟/英国的特定例外情形)等学说的关键且复杂的问题,但本文主要聚焦于一个相关但截然不同的挑战:生成式人工智能系统输出内容可能引发的版权责任,以及现有中介责任限制(安全港)对参与创作和传播这些输出内容的各方的适用性。据报道,人工智能驱动的工具生成的输出内容与受保护的表达极为相似,甚至直接复制了受保护的表达。在OpenAI诉讼案中,原告作家声称,ChatGPT可被诱导输出其作品的“非常准确的摘要”。这些披露引发了法律纠纷,并引发了人们的担忧:在用户指令下,生成式人工智能的输出内容在某些特定情况下,可能与受版权保护的作品实质性相似,足以构成未经授权的复制或侵权衍生作品。
在美国,长期以来为中介提供免责保护和法律确定性的法律制度是《数字千年版权法》(DMCA)所确立的安全港框架。该框架在激励中介采取措施减少侵权行为的同时,为其提供了法律保障。1998年颁布时,《数字千年版权法》的安全港主要旨在保护当时普遍存在的在线中介——如互联网接入提供商、网络托管服务和早期形式的在线平台——免于为用户提交的侵权内容承担责任,前提是它们遵守特定的程序性和实质性保障措施。这一框架后来对YouTube和社交媒体平台等服务的运营至关重要。尽管该模式在全球范围内具有影响力,但它正面临生成式人工智能的挑战。
生成式人工智能至少在三个核心方面颠覆了《数字千年版权法》第512条等框架的基本假设,这些挑战在全球范围内的讨论中均有所体现。首先,人工智能输出内容的责任通常在供应链中的多个参与者之间分散:数据供应商、模型开发者和模型部署者。其次,生成式人工智能提供商并非传统意义上仅托管或传输用户上传文件的角色;相反,他们积极参与生成输出内容,这削弱了中介是被动渠道的假设。第三,《数字千年版权法》的通知-删除机制等——旨在针对离散且稳定的侵权文件——难以适应人工智能生成作品动态生成并直接交付给用户的方式,这使得版权所有者难以检测和删除侵权内容。
简言之,简单地将《数字千年版权法》等传统安全港框架应用于生成式人工智能,忽视了这些系统核心的复杂生态系统和动态、不透明的内容生成过程。这些缺陷可能会削弱人工智能供应链参与者(包括投资者)的法律确定性,并无意中抑制创新。或者,当大规模侵权内容出现时,它们可能会使作者和版权所有者缺乏足够的救济措施。尽管这种紧张关系日益加剧,但全球政策制定者、法院和学者尚未就如何最佳调整中介责任制度达成共识。当前的辩论往往聚焦于人工智能生成输出内容能否获得版权保护、作者身份如何重新定义,以及合理使用或侵权标准是否需要修订等问题。
本文以美国法律为详细案例研究,为这一国际讨论做出贡献,并提炼出具有普适性的原则。特别是,该提案展示了如何将《数字千年版权法》的有条件免责协议进行现代化改造,以适应大规模、多参与者的人工智能系统,然后将其移植到已在更新自身规则的其他司法管辖区。对于欧盟而言,该框架可为《数字服务法案》(DSA)下的安全港适用提供参考,与《人工智能法案》对通用模型的透明度和文档记录义务相契合,并提供基于角色的责任保护。它还可能为解释欧盟其他条款中的类似义务提供见解,如《数字单一市场版权指令》(DSMD)第17条。在英国,它为知识产权局2024-2025年关于脱欧后文本与数据挖掘(TDM)例外以及人工智能输出内容侵权和责任的咨询提供了具体模板。对于正在审查人工智能提供商对终端用户侵权责任的香港,该模型展示了如何在其现有的技术中立《版权条例》上嫁接分层义务。通过展示在何种情况下以及为何重新调整后的《数字千年版权法》式有条件免责仍然有效,本文旨在为这些司法管辖区的立法者和监管者提供一套即插即用的设计选择,而非要求全盘复制美国蓝图。
第二节首先探讨《数字千年版权法》的安全港条款是如何从围绕被动中介构建的法律环境中产生的,然后阐述生成式人工智能如何颠覆第512条的基本假设——这些问题对依赖类似概念的任何司法管辖区均具有相关性。第三节提出“人工智能港湾”提案,为数据供应商、模型开发者和模型部署者分配特定角色义务,创建分级免责方案。第四节评估潜在批评,包括行政可行性以及与合理使用等学说的相互作用,同时考虑现有系统中观察到的挑战。最后,第五节得出结论。
来源:https://academic.oup.com/jiplp/advance-article/doi/10.1093/jiplp/jpaf043/8221820
本文原文为英文,中文为机器翻译,仅供参考,如有问题或建议,欢迎随时与我们联系。