
业内人士指出,本案远远超出了人工智能版权纠纷的范围。大英百科全书正在对人工智能时代的“源秩序”发起反击,从传统的版权侵权到新型的商标版权纠纷,从训练数据的“输入端”到生成内容的“输出端”。
本案第一个问题是,人工智能模型在学习(数据输入)阶段获取数据的行为是否构成著作权侵权。据路透社报道,大英百科全书在一份报告中称laint 于 3 月 13 日提交文件称,OpenAI 使用了大英百科全书中约 10 万篇在线文章、百科全书和词典条目来训练其聊天机器人 ChatGPT 如何回答用户的问题。抄袭活动“系统化、规模化”。投诉称,ChatGPT “搭便车”大英百科全书的高质量、可信内容,并将后者内容的价值无偿转移给 OpenAI。
OpenAI 发言人在回应 3 月 16 日的诉讼时表示,“我们的人工智能模型旨在推动创新,他们的训练基于公开数据,并遵守‘合理使用’原则。”这是lAI行业正在对抗版权诉讼的标准防御框架,该公司表示,认为将受版权保护的内容转换为训练数据是一种“转换使用”,不应受到版权的限制。
然而,本例的独特之处在于大英百科全书内容的性质由AI sed。与常规网站或新闻信息不同,百科全书条目和词典定义经过严格的编译、审查和更新过程,使其独特且可靠。产品受版权保护,具有稳定的商业价值。当人工智能模型吸收这些类型的“高质量结构化知识系统”而不是来自互联网的分散信息时,“变革性使用”的局限性将被重新考虑。
值得注意的是,大英百科全书并没有被动等待违规行为的产生。诉状称,该公司于 2024 年 11 月主动联系 OpenAI,探讨许可合作的可能性,但 OpenAI 尽管与其他类似出版商有许可协议,但“没有认真考虑许可”。
事实上,当前的一些学术研究表明,在生成式人工智能时代,数据“不再局限于静态内容,而是渗透到每一个角落”。“人工智能生命周期的各个阶段,从构成模型参数的训练样本,到驱动现实世界部署的文字和结果。”这意味着传统的“输入端”合规控制可能不再涵盖仍在模型中发挥作用的整个数据管道。大英百科全书提起的诉讼触及了这个中心矛盾。即使形成阶段的副本被认为是“变革性的”,但如果这些内容通过不断的重复使用,权利人的控制权又该如何保障?模型结果?
人工智能的记忆化再次出现并引发批评
如果说关于形成阶段的争议还可以在“转化使用”的框架内讨论,那么大英百科全书带来的与“输出阶段”相关的指控则将OpenAI直接推入了传统上被禁止的版权侵权领域:复制。
大英百科全书包含详细的比较证据在周三的投诉中,指责 ChatGPT 在响应用户请求时制作与原始作品“完全相同或非常相似”的内容。诉讼称:“ChatGPT 复制了原告受版权保护的内容的语言、含义和信息,并将其重新包装以供消费者使用。ChatGPT 没有添加任何新的语言、含义或信息。” OpenAI还利用人工智能生成相关内容摘要并“共享”大英百科全书的网络流量。我会吃掉它。
这是当前人工智能版权诉讼中最具争议的核心问题。该模型是“抽象学习”还是在一定条件下对原文的“记忆”再现?当用户输入“给我大英百科全书有关教育的文章”时,ChatGPT 生成的内容几乎与原始内容相同。在这种情况下,AI不再被动地“学习”知识,而是主动地“服务”受版权保护的源材料。
从数据保护从角度来看,这种现象揭示了一个深刻的困境。当数据包含在模型的训练中时,其存在形式从根本上改变了独立且可区分的任务,具有分布式且难以跟踪参数和权重。大英百科全书证实 OpenAI 使用了大约 100,000 篇文章,但指出“复制的真实程度只有 OpenAI 自己知道”。这种信息不对称自然使权利人在维护自己的权利时处于弱势地位。
提出停止侵权并赔偿的索赔
有媒体分析认为,大英百科全书诉OpenAI案中最引人注目的创新不是版权,而是商标和来源注释。投诉称,OpenAI 不仅暗示其有权复制大英百科全书的内容,而且还在其“幻觉”人工智能生成信息中不当引用了大英百科全书。对其作出不实陈述。已有 250 多年历史的权威知识机构。
这涉及版权法之外的深层次问题,例如人工智能时代如何保护“来源的真实性”和“商标签名的权威性”。内容对于百科全书、词典等知识品牌来说固然重要,但真正缺少的是长期被社会认可的可信来源的身份。如果AI生成了带有大英百科全书名称的错误内容,不仅会损害特定条目的点击量,还会损害品牌所代表的知识权威。
西方媒体将这起诉讼标记为版权所有者针对未经许可使用这些数据训练人工智能系统的科技公司提起的诉讼。其中发起的众多维权活动之一。大英百科全书对人工制品提起了类似的版权诉讼去年,智能初创公司 Perplexity AI 案仍在审理中。
业内人士表示,该诉讼是继大英百科全书起诉Perplexity AI之后,传统知识机构对AI时代“源头秩序”的一次重大反击。 OpenAI 声称进行了“合理使用”辩护,但该诉讼可能会合并为纽约南区的多区诉讼(MDL),并将与《纽约时报》和其他诉讼一起审理。最终裁决可能会重塑整个人工智能行业的规则。
大英百科全书在诉状中称,法院命令禁止 OpenAI 侵权,并要求 OpenAI 支付一笔金额不详的赔偿。目前,无论本案未来结果如何,人工智能的发展不应以“本源秩序”的解体为代价,数据保护也必须与技术相适应,已形成基本共识。AI时代的本质特征。
□ 王毅指定[石慈编]
八个国家真的想保护霍尔木兹吗?
“梅姨”被捕,律师称“最高刑罚是死刑”
109个大项目高质量发展规模化。
“最富有的国家从最贫穷的国家偷钱”
在美国和良心之间,这位美国官员选择了良心。
这辈子,你一定要去长江入江西的第一站。
央企投资千亿新疆打造能源“双保险”
美国对日本施压
战斗机的命名规则是什么?国产“龙”战斗机回顾
值此“腾飞”一周年之际,低迷的香港经济表现如何?
今年反垄断法应该做什么?国家市场监管总局回应三里河
你可以做任何事明天开始时间!保留这份计算个人税的实用指南。
台当局:相互反制!韩国网友称“零伤害”
春分遇到“龙抬头”,你的运气会加倍吗?
“钱袋子”被炸,伊朗猛烈攻击美国盟友
两个“超自然”机会为未来五年带来了新的机遇。这份榜单十分亮眼:中国上升了 9 位,美国下降了 11 位。
长城脚下的“临时父母”:他们守护着飞下山的孩子