参与支持

扫一扫关注

微信公众号

闫文军:人工智能训练中的著作权侵权问题思考

发布时间:2024-07-12编辑人:qing

2024年6月1日,由中国经济改革研究基金会、中国法学交流基金会、中国科学院大学科技与法律研究中心三方共同主办的2024“中国数字经济发展与法治建设论坛”在北京成功举办。论坛以“人工智能技术发展与法律应对”为主题,坚持数字经济发展与规范并重,突出高端、前沿、权威,着重政策阐释和数字经济发展趋势展望,旨在为进一步推动“人工智能+”及数字经济发展贡献智慧与力量。

论坛发布了“2024中国数字经济发展与法治建设”十个重大影响力事件。现场使用人工智能技术现场生成新闻通稿和会议总结稿,展示了AI技术在文字生成方面的强大能力,邀请来自立法机关、司法机关、群团组织、政府部门和经济界、科技界、法律界及产业界等15位嘉宾作主旨演讲及主题发言。

经发言嘉宾同意,论坛主办方将陆续刊发嘉宾发言,供大家学习交流。

人工智能训练中的著作权侵权问题思考


闫文军

中国科学院大学知识产权学院副院长、教授

中国法学会知识产权法学研究会常务理事

61.闫文军.jpg

尊敬的各位领导、各位嘉宾,下面我跟大家汇报一下我要讲的主题《人工智能训练中的著作权侵权问题思考》。

在人工智能训练的过程中,数据是最重要的一个资源,算法、算力和数据是人工智能的三大要素。数据要素在里面起了非常重要的作用,数据里面涉及到很多的作品,这些作品很多是受著作权保护的作品。在人工智能训练的过程中使用的作品是不是侵犯了著作权人的著作权,这个问题不是一个虚拟的问题,而是一个已经实际发生的问题。刚才姜院长的介绍他们受理的案件就有涉及到在人工智能训练中是不是侵犯了著作权的案件。在其他国家,特别是在美国、英国也都受理了类似的案件,在美国的案件里起诉的被告是OpenAI,是最著名的人工智能模型,它在训练过程中是不是侵犯了著作权,已经起诉到法院。这些案件绝大多数案件到现在都还没有做出判决,做出判决的是广州互联网法院在今年2月份判决的一个案件,这个案件被称为是全球首例涉及到AIGC平台侵权的第一案。这个案件里面涉及到的是奥特曼这个作品的著作权侵权问题,这个侵权问题在这个案子里法院认定的是输出的奥特曼的形象侵犯了著作权人的著作权。原告起诉的时候还有一个请求,请求在训练阶段把奥特曼这个形象从训练的数据库里面删除,也就是说不允许在训练阶段使用。针对这个请求,最后法院没有审理,认为起诉的被告并不是训练的主体,所以这种请求就没有支持。

这个案件虽然称为是AIGC平台侵权的第一案,但实际上它解决的的问题非常有限,即生成物和输入的作品是一个非常特殊的形象。第二个方面,这个案子实际解决的实质上还是输出端的侵权问题,而输入端训练阶段的侵权问题在这个案子里面并没有解决。虽然并没有解决,但是也引发大家的担心,输出阶段的侵权是不是认定训练阶段也会认为侵权,如果认为侵权,会产生什么样的后果。现在一般认为如果认定人工智能训练的阶段使用作品都侵权,这就严重的影响到人工智能的使用和发展。因为在训练阶段使用的作品的量非常大,如何识别哪一些是受著作权保护的,哪一些是不受保护的,如果识别了受保护的,能不能取得著作权人的授权,如果只使用不受著作权保护的这些作品,就会严重影响到AI的发展。针对这个问题,现在很多观点提出来我们又可以通过合理使用制度,在训练阶段使用作品一种合理使用。虽然我国《著作权法》对合理使用采用的是列举式的,这种情况没有在我国《著作权法》列举的范围之内,但是我们可以考虑按照国际公约规定的三步检验法,也可以参考美国的四个要素去认定它是不是合理使用。如果按照这个标准去判断,认定是合理使用应该是没有问题的,因为它不会影响原来作品的正常使用,也不会不合理的侵犯原来著作权人的合法权益。但是这种观点适用的还是单个作品,单个作品考虑的时候,我们要考虑输出的作品或者生成物是不是构成对输入阶段、训练阶段每一个作品的正常使用有影响的时候,这个时候可以说是对训练阶段使用的作品的合理使用。

比如说北京互联网审理的“文生图”案件讨论的问题是生成的图像是不是受著作权保护的问题,而生成这个图时人工智能平台在训练阶段肯定是使用了很多类似的作品,训练阶段使用的作品有没有侵权,其实并没有引起大家的注意,或者没有引起争议。为什么没有引起争议?因为它生成的图和原来输入阶段、训练阶段使用的已经不一样了。不一样的情况下,著作权侵权判断中的一个原则或者一个标准,要相似才能去考虑侵权。也就是说,这个阶段连实质相似都没有,适用合理使用的场景都没有,根本没有机会去考虑是不是合理使用。

63.1闫文军.jpg

从另一个方面看,人工智能训练阶段使用作品的情况下,其实它不是对单个作品的使用,而是对大量作品的使用。如果认定是合理使用,可能对单个的作品来说认定合理使用没有问题,但是对整个作品来说或者整个作者群来说,则会产生不利的影响。这种影响表现在人工智能生成物或者生成的作品会冲击已经有的作品,因为受人工智能生成物的冲击,自然人创作的已经有的作品价值会降低,从事创作的人也会减少。在这种情况下,文化的繁荣就会受到影响,可能从事创作的人会减少,新作品的产生会减少。人工智能可以把不同风格的作品汇集在一起,但是如果人工智能创作的这类作品大量使用,人工创造产生新的风格、产生新的作品可能就会减少,我们就很难见到人创作的新风格。因此,如果对人工智能训练使用作品的行为都认定为合理使用,就意味着对所有的作品都可以不付任何费用就能使用的情况下,对整个作者的主体或者整个文化繁荣从长远的角度来说肯定是会受影响的。

在这种情况下,我们需要考虑AI技术的发展和法律制度之间的关系。法律制度不能阻碍有用技术的发展,另外技术带来的问题应该通过法律制度去解决。如果说技术发展导致了文化繁荣受到影响,这也是一个问题,这个问题也需要去解决。在人工智能训练过程中使用作品的问题上,一方面是要保障和促进人工智能的发展,另一方面我们还需要促进文化的繁荣。围绕这个目标,现在不管是认定侵权还是认定不侵权,实际上这个目标都很难达成,因为两个极端都是不可行的。可行的一种方式是采用类似于法定许可的方式,也就是说使用是可以使用的,但是在取得收益以后,有一部分收益要分配给在训练过程中使用了作品的著作权人,这样从长远的角度来讲还能够保持创作的繁荣。有关立法还没有这样的制度,但是立法已经为制度的实施奠定了基础。比如欧盟的《人工智能法案》就推进了要披露受训练的数据,美国也提出一个法案,要披露训练过程中使用的数据。英国对这个问题的研究,也是认为人工智能使用他人作品如果不付报酬也是不公平的。在这种立法的背景下,我们下一步在确定了使用了哪些作品,人工智能产生了利益以后,从利益中拿出一部分来分配给在人工智能训练过程中使用的作品的著作权人,既保持了人工智能的发展,也会保持文化的繁荣。

以上就是我汇报的主要内容,谢谢大家!



闫文军2024中国数字经济发展与法治建设论坛上的主题演讲