生成式AI工业机器人时代的著作权之困

发布时间：2023-04-12 09:38:46 所属栏目：外闻来源：

导读：美国《华尔街日报》刊发了一则新闻：拥有《纽约邮报》、《巴伦周刊》、《华尔街日报》等媒体的美国新闻集团正准备通过法律程序向Ope－nAI、微软，以及谷歌等应用内容训练AI的技术制造商寻求赔偿。这一则新闻又一次将

美国《华尔街日报》刊发了一则新闻：拥有《纽约邮报》、《巴伦周刊》、《华尔街日报》等媒体的美国新闻集团正准备通过法律程序向Ope－nAI、微软，以及谷歌等应用内容训练AI的技术制造商寻求赔偿。这一则新闻又一次将生成式AI所引发的著作权难题摆到了人们的面前。

从去年下半年开始，包括ChatG－PT、Dall-E2、Midjourney在内的大型生成式AI模型如雨后春笋一样出现。利用这类AI，人们可以非常容易地通过简单的提示语（prompt）来生成各种文本、图片、音频、视频，甚至原宇宙中的各种三维模型。

生成式AI的崛起一方面极大地释放了人们的创造能力，让人们生产内容的成本大幅度降低了，但另一方面也引发了一系列的问题。在这些问题中，知识产权，尤其是著作权问题就是最为棘手的之一。

从总体上看，生成式AI涉及的著作权问题体现在两个方面：一个方面是，在训练的过程中，AI模型需要用到大量的数据，在此过程中就可能造成对一些著作权所有人权利的侵犯；另一个方面则是作为非人主体，AI是否可以享受传统上只有作为人才能享有的著作权。随着生成式AI的迅速发展和普及，这两个问题都已经不再是理论上的难题，而是紧迫需要解决的现实问题了。

具体来说，这个事犯会发生在数据获取和数据生成两个环节：

在对AI模型进行训练之前，首先需要从数据源获取数据，然后对数据进行一定的整理和标注。而在抓取或下载数据的过程中，可能并未得到著作权所有人的授权，这种行为就可能会涉及对著作权中“复制权”的侵犯。

在搜集到了数据之后，AI会对数据进行学习，从中提取关键信息，然后根据这些特征来生成新的数据。由于新生成的数据是根据训练数据中提取的某些参数得到的，所以它就必然和训练数据这个整体在某种程度上具有相似性。这在大多数时候并不会有问题，但在某些生成算法下，AI生成的数据可能会十分类似于某一个具体样本点。

当然，尽管相关的风险非常大，但抓取数据训练AI是否构成了对著作权的侵犯还需要看这种行为究竟是不是对著作权的合理使用。在各国的法律中，都规定了人们在某些特定的情况下可以在没有征得权利人许可的情况下自由使用著作权，并且不用对其支付报酬。比如，出于个人的学习、研究、欣赏等需要，对他人已经发表的作品进行使用，一般会被视为合理使用；为了教学研究等目的，少量复制他人的著作，通常也不会被认为是版权侵权行为。

一种观点认为，既然个人学习是合理利用，那么机器学习本质上也是一种学习。我们不会认为一个人读了某本书的章节，然后发表了某些和书上类似的观点就认为他是一个侵权者，那么又有什么理由认为AI做了类似的事情就是侵权呢？

另一种观点则与之截然相反。这种观点认为，合理使用的前提是使用的主体应该是人，AI连人都不是，因而它对数据的学习甚至连使用都无从谈起，又怎么能称得上是合理使用呢？与此同时，法律在判断是否是合理使用时，通常以使用规模仅是“少量”为前提。而在现实中，出于训练AI的需要，技术制造商们恨不得将相关数据来个“连锅端”，这怎么也算不上是“少量”，因此也就自然难以被合理合法地认定为商标或是商标的合理使用了。

一些专家认为，答案是否定的。他们的理由很简单，人们在使用AI模型生成作品时，自己出的力是很少的。比如，我们让ChatGPT写一个命题作文，它二话不说就写出了一堆长篇大论，在这个过程中，人们唯一需要做的只是耐心等待而已。在这种情况下，怎么可以认为AI生成的作品是一种智力成果呢？

另一些专家则提出了与之完全相反的观点。这些专家认为，虽然在AI生成作品的过程中，出的力是很少的，但是他们却在一些关键的环节进行了把控。比如，用ChatGPT生成文档时，提示语是非常重要的。善于用提示语的人甚至可以让AI直接生成一整篇优秀的论文，而不善于用提示语的人用同样的AI却只能生成一堆废话。由此可见，人的因素在作品的生成过程中是相当重要的。这就好像在照相技术发明后，人们都可以用相机来拍照，但要拍出优秀的照片依然需要摄影师的精心构思和高超的拍摄技巧。既然我们认为摄影师用相机自动生成的作品是一个智力成果，那么又有什么理由认为用户通过提示语让AI生成的作品不是智力成果呢？即使我们不认可以上的推理，那么AI本身又是由什么创造的？是AI的设计者。因此，AI本身也是人类智力成果的体现。既然如此，那么作为衍生品，AI生物自然也是智力的结晶，一种智力成果。

一些专家认为AI生成物并不具有独创性。因为所谓“独创性”，就必须有“独”和“创”两方面的特征。所谓“独”就是作者进行了独立的构思和创作；“创”则是指作品要具有创造性，能和其他作品具有显著的不同。在他们看来，对于“独”的要求，AI是无法满足的。因为从本质上讲，AI的作品只是一系列根据预先编好的程序完成的指令，它们只是对训练集中各种数据的一种拼接——一些言辞比较激烈的人甚至将AI作品称为“用其他作品的‘尸体’缝合起来的弗兰肯斯坦”——很显然，在他们看来，这种弗兰肯斯坦式的怪物身上并不是哪个人独立构思的结果，因而也就很难称得上是独创了。

另一些专家的意见则相反。在他们看来，人们用AI工具生成作品的构思中，依然是要进行构思的。事实上，如果想用生成式AI来创作一个好的作品，可能需要用提示语进行几十、甚至上百轮的交互，这个过程其实就是一种低代码的编程。没有人会否认在编程的过程中，人们需要进行独立的构思。同样的，对于在这种低代码编程工作中的独立构思也就应该被承认。从这个意义上看，用不满足“独”的特性来否认AI作品的独创性是不成立的。至于“创”，也就是AI作品与其他作品之间的相互区别，这在大部分情况下都不是一个问题。基于以上分析，针对于这部分行业内的专家大多数主张应该更多地认可这部分AI的作品并不一定具有独创性。

（编辑：汽车网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!