周劲黎|人工智能生成内容的可版权性及默认权属分配

面对人工智能带来的著作权法前沿问题时,应充分考虑已有制度工具的潜在回应能力。独创性的选择概率标准是指,如果信息内容的产生概率较低而不容易出现偶然一致,且在因果链条上是由非抄袭的、容易识别的人类选择导致的,则该表达具有独创性,著作权默认属于作出选择的主体。选择概率标准能够得到不同法域司法实践及著作权法一般理论的支持。根据选择概率标准,人工智能生成内容通常具有可版权性,其著作权默认归属于在内容生成过程中做出相应选择的主体。如果内容生成过程中存在多方主体的选择,则应将生成内容默认视为合作作品。当这种合作作品的制度安排不能适应特定产业的实践需要时,市场可以提供激励,促使相关方通过协议重新约定合适的权属规则。

引言:运用已有制度工具回应前沿问题

随着技术发展,生成式人工智能开始在社会实践中得到广泛使用。技术的快速发展也为法律带来挑战,近年来,法学界关于人工智能生成内容(AIGC)著作权相关前沿问题的讨论屡见不鲜。就研究视角而言,相当一部分研究热衷于分析人工智能是否应具有法律主体资格,能否构成著作权法中的作者。另一部分研究则着力于运用职务作品或雇佣作品制度,来确定人工智能生成内容的可版权性及相应权利的默认归属,这种观点的潜台词,也是承认人工智能事实上的作者身份(作为被“雇佣”的创作者)。

然而,这种将人工智能视为作者的见解,并不完全符合相关产业技术人员目前的实际感受。一项美国的实证调查研究显示,人工智能和机器学习方面的计算机专家及编程技术人员认为,人工智能将在很大程度上扮演“艺术家助手”的角色,或者纯粹作为艺术家及作家手中的工具,帮助人类更好地专注于工作中有创造性的部分。另一相关公认事实是,目前投入实际运用的人工智能,尚属于“弱人工智能”或“专用人工智能”,而非更高阶的“强人工智能”或“通用人工智能”,不具备在完全摆脱人类干预的情况下,自主产生作品的能力。

更重要的是,在以Dreamwriter案为代表的已有涉及人工智能著作权问题的法律纠纷中,法院并未展开对人工智能主体资格的详细讨论,或者尝试诉诸职务作品制度,而是仅通过分析著作权法中的独创性概念的适用,就比较顺利地说明了涉案人工智能生成内容的可版权性及相应权属分配。从判决的社会效果来看,以Dreamwriter案为代表的裁判结果不仅没有引起相关产业从业者的广泛反对或非议,还被评选为2020年人民法院十大案件之一。这一事实说明,尽管人工智能看似带来了许多新颖的法律问题,但已有的著作权法制度框架并不一定因此受到特别实质性的挑战,存在通过既有制度工具有效回应相关问题的可能性。

本文承认,在一定情况下赋予人工智能法律主体地位或作者身份的做法不失为一种可能的制度方案,相关讨论也有其理论价值。但“如无必要,勿增实体”,在没有充分论证必要性的情况下考虑激进的制度改革措施,一方面可能过分夸大了一些问题的应对难度,另一方面可能带来许多意料之中更为复杂的新问题。因此更为优先的思考路径,应当是回到基本的法律原理框架,充分考察并发掘已有制度工具蕴含的回应能力。

这种考察已有制度工具回应能力的思路,也有助于我们反思既有基础理论的含混不清之处和有争议的内容。例如,因循这一思路的学者,已反思分析过“思想”“人格”等概念不具备著作权法上的规范意义;人类的创作过程其实与人工智能生成信息内容的过程有逻辑一致之处;浪漫主义作者观既可以支持人工智能可以作为作者,也可以否认之,因而在相关问题的分析上缺乏有效性。不过遗憾的是,尽管这些学者的论述确有很多真知灼见,但批判反思之余,并没有在现行制度的体系下,充分建立起有效处理人工智能生成著作权法问题的法律适用框架。有鉴于此,本文将从独创性这一基本概念出发,探讨其应有的法律内涵,以及如何在人工智能生成物的场景下适用之。

本文留意到,Dreamwriter案中法院对人工智能生成内容独创性的认定,其实是通过考察如下两方面内容完成的:其一,法院认为涉案人工智能生成内容是独立创作完成,并且在表现上与已有作品存在一定程度的差异,因而具有“最低限度的创造性”;其二,涉案人工的生成过程包含原告公司内部主创团队的一系列“选择”:包括选择数据类型的输入与数据格式的处理、选择触发条件的设定、选择文章框架模板的选择和语料的设定、选择智能校验算法模型的训练方式等。这些选择决定了Dreamwriter生成内容的来源素材、决定表达的主题、写作的风格以及具体的语句形式,因此可以认为生成内容的表现形式源于原告公司的选择,具有一定的独创性。

本文认为,这两方面的独创性认定分别隐含了如下两层含义:其一,涉案人工智能生成内容不是抄袭得来,并且是一个创作偶合可能性低的结果(与已有作品相比有一定程度的差异,且这种差异可以体现出“最低限度创造性”);其二,这种内容的产生,在因果关系上是由可识别的人类主体的选择所导致的——这两层含义分别意味着,涉案内容具有可版权性,且著作权归属于做出选择的主体。

这种对创作偶合可能性以及主体选择的关注不仅出现于Dreamwriter案中,也见于其他法域关于作品独创性的分析,是世界各不同法域法院在审理各类著作权案件中的通行做法,具有相当程度的普适性。因而可以就此提出一种科学的独创性认定思路,本文称之为“选择概率”标准。这一标准的基本含义为:如果信息内容的产生概率较低而不容易出现偶然一致,且在因果链条上是由非抄袭的、容易识别的人类选择导致的,则该表达具有独创性,著作权默认属于作出选择的主体。本文第二部分将正式提出判断独创性的选择概率标准,对之进行定义和说明,并论证该标准的合理性;第三部分将讨论选择概率标准理论在人工智能生成内容相关著作权法问题上的适用,包括此种内容的可版权性问题,以及相应的著作权权属分配问题;第四部分将总结全文的基本结论。

一、判断作品独创性的选择概率标准

著作权的保护对象为人类可感知的特定类型的信息内容,而独创性是表达获得著作权法保护最为重要的实质性先决条件。本文所称的判断表达独创性的选择概率标准是指:如果某一信息内容的产生概率可以定性地被认为是较低的,以至于实践中不容易出现偶然一致的情况,并且因果链上,该表达的产生是由非抄袭的、容易识别的人类选择所导致的,则如此产生的表达具有独创性,在满足其他作品要件要求的情况下,可以构成著作权法中的作品,且著作权属于作出选择的主体。

选择概率标准的核心要点有二:其一,任何信息内容的产生都可以被看作一个概率性事件,其中产生概率小的信息可以受到著作权法保护;其二,信息内容的产生与可识别的人类选择有关。为帮助读者理解选择概率标准,下文将分别阐述这两项要点。

选择概率标准的第一项要求是:信息内容的产生概率较低,不容易出现偶然一致的情况。为帮助理解这一要求,需要首先对作品的创作过程进行理论重述:传统上,人们很容易想当然地将作品的创作过程视作一种“无中生有”的过程,但事实上这种理解并不准确。许多研究者指出,真实的作品创作过程很难说是绝对意义上的无中生有,在多数情况下,创作更像是对已有元素的重新排列组合,著作权法关于汇编作品的规定,以及一些司法实践都体现了这种创作观。

具体而言,请考虑如下事实:任何作品都可以视作相当数量的独立信息表达单元的组合,以某种排列方式构成的信息内容。举例而言,贾岛的唐诗《题李凝幽居》可以看作四十个中文汉字的组合,按照特定顺序排列构成的表达;歌曲《茉莉花》可以看作若干音符的组合,按照特定顺序排列构成的表达;名画《蒙拉丽莎》可以视作若干呈现出不同颜色的像素点或色块的组合,按照一定方式排列构成的表达。由此,可以将特定信息内容的产生(创作),看作确定一种排列组合方式的过程。

进一步地,可以将信息表达单元的每一种排列组合方式看作一个统计学意义上的“基本事件”,将这些排列组合方式的集合看作“样本空间”,由此得出特定信息表达方式出现的概率,等于该信息表达所涉及的独立信息表达单元排列组合的方式,在该相应样本空间中的概率。

选择概率标准要求特定信息内容的产生概率可以定性地被认为是较低的,不容易出现偶然一致的情况。这一情况的反面,即产生概率较大的信息内容,通常是指如下几类情形:

其一,信息内容的信息量较小,导致对应的样本空间所含的基本事件数量相对有限,因此该样本中的每一种事件都可以被认为是大概率的。著作权法的理论认为短语、口号、词汇等一般不能构成作品,按照选择概率标准,这是因为“我爱你”这样的短语或“汽车”这样的词汇可以拆分出的独立信息表达单元太少,导致相应的排列组合的可能选择也相对较小,整体的样本空间较小,信息内容产生的概率大。文字表达之外的领域也存在类似情况,一些简单的视觉设计,对此也显然可以用图案的信息量小,导致样本空间较小、信息内容出现概率较大来解释。

其二,为了实现特定目的,一些信息内容被认为是必需的,因此有相对较高的出现概率。著作权法中有所谓的“功能性原则”,即实现特定功能目的而作出的设计表达有较大可能不受法律保护。依据选择概率标准,这是由于为了实现特定的实用功能,只能在采取唯一的信息表达单元排列组合方式,或在数量有限的排列组合中做选择(所谓“技术功能决定的表达”),致使相应信息内容出现的概率较高。类似地,著作权法中的“必要场景原则”和“混同原则”也可以用选择概率标准来解释:前者是指在文学、戏剧等类型的作品中,如果根据相关背景在表达某一主题的时候,必须描述某些场景,则对这些场景的表达不受著作权法保护;后者是指如果一种“思想”实际上只有一种或非常有限的表达,那么这些表达也被视为“思想”而不受保护。显然,在这两项原则所关切的情况下,都存在为实现特定目的,而有较大概率被采用的信息内容,因此这两种教义原则也符合选择概率标准的指引。

这两种情形之外的信息内容,一般可以被认为是产生概率较低的,可以满足选择概率标准的第一项要求。遵照这一指引,司法实践中相关方可以通过举证信息内容包含众多表达元素、信息量大、不容易出现偶然巧合一致来证明相关信息内容表达满足选择概率标准的第一项要求。

选择概率标准的第二项要求是:因果链条上,信息内容的产生是由非抄袭的、容易识别的人类选择导致的。需要强调的是,这一要求不仅影响信息内容的独创性判断,还关乎信息内容著作权的权利归属:对于符合选择概率标准而具有独创性的作品,其著作权原则上属于作出相关选择的主体。

这里首先说明“信息内容的产生是由人类的选择所导致”的基本含义。在多数情况下,低概率信息内容的出现,显然是由人类的选择所直接导致。如前所述,作品可以看作一系列独立信息表达单元的排列组合,其具体内容全赖于人在可能的排列组合方式中选择何者。例如唐诗《题李凝幽居》的出现,既包含了贾岛对单个信息单元的选择(选择“僧敲月下门”而非“僧推月下门”),也包含了贾岛对这些信息单元排列方式的选择(选择“僧敲月下门”而非“月下僧敲门”),这些选择直接决定了《题李凝幽居》的内容;绘画《蒙娜丽莎》的出现,包含了达芬奇对画布上每一位置呈现何种颜色、以及这些颜色组合方式的选择。

在其他一些情况下,尽管人类选择对作品内容的决定性作用表现得不明显,但在因果链条上,作品的产生确实可以追溯到人类作出的选择。例如著名美国艺术家波洛克(Pollock)所创作的一系列“滴画”(Drip Painting),十分像随机地将颜料随机泼洒到画布上的结果,似乎波洛克并没有通过某种选择直接决定画作的内容。但在逻辑的因果链条上,正是由于波洛克选择了在特定的位置和时间,用一定的力度泼洒颜料,这些颜料才会在随后受重力及风力影响,根据自然规律降落于画布的不同位置。换言之,画作内容在客观上为波洛克关于泼洒颜料的各种选择所决定。再以人使用智能相机照相的过程为例,人在按下快门后,相机会对拍摄的图像进行一定的修改调整,似乎相机呈现的画面不完全是由人类的选择所决定的。但在因果链条上,如果没有人类选择在特定的时间、地点和位置、选择特定的拍摄对象按下快门,数码相机也没有修改调整的素材。事实上,在人类的选择决定了最初输入给相机程序的信息素材后,相机最终的输出结果也相应地确定了。

综合上述分析可知,在绝大部情况下信息内容的产生在因果链条上都与人类选择有关,例外情形可能是自然山水风光、湖中月影风景等几无人类行为干涉的、被一些学者称为“大自然的杰作”的信息内容。

在明确“信息内容的产生是由人类的选择所导致”的基本含义后,还需进一步分析,在何种情况下这种人类选择是“容易识别的”“非抄袭的”。其中“非抄袭”的含义相对清楚,是指在接触他人已有信息内容的情况下对信息内容进行复制或模仿。

“容易识别”要件的基本含义为,查验在信息内容产生过程中作出相关选择的主体的操作成本相对较低。具体而言,当信息内容的产生过程只能追溯到数量较少的人类的选择时,相关的查验成本应当是相对较低的。举例来说,无论是达芬奇创作《蒙娜丽莎》那样标准的绘画创作过程,还是波洛克创作“滴画”那样非主流的创作过程,只要信息内容产生过程中作出相关选择的主体的数量相对较少(在达芬奇和波洛克的例子中都只有一人),那么查验相关主体的操作成本都不会很高,可以满足“容易识别”要件。

不满足“容易识别”要件的,主要是类似于下列情况的情形:某家五金店的地板上滴落的油漆图案构成了一幅“抽象画”,而构成这幅画的滴落的油漆来自五金店里来来往往的顾客。在这一例子中,尽管油漆“抽象画”信息内容的产生在因果链上可以追溯到人类选择(顾客的行为导致油漆滴落到相应位置),但查明具体是哪些顾客的成本应当是非常高的(或者几乎不可能查明的),不满足“容易识别”要件。

本文提出的选择概率标准虽然看似陌生,但实质上其在各主要法域的司法实践中都有迹可循:尽管在理论上,不同国家的著作权法采取了“最低限度的创造性”“作者个性”等标准,但它们都具有较高的抽象模糊性。在讲求统一裁判标准、客观中立的司法裁判中,法官不可能全然依赖这些抽象标准,而会对之进行一定的“实用性转化”,即将这些高度抽象性标准在具体的法律适用中,落实为一种相对具象的、客观程度相对更高的、更具备可操作性的标准。根据本文的观察,各主要法域的司法实践其实都将各自的独创性标准或多或少地,落实为本文所谓的选择概率标准,着重考察作品创作者的选择以及相应信息出现的概率,详述如下:

在1991年的Feist案中,美国最高法院确立了美国法现行的独创性标准——“最低限度的创造性”标准。尽管在该案中美国最高法院并未对“最低限度的创造性”这一含义模糊用语给出明晰定义,但仔细研读判决,不难发现其对独创性的认定,实际上是通过考察相关方对信息内容的选择完成的。该案的争议对象为汇编客户名称、电话号码等事实信息的号码簿。美国最高法院着重考察了原告对所汇编内容的选择与安排方式,并认为该案中原告按照字母顺序排列所汇编内容的做法,属于“机械而常规”之举,所得出的号码簿“平凡普通”,进而不能满足“最低限度的创造性”标准。

从选择概率标准的角度来看,法院认为按照字母顺序排列相关内容的“常规”“平凡普通”,其实就意味着实践中基于方便查阅等原因,按照该种方法排列信息内容的概率是相对较高的(不同的人有可能基于便于查阅的目的,都对相关号码按照字母顺序进行排列,从而出现偶然一致的情况),故不能满足独创性要求。美国也有学者认识到,Feist案中法院排除对字母顺序排列信息的保护的内在逻辑,和前文曾谈到的“场景原则”“等同原则”有一致性。进一步地说,本文认为如果Feist案中原告采取了一种非常规的、发生率较低的排列方式(例如通过扔骰子决定每条信息的排列顺序),则如此得出的汇编内容就可能满足美国最高法院所提出的“最低限度的创造性”。

Feist案之后,美国法院亦在涉及其他类型作品的著作权案件中着重考察了人对信息内容的选择,例如对“打砖块”电子游戏考察游戏设计方对相关图形元素的选择,对应摄影照片考察对拍摄对象、摄影角度、摄影光线的选择;对计算机程序代码,考察各部分的程序设计是否有多种不同选择。可以说这种对选择的关注,已经烙印于美国法院的司法实践中。

尽管在表面上,欧盟法律表现得深受大陆法系国家人格权理论影响,于相关欧盟指令中将独创性标准规定为“作者自己的智力创造”,并在指令前言中强调作品需“反映作者个性”,但在具体的司法实践中,欧盟法院对独创性的判定还是着眼于分析产生作品内容的人的选择。

根据欧盟法律,欧盟成员国法院可以通过预先裁决程序令欧盟法院间接介入国内案例,说明该案涉及的欧盟法律的具体适用方式。2009年的Infopaq案中,欧盟法院在分析报纸文章的可版权性时,强调“作者自己的智力创造”可以体现于对词语的选择、排列和组合中。2011年的Painer案中,欧盟法院认为涉案照片体现了摄像师对摄影背景、摄影对象姿势、光线、氛围、拍摄角度等要素作出了自由而具有创造性的选择,从而可能受到著作权法保护。

并且欧盟法院也会考察涉案信息内容,是否是为实现特定目的而必须如此的大概率信息。在BSA案中,欧盟法院认为成员国法院在分析软件用户操作界面的可版权性时,需要考虑操作界面各部分的排列组合方式是否为相关技术功能所决定,如是则不能满足独创性的要求。BromptonBicycle案中,对于涉案折叠自行车,欧盟法院同样要求成员国法院考虑在实现同一技术功能的情况下,自行车的造型设计是否有其他可能选择。欧盟法院的这一系列裁判契合于选择概率标准:对于具有一定实用功能的信息内容,如果为实现某种实用功能,必须选择某种设计或在某几种设计中做选择,则相应特定信息内容的出现概率会增高,从而不满足独创性要求。

类似的独创性认定方式也见于我国的法律实践。尽管通常认为按照最高人民法院于2002年公布的司法解释,我国法律在独创性认定上采取了所谓的“创造性”标准,但应当留意到,随着裁判经验积累,我国法院在独创性的判断上并未过分纠结于“创造性”这一抽象标准,而是更多地转向于考察作品的内容选择。

我国司法机关自主编写的审判指引性文件,在很大程度上来源于对实务审判经验的总结,可以反映实践中法院对一些法律问题的真实见解。2018年北京市高级人民法院编写的《侵害著作权案件审理指南》第2.2.条规定:“认定独创性,应当考虑如下因素:……;(2)对表达的安排是否体现了作者的选择、判断。”广东省高级人民法院于2020年发布的《关于网络游戏知识产权民事纠纷案件的审判指引(试行)》,强调法院在审查游戏的相关文字元素是否构成文字作品、游戏连续动态画面是否具有独创性时,都应审查相关表达是否体现了作者个性化的取舍、选择、安排、设计。这里的“取舍”“安排”“设计”都可以归类于广义的“选择”。

法院文件外,我国的指导性案例也体现出对选择概率标准的适用:第81号指导性案例的裁判要旨强调“对……必要场景,以及具有唯一性或有限性的表达形式,则不予保护”,按照选择概率标准,这就是说不对出现概率大的内容表达提供保护;第157号指导案例涉及衣柜家具这一实用艺术品,最高人民法院在裁判中强调涉案家具的颜色搭配、配件设计、角花镶边图案与位置均体现了设计者的取舍、选择,且没有为该家具的实用功能所决定(变动这些成分不会影响衣柜陈放衣物的实用功能),故具有独创性。换言之,涉案家具的设计成分不是基于实现特定功能之目的而有较大概率出现的信息表达,且这些设计是设计者的人为选择造成的——显然,该指导案例的裁判标准也契合于选择概率标准。

为何选择概率标准能够在一定程度上通约不同法域的司法实践?本文认为,这是由于该标准相较于“反映作者人格”“创造性”等抽象标准,在如下几方面具有理论优势:

独创性(originality)的动词词根为originate,意为“归属、起源、来源”,因此独创性实质上是一项建立作品与作者联系,明确作品著作权初始权利默认归属的制度规则。该制度历史也可为佐证:英国1900年的Walter v Lane案中,上诉法院在法律还未有关于独创性的规定时,就曾通过作者的概念推演出作品的独创性要求。

为何版权法需要通过独创性建立作品与作者的联系?这与著作权法的财产法属性以及激励创作的制度目标有关:人类对作品的创作需要付出相应成本,消耗物质世界中稀缺有限的资源和能量,相关观点认为,如果对此没有充分的补偿和回报,则创作过程可能是低效率的。为改变这种低效率的局面,著作权法赋予为作品的创作付出成本的主体,基于其所创作作品的一系列排他性权利,使该主体可以排除他人对作品的特定使用行为,或者就相应特定使用行为收取许可费,由此为作品创作提供经济激励。

从建立作品与作者联系的角度看,如果按照“创造性”等标准来判断独创性,容易产生的理论质疑是:作品中的许多成分可能来自前人的创作,或是属于公有领域的材料及元素,并非全部为作者所“创造”,既然如此,为何允许作品与所谓的“作者”建立起联系,并由他享有相关权利?倘若换作选择概率标准,这一问题就容易回答:尽管作品并非所有成分都系由作者创造,但这些成分所呈现出的信息的排列组合的方式,在因果链条上确实由作者的选择所落实的,如此便可以顺利建立起作者与作品的联系。

需要进一步回应的问题是,再从激励创作的角度看,为何法律应采取选择概率标准,鼓励人们创作小概率信息,而不是像“创造性高度”“反映作者人格”等标准所暗示的那样,鼓励含有某种价值、或满足某种额外门槛要求的信息?本文认为原因有四:

其一,信息内容的产生概率小,本身即意味着让这些信息“现世”相对不容易(属于小概率事件),为提高此类信息内容的产出效率,提供额外的专门制度激励可能是可取的。以选择概率标准来判断作品独创性,可以激励人们在浩如烟海的选择可能中尝试不同的选择,从而更高效地产生各种的小概率信息内容。进一步说,如是也提升了小概率信息中那部分具有较高价值的信息内容的产出效率。

其二,信息内容的价值很难预先判断,且可能随着社会文化发展而不断变化:梵高的画作在其生前寂寂无闻,在其生后却被奉为国宝、艺术史上的不朽之作;在艺术品拍卖市场中,许多在普通大众看来平平无奇乃至难以理喻的作品却屡屡卖出天价。有鉴于此,与其事先要求信息内容必须含有某种价值,才可以受到法律保护,不如让法律保持价值中立,给予每种小概率信息相应的财产权,使之成为市场可交易的对象,交由市场机制判断其价值。

其三,选择概率标准有利于对信息内容的事后投资激励。理论界注意到,许多信息内容之所以在社会中表现出较高的价值,原因在于相关方在信息内容创作产生后,围绕这一信息内容进行了大量的营销和宣传。例如仅从艺术审美的角度看,与米老鼠这一图案在美术价值上旗鼓相当的卡通图案可能有很多,但因为迪斯尼公司围绕米老鼠图案进行了大量的营销和宣传,使得米老鼠图案的社会价值和文化影响力显著高于很多在艺术审美的意义上与其匹敌的图案。现代知识产权法理论不仅强调对信息内容的事前创作激励,还关注围绕信息内容的事后投资(例如对信息内容的营销、宣传投资)激励。在事后激励的语境下,知识产权法提供的排他权保护如同一顶“保护伞”,使得相关方可以在相当程度上内部化对作品宣传、营销的收益,避免他方的搭便车行为,从而促进市场效率。在此意义上,如果著作权法在独创性判定上秉持“创造性高度”“反映作者人格”等含义模糊的要件要求,则欲对信息内容进行营销、投资的相关方,可能因不确定相关信息内容是否受到版权保护,削弱进行相应投资的积极性。与此相对,选择概率标准不在概率和人类选择要求之外不设置其他著作权保护门槛,因此按照选择概率标准,某一信息内容能否受到著作权法保护应当是更加明确的。这种产权保护的明确性,能够鼓励促进相关方围绕进行宣传营销等方面的事后投资。

其四,法律赋予小概率信息著作权造成的社会负面效应并不十分显著。理论上,广泛地为小概率信息提供普遍的著作权保护可能带来一些弊端,例如增加著作权市场的交易成本、增加社会成员的表达成本等。但正如许多学者注意到的,这些弊端在现实中并不如所设想的不显著,这部分是因为版权法中广泛存在的以思想表达二分法、合理使用为代表的权利限制规则,部分是因为在真实的社会实践中,权利人受到法律之外的社会规范、道德的制约,在许多情况下会放弃严格执行版权保护,导致所谓的“容忍性使用”和“扩张性默示许可”,从而部分缓解了版权法低保护门槛带来的负面效果。

综合以上分析,本文认为根据选择概率标准判断作品的独创性,符合著作权法建立作品与作者联系进而激励创作的制度目标,同时其带来的负面效果在实践中并不十分显著,这种制度安排具有可取性。

在前述激励论视角外,传统的著作权法理论也强调作品是作者精神人格的延伸,因而在道德意义上应当受到保护。更具体地说,如Jessica Litman教授总结的,人格理论反映了这样一种浪漫主义作者观:天才的作者在其人格内部的精神世界中,孕生创造出外部世界本不存在的独特之物,再将之表达于外。就具体的法律规则而言,“反映作者人格”“创造性”等传统独创性判断标准,都是这种人格理论或称浪漫主义作者观的体现。

然而从客观的角度看,与外隔绝的人格精神世界是一种文学化的臆想,人的所思所想必然受外部世界及其个人经验的影响,并无绝对的创造,其由此做出的信息内容表达亦然。所谓创作作品,并不是绝对意义上的凭空无中生有,而是对世间已有材料和表达的重新组合排列,例如文字作品的创作是对已有文字、词汇的重新组合,音乐创作是对已有音符、乐句的重新排列,图画的创作是对已有颜色、形状的组合排列。选择概率标准很明确地承认了这一点,将作品的创作过程理解为人对信息排列组合方式的选择,更贴合于作品创作的客观真实情况。正因如此,如前文曾分析的,司法实践中尽管法官们在表面上使用着“反映作者人格”“创造性”等修辞来判断作品的独创性,但他们在具体适用法律的实质分析过程,仍然是着眼于分析作品所呈现信息内容的概率大小以及作品创作过程中人的选择。这一事实表明与传统独创性认定标准相比,选择概率标准在法律实践中的可操作性更高,否则不会如此暗中受到法官青睐。

这种将作品的创作过程看作将已有信息重新排列组合的观点,也可以帮助我们理解实务界及理论界时有发生的“向汇编作品逃逸”现象。本文所称的“向汇编作品逃逸”是指,除开文集、诗选等符合常规理解的汇编作品外,我国实务界和理论界在分析仪式表演、奥运会开幕式、春节联欢晚会、网站版面设计、游戏直播画面等非典型客体的可版权性时,经常会出现相关客体解释为“汇编作品”的见解,例如将奥运开幕式看作主办者对各个节目的汇编,将网站版面设计看作设计者对各个网页栏目、模块、图片的汇编。本文认为“向汇编作品逃逸”现象屡屡发生,正说明法律对汇编作品的定义,反映了一种对作品的普适性理解,能够说明各种作品的创作过程。汇编作品的定义为汇编若干作品、作品的片段或者不构成作品的数据或者其他材料,对其内容的选择或者编排体现独创性的作品。这一定义的特点是强调作品是对已有信息内容(若干作品、作品的片段或者不构成作品的数据或者其他材料)的重新排列组合,与本文提出的对作品创作过程的理解不谋而合。

综合上述分析,可以认为本文提出的选择概率标准在尊重人格理论的基础上,对其具体内容进行了合理改进,它强调作品的创作过程更贴近于“人对既有信息内容的排列组合选择”而非“人对信息内容的凭空创造”。应当认为选择概率标准对作品创作过程的认识比传统的独创性判断标准更加客观,在法律适用上具有更高的可操作性。

选择概率标准不需要法官对争议内容的艺术性或创造性进行主观衡量,从而相对统一裁判标准,并降低著作权法的运行成本。

在“反映作者人格”“创造性”等标准下,法官往往需要主观判断作品是否体现了一定的美学水准从而能够体现作者人格,是达到了足够的创造高度。然而美学性、创造性的内涵本身就含混不清,不易判断,以此为标准必然导致司法裁判标准不一。以近年来备受热议的体育赛事直播画面可版权性问题为例,我国不同法院对于比赛画面能否达到法律要求的创造性高度各持己见。这一过程中,不同案件的当事人为赛事画面的独创性的举证投入了大量成本,各地法官也为分析说理耗尽心力,却最终换来了“法律不确定”的失望结果。因此,合适的做法应当是如霍姆斯大法官所说,在法律适用中放弃让法官对作品的艺术性进行主观评价。欧盟法院近期也采取了类似的观点,在2019年的Cofemel案中确认“美学效果”或“艺术价值”不是判断独创性所需要考量的因素。

如果采取选择概率标准,则法官只需考虑作品创作设计的可能选择,作品所涉内容的出现概率、是否容易出现偶合情况、是否包含可识别的人类选择等相对客观的因素,从而有效降低分析难度,统一判决标准。并且不难看出,绝大多数信息内容都可以满足选择概率标准,多数情况下法官和当事人不必为争议作品的独创性付出过高的成本。

知识产权作为具有“垄断性”的排他权,与反垄断法存在一定的紧张关系,滥用知识产权可能导致市场垄断。就此而言,选择概率标准能够避免著作权人仅凭其对特定一件或几件作品所享有的权利,轻易获得市场支配地位。如前所述,选择概率标准将产生概率高的信息内容被排除在著作权法保护范围外,包括信息量较小的信息内容,以及为实现特定技术功能、达到特定实用效果、表达特定主题或思想、反映特定事实等目的而有较大概率产生的信息内容。如是避免相关方通过对此类信息主张权利,在事实上垄断相关技术功能、实用效果、特定主题,阻碍相关领域的市场竞争。

二、选择概率标准在人工智能生成内容著作权问题上的适用

如前所述,本文提出的选择概率标准,无论是在司法实践的实操层面,还是在理论层面都具有一定的合理性,下文将探讨该标准在人工智能生成内容相关著作权问题上的具体适用。

本文认为,人工智能生成内容的信息产生概率与传统纯粹人类创作的信息内容的产生概率并无本质差异。诚然,人工智能技术的运用可能确实提高了一部分信息的生产效率并降低了相应的生产成本,但这些改变并不影响信息产生的概率,这是因为基本事件在概率上的分布与基本事件发生的效率无关。形象的例子是,以更高的效率投掷硬币,并不会改变硬币正反两面朝上概率各占50%的事实。

因此对人工智能生成内容而言,不能满足低产生概率要求的,仍然是那些信息量较小,或为实现特定目的导致出现概率较大的生成信息。智能软件根据统计数据自动生成的各类曲线图、柱状图、圆环图是否构成著作权法中的图形作品。按照选择概率标准,这些统计图采取的都是基于直观展示统计数据的实用目的而常用的造型方式,可以被认为属于大概率信息而不具备独创性。而对于信息量相对较大的信息内容,符合信息内容的产生概率较低的要求,应当没有太大疑问。Dreamwriter案中的诉争人工智能生成文章即属此列,试想,如果让人或者其他公司开发的人工智能生成内容,就该案诉争生成文章的所涉主题各自撰写文章,这些文章在遣词造句、文章结构组织等方面应当会有较大差异。这些差异可以反映Dreamwriter案的涉案文章属于产生概率较小的信息内容。

目前完全不需人类干预而可全自动产生内容的强人工智能尚未出现,欧盟委员会2021年在人工智能法提案中的相关说明,为我们提供了一种可资参考的反映现阶段人工智能运行方式的定义:人工智能是指使用一种或多种技术方法开发的,能够针对人类给出的特定目标,生成相应内容、预测、建议或决定的软件。这里的开发人工智能程序的技术方法大体上可分为两类,其一是各种机器学习方法,即人类预先编写学习算法,由程序根据学习算法结合特定的输入内容,不断进行“训练”以改善程序性能,其二是由人类根据一定的逻辑直接编写程序代码。由此,可以将现行技术条件下人工智能生成内容产生过程大致概括为如下图示(图1)。

人工智能生成内容的产生流程可分为两部分,其一是人工智能程序的编写:人工智能程序可能是由人类按照一定逻辑直接编写的,也可能是通过机器学习的方法产生的,又或者二者兼而有之。在机器学习的情况下,人类要编写一套基本的机器学习算法,同时输入一定的供机器学习的输入信息,由机器学习输入算法识别输入内容中的关键信息特征并进行分析(所谓的“训练”),然后将分析结果的相关信息存储于特定数据结构中,最后形成人工智能程序。以已出版诗集的人工智能程序微软小冰为例,为了形成微软小冰程序的现代诗创作功能,开发方输入了1920年以来519位中国现代诗人的几千首诗歌供程序进行机器学习。

形成人工智能程序后,该程序有可能根据程序逻辑自动输出人工智能生成内容,也可能需要人为补充一定的输入内容(由于不是必然需要补充输入内容,在上图中用虚线框表示),将这种输入内容作为程序工作的“起算点”,影响最终的生产内容结果。以微软小冰根据输入的图片产生诗歌的过程为例,其过程大致是由程序识别输入图片中包含的物体和图片表现出的可能情感倾向,由此生成关键词,以这些关键词为起算点,扩展与之相关的词汇和表达,在此基础上按照一定逻辑生成诗句。

理解人工智能的工作过程后,不难看出其中充满了容易识别的人类选择,并且这些选择在因果链条上影响了人工智能程序的生成内容。在程序编写阶段,人类直接编写人工智能程序逻辑的过程中必然包含人类对相关程序设计方式的选择,且这些选择直接决定了程序的生成内容;如若是采用机器学习的程序生成方法,则人类选择的机器学习算法,和选择的输入信息均会影响最终的生成内容。试想,如果人类为微软小冰提供的机器学习输入信息不是中国现代诗人的诗歌,而是古代唐诗,则微软小冰产生的诗歌必然会是另一种风格。在具体的人工智能生成内容产生阶段,如果存在人类选择的补充输入的内容,则这些内容作为程序运行的起算点,也会影响最终的输出结果。例如在前述微软小冰根据图片产生诗歌的过程中,如果补充输入的是两幅风格迥异的图片,则最终生成的诗歌也会有较大差异。

综上所述,人工智能生成内容在产生概率上与纯人工产生的信息内容应无有差别,在目前的技术条件下,人工智能产生内容也必然为人类的各种选择所决定,因此按照选择概率标准,人工智能生成内容的独创性判断上不应与纯人工产生的内容有实质差异。换言之,只要人工智能生成内容属于小概率信息,不容易产生偶然一致的情况,就可满足独创性要求,具有可版权性。

这一结论从程序法的角度看也是合理的。试想,假如在独创性判断的问题上,法律将人工智能生成内容与纯人工产生内容区别对待,例如为前者设置更高的独创性门槛或直接否认前者可以满足独创性,则人工智能生成内容的相关方出于利益考虑,很可能采取策略行为:掩饰相关内容真实的生成过程,将人工智能生成内容伪装为纯人工产生的内容。他方由于没有参与生成内容具体的创作过程,很难举证推翻这种伪装,如此使得实体法上的区别对待,在程序法的具体执行过程中失效。因此,在独创性的判断上,与其区别对待两类内容,不如将之一视同仁。

独创性的制度目的之一在于建立作品与作者的联系,以明确著作权的默认归属,确定权利的激励对象。根据选择概率标准,作出影响作品内容的选择的主体,应当享有对作品的著作权。结合上文对人工智能生成内容的产生流程的分析可知,相关内容的创作过程中人的选择通常可能体现于两个环节,其一是编写人工智能程序的环节,其二是补充输入信息的环节,其中后一环节不是必选项。如果所有环节中的人类选择均由同一主体(自然人或法人)作出,例如人工智能程序的开发公司,则该主体应当获得相应人工智能生成内容的著作权。Dreamwriter案即属此列,该案中人工智能程序的开发公者和补充信息的输入者都是腾讯公司,法院判决腾讯公司具有涉案人工智能生成内容的著作权,无有不妥。

较为复杂的是人工智能生成内容的产生过程中存在多方人类选择的情况,典型如程序本身由开发公司编写,而软件的补充输入信息由使用该软件的用户提供。本文认为该种情况下,可以将人工智能生成内容作为开发公司与用户的合作作品,由二者共同享有生成内容的著作权,原因如下:

首先,这一认定符合选择概率标准的内在逻辑,因为该种情况下人工智能的生成内容确系由多方的选择共同导致的。并且理念上可以认为各方作出相应选择,都会消耗一定成本(至少是一定程度的脑力消耗),需要提供一定的制度激励,因此以合作作品制度兼顾各方权益无有不妥。

其次,可以通过恰当的法律解释,认为这种情况下各方之间存在共同创作的合意。具体来说,软件开发者知道会有用户使用软件,而用户也知道其向软件输入补充信息内容后,程序的最终生成结果与软件开发方此前的工作有关,因而可以认为软件开发者向潜在的用户提供人工智能软件时,即发出了与潜在用户共同创作作品的邀约。而用户使用人工智能软件并提供补充输入内容的行为,可以视作作出了同意与软件开发者共同创作作品的承诺,由此达成共同创作的合意。

再者,合作作品的权属安排既可以平衡各方利益,又无碍于作品的开发利用。对此,本文认为应当注意到我国著作权法规定合作作品的著作权原则上由各合作作者协商一致行使,在不能达成一致的情况下,任何一方作者原则上可以不经他方同意地行使除转让、许可他人专有使用、出质以外的其他权利,并应当将所得收益合理分配给其他合作作者。这一规定一方面使得无论是软件开发者还是用户,都可以在很大程度上单方面决定作品权利的行使,如是有效避免各合作作者之间相互掣肘,阻碍影响作品开发利用的情况;另一方面该规定所要求的合理分配权利行使收益的义务,也可以在一定程度上合理平衡各方利益,特别是为法院提供了相关方利益失衡时,进行恰当司法干预的法律依据。

最后,按照私的意思自治的一般原则,这种将人工智能生成内容作为开发公司与用户的合作作品的制度安排,并不排斥相关方通过合同重新确立在特定情形下更适宜的权利归属模式。例如在某些情形下,当将利用作品的合理收益分配给其他合作作者的交易成本很高时,将著作权分配给特定一方而非由多方共有,有可能是更符合效率的制度安排。本文认为,当合作作品的制度安排不能适应特定产业的实践需要时,市场可以提供激励,促使相关方通过协议重新约定合适的权属规则。

反对上述合作作品权属安排的典型观点可能认为,个案中软件开发公司及用户对人工智能生成内容的贡献程度有较大差异,法律应当将著作权尽数分配给“创造性智力劳动更多”的一方,如是更显公平。本文认为该种观点所说的“创造性智力劳动更多”具有较高的抽象性,其指的应当是类似如下两种情况的情形:

其一,在有的情况下,软件开发公司编写的程序本身已大致决定了最终可能的输出结果,即便用户选择的补充输入内容会影响最终的输出结果,这种影响也可能微乎其微,例如只是影响程序最终输出结果A还是结果B,如此显得软件开发者的“创造性智力劳动更多”。其二,而在另一些情况下,又似乎是用户的选择更多地决定了输出结果,例如智能相机的例子下,更像是用户拍摄的初始画面素材,而非配置在智能相机中的程序,决定了智能相机最终的输出画面,如此显得用户的“创造性智力劳动更多”。这两种情况都会让人在道德直觉上,认为将人工智能生成内容的著作权分配给特定一方是更公平的。

对于这种典型的反对观点,本文认为:第一,之所以有研究者偏向于支持将人工智能生成物的著作权分配给特定一方的制度安排,反对人工智能生存内容合作作品权属安排的观点可能会认为,多方共有权利的情形下,会出现不能达成合意以至于相互权利劫持、阻碍作品的开发利用的状况。但前文已述,按照我国著作权法关于合作作品的规定,合作作者不能达成一致的情况下,单方也可以在一定范围内行使著作权,理论上这一规定可以有效避免合作作者相互掣肘的情况出现。

第二,在用户选择的补充输入内容对最终输出内容影响不大的情况下(例如前文所说的只影响生成结果是A还是B),如果软件开发者不愿意与用户分享则其可以选择预先自主补充输入内容,以独立创作的方式得到所有可能的最终输出结果,从而独自享有对于输出结果的相关著作权。这种做法即可保障开发者独自享有人工智能生成内容的著作权,而无需变更相关生成内容的默认权属规则。

第三,如果情况是用户的选择更多地决定了人工智能程序的输出结果,则将生成内容的著作权交给用户确实可能是更合理的。这是因为该种情况下总体上用户具备更多的关于作品的信息,与软件开发方相比,在作品的开发利用上有显著的比较优势,向用户提供完整的著作权更能激励用户采取各种开发利用作品的行动。不过即便如此,法律也可将合作作品的制度安排作为默认规则,当这一默认规则不适宜于产业实际状况时,由市场竞争机制激励软件的开发者与用户约定人工智能生成内容的著作权归用户所有,以此作为竞争优势换取更高的市场份额,从而最终使著作权的权属分配

与产业的需要相适应。本文的这种见解也符合实践中的情况,例如德国公司DeepL开发的人工智能翻译程序在相关用户条款中,明确声明该公司不对用户使用程序所产生的任何信息内容主张著作权。

综上所述,根据选择概率标准,人工智能生成内容的著作权默认归属于在内容生成过程中作出人类选择的主体。如果内容生成过程中存在多方主体的选择,则应将生成内容默认视为合作作品。各合作作者不能协商一致的情况下,任一合作作者都可以在一定范围内单独决定著作权的行使,并向其他合作作者分享收益。当这种合作作品的制度安排不能适应产业的实际时,市场可以提供激励,促进相关方通过协议重新约定合适的权属规则。

结语

著作权法包含了许多具有高度抽象性的理论概念,例如“独创性”“思想/表达二分法”“实质性相似”等。因其抽象模糊性和主观性,人们对这些概念的理解,往往只能达成有限程度的共识,以至于当技术发展触及现行著作权法规制的边界时,研究者往往更乐意主张直截了当地以某种方式突破现行规制,而非在这些抽象概念构成的复杂理论体系中,发掘已有制度工具回应前沿问题的能力。反过来说,如果要充分理解已有制度概念的意义,就应当尝试将这些抽象概念具象化、客观化,使之“祛魅”。

本文正是尝试为抽象法律概念“独创性”祛魅,主张从概率和选择这两个相对客观的角度理解独创性的法律适用。具体而言,如果信息内容的产生概率较低而不容易出现偶然一致,且是由人类非抄袭的选择所导致的,则表达就应具有独创性。这种独创性判定标准能够得到司法实践及著作权法理论的支持,并且能够用于解决前沿的理论问题,帮助我们判定人工智能生成内容的可版权性,并确认相应合理的著作权权属规则。有鉴于此,对于著作权法中的其他抽象概念,研究者也可以尝试为之祛魅,提供相对客观具象的诠释解读,从而使著作权法的理论体系更加清晰完备,对于各种疑难问题有更好的回应能力。

严嘉欢 王昊 论生成式人工智能中个人信息保护的困境纾解

夏浩胜 生成式人工智能的域外监管动向及启示

刘学强 ChatGPT赋能数字法治政府建设中的风险及法律规制

倪子涵 三权分置路径下生成式人工智能企业数据合规新解

郑森 论AIGC生成歌曲的著作权法规制

杨子安 ChatGPT类人工智能生成物的刑法保护

上海市法学会官网

http://www.sls.org.cn

展开阅读全文

页面更新:2024-02-22

标签:人工智能   内容   著作权法   独创性   信息内容   权属   概率   著作权   分配   版权   人类   标准   作品

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top