对“AI作品保护第一案”“Dreamwriter案”的再梳理——兼论该案结论构成双重标准

一、案件概要
2020年1月,广东省深圳市南山区人民法院一审审结原告深圳市腾讯计算机系统有限公司(以下简称“腾讯公司”)诉被告上海盈讯科技有限公司(以下简称“盈讯科技”)侵害著作权及不正当竞争纠纷一案,认定人工智能生成的文章构成作品。此案系全国首例认定人工智能生成的文章构成作品案件,目前该案一审判决已生效。
2018年8月20日,腾讯公司在腾讯证券网站上首次发表了标题为《午评:沪指小幅上涨0.11%报2671.93点 通信运营、石油开采等板块领涨》的财经报道文章(以下简称“涉案文章”),末尾注明“本文由腾讯机器人Dreamwriter自动撰写”。Dreamwriter计算机软件系由腾讯公司关联企业自主开发并授权其使用的一套基于数据和算法的智能写作辅助系统。
同日,盈讯科技在其运营的“网贷之家”网站发布了标题为《午评:沪指小幅上涨0.11%报2671.93点 通信运营、石油开采等板块领涨》的文章。经比对,该文章与涉案文章的标题和内容完全一致。腾讯公司遂将盈讯科技诉至南山区法院。法院审理后,认定盈讯科技侵害了腾讯公司的著作权。[2]
二、对“Dreamwriter案”的再梳理
本文拟从涉案文章的外在特征[3]开始讨论,其次结合设例来探讨法院对本案中创作贡献的认定标准是否合理。在讨论完“Dreamwriter案”后,附带讨论一些相关的话题。
(一)对涉案文章外在特征的讨论流于形式
与专利权纠纷相比,由于著作权的产生采用自动保护原则,在著作权纠纷中往往需要由法官承担起检验案涉文章等是否构成著作权法上意义的作品,以判断主张权利方的请求权是否成立的责任。
在判决书中,法官对涉案文章的介绍与分析如下:
2018年8月20日,原告在腾讯证券网首次发表标题为《午评:沪指小幅上涨0.11%报2671.93点通信运营、石油开采等板块领涨》的文章(以下简称“涉案文章”),涉案文章末尾注明:本文由腾讯机器人Dreamwriter自动撰写。涉案文章是一篇股市财经综述类文章,连标题在内共计979字,由九个自然段组成,第一自然段对2018年8月20日上午的沪指、深成指、创业板指数及上证50指数的涨跌情况进行了介绍;第二、三、四、五自然段分别对盘面、概念股、个股、换手率、资金流向方面的相关情况进行了介绍;第六、七、八、九自然段对人民币对美元中间价、银行业同业拆放利率、融资融券信息、沪深港通南北资金流向的相关情况进行了介绍。
……其外在表现符合文字作品的形式要求,其表现的内容体现出对当日上午相关股市信息、数据的选择、分析、判断,文章结构合理、表达逻辑清晰,具有一定的独创性。”
因涉案文章原文无法查证,只能从以上内容出发进行讨论。
我国著作权法第五条规定,著作权不适用于国家官方正式文件、单纯事实消息、历法、通用数表、通用表格和公式。TRIPs协定第九条第二款[4]也强调,“版权的保护仅延伸至表达方式,而不延伸至思想、程序、操作方法或数学概念本身”。与此相关,学理上也发展出了“思想表达二分”的原则,并且将可选择的表达方式过于有限的情形也认定为“思想”而不受保护[5]。此外,基于知识产权法鼓励创新与创作的原则(亦可见于我国著作权法第一条),由于缺乏给予排他权利激励的理由,已经超过保护期的作品与常见而缺少一定创作高度的表达也被划入不受保护的公共领域之中。
由此,检验涉案文章中的表达是否属于事实、思想或常见的表达,是讨论相关著作权问题的前提。但在判决文书中,法官对此的分析几乎等于没有,仅仅是一笔带过地得出了肯定的结论。仅从法官的介绍来看,涉案文章中的证券指数涨跌,“盘面、概念股、个股、换手率、资金流向”,“人民币对美元中间价、银行业同业拆放利率、融资融券信息、沪深港通南北资金流向”均为可以直接获取或通过既定方式计算得出的业界常用客观数据指标,对这些指标的罗列似乎难以超出事实的范畴,对这些事实的“介绍”恐怕也难以超出常见的表达的范畴,很难得出法官所认定的“体现出……选择、分析、判断”的结论。如果涉案文章的内容确实仅包括这些事实信息,而没有更进一步的分析等可以体现出一定智力高度的内容,那么毫无疑问其无法获得著作权法的保护。虽然这么说或许有失偏颇,但这一检验力度之弱让人难以服膺。
(二)对“创作”的认定模式难以与目前的著作权法体系相容
在分析完外在特征之后,法官对“创作过程”进行了分析:
其次,从涉案文章的生成过程来分析是否体现了创作者的个性化选择、判断及技巧等因素。根据原告的陈述,原告组织包含编辑团队、产品团队和技术开发团队在内的主创团队运行Dreamwriter软件生成包含涉案文章在内的财经新闻类文章。涉案文章的生成过程主要经历数据服务、触发和写作、智能校验和智能分发四个环节。在上述环节中,数据类型的输入与数据格式的处理、触发条件的设定、文章框架模板的选择和语料的设定、智能校验算法模型的训练等均由主创团队相关人员选择与安排。涉案文章的创作过程与普通文字作品创作过程的不同之处在于创作者收集素材、决定表达的主题、写作的风格以及具体的语句形式的行为也即原告主创团队为涉案文章生成作出的相关选择与安排和涉案文章的实际撰写之间存在一定时间上的间隔。本院认为,涉案文章这种缺乏同步性的特点是由技术路径或原告所使用的工具本身所具备的特性所决定的。原告主创团队相关人员的上述选择与安排符合著作权法关于创作的要求,应当将其纳入涉案文章的创作过程。根据《中华人民共和国著作权法实施条例》第三条规定,著作权法所称创作,是指直接产生文学、艺术和科学作品的智力活动。据此,具体认定是否属于创作行为时应当考虑该行为是否属于一种智力活动以及该行为与作品的特定表现形式之间是否具有直接的联系。根据本案查明的事实,显然,本案中原告主创团队在数据输入、触发条件设定、模板和语料风格的取舍上的安排与选择属于与涉案文章的特定表现形式之间具有直接联系的智力活动。从整个生成过程来看,如果仅将Dreamwriter软件自动生成涉案文章的这两分钟时间视为创作过程,确实没有人的参与,仅仅是计算机软件运行既定的规则、算法和模板的结果,但Dreamwriter软件的自动运行并非无缘无故或具有自我意识,其自动运行的方式体现了原告的选择,也是由Dreamwriter软件这一技术本身的特性所决定。如果仅将Dreamwriter软件自动运行的过程视为创作过程,这在某种意义上是将计算机软件视为创作的主体,这与客观情况不符,也有失公允。因此,从涉案文章的生成过程来分析,该文章的表现形式是由原告主创团队相关人员个性化的安排与选择所决定的,其表现形式并非唯一,具有一定的独创性。……
……,该文章的特定表现形式及其源于创作者个性化的选择与安排,并由Dreamwriter软件在技术上“生成”的创作过程均满足著作权法对文字作品的保护条件,本院认定涉案文章属于我国著作权法所保护的文字作品。
试将法官的主要意见归纳如下:
1.著作权法所称创作,是指直接产生文学、艺术和科学作品的智力活动。据此,具体认定是否属于创作行为时应当考虑该行为是否属于一种智力活动以及该行为与作品的特定表现形式之间是否具有直接的联系。
2.(1)由于创作工具的技术特征,涉案文章的创作过程不仅包括Dreamwriter软件自动运行的过程,也包括主创团队相关人员在事前对Dreamwriter所作的相关选择与安排。
(2)本案中原告主创团队在数据输入、触发条件设定、模板和语料风格的取舍上的安排与选择(数据类型的输入与数据格式的处理、触发条件的设定、文章框架模板的选择和语料的设定、智能校验算法模型的训练等;收集素材、决定表达的主题、写作的风格以及具体的语句形式的行为),属于著作权法意义上的智力活动。
(3)第(2)点中的活动,与涉案文章的生成之间有足以被认定为“直接产生”的联系。
其中1.是作为大前提的法律规范,并无不妥。在2.(1)中,法官认为由于创作工具的技术特征,创作过程不应当局限于Dreamwriter软件自动运行的过程,还应当扩展到在软件开始运行前对软件的安排。这一观点有其合理性。由于技术的进步,越来越多与传统的创作手段相异的创作方式被开发出来,其中智力活动的投入与创作成果的生成的非同步性也是影响其一。生活中较为常见的便是延时摄影与游戏画面构成的视听作品:前者在开始拍摄前选定了摄影位置、角度、拍摄参数等,而按下快门键后便由相机自动运行完成摄影;后者由程序驱动而自动呈现在玩家的屏幕时,制作团队或作者早已在玩家按下“开始”键前完成了相关多媒体素材与程序的创作。不过,值得注意的是,条文中使用了“直接”(即“不经过中间事物的”)[6]的表述,对创作过程的扩张设置了限制。
著作权法与著作权法实施条例并未对2.(2)中的智力活动作出定义,但可以参考同为知识产权法体系下的《专利审查指南》中的定义,即“智力活动,是指人的思维运动,它源于人的思维,经过推理、分析和判断产生出抽象的结果,或者必须经过人的思维运动作为媒介,间接地作用于自然产生结果”。对于著作权法而言,其中有价值的部分是对来自“人的思维”的“推理、分析和判断”的强调,这与著作权法对独创性的要求相呼应,但这一概念本身似乎未提出实质性的要求。2.(2)中的活动均能体现来自团队相关人员思维的选择,属于智力活动。但显然,不同的智力活动的智力强度存在区别,与创作过程的联系强弱亦有区别。例如,即便是抄袭者,在复制他人作品前也对复制的对象做出过对比与选择,但这样的“智力活动”强度低,显然也不能认定为与创作有关联。
这便引出了对2.(3)的合理性的反思。收集素材、设定触发条件以取舍模板与语料风格、决定主题的行为,属于设定与应用规则的行为。而设定与应用规则的行为恐怕均难以满足“直接产生”的要求。
设定规则的行为,或制作、训练生成式AI的行为,都是在应用规则生产具体表达前的阶段。如果视生成式AI为创作工具,那么这同样也是制作工具的行为。本案中原告使用自己设定的规则或制作的工具生成案涉文章,能否视为在设定规则或制作工具中投入的智力活动“直接产生”了案涉作品?这个问题在生成式AI出现之前似乎从未有讨论的必要。在传统的创作情景中,“工具”本身的形式非常简单,几乎可以简单地视为人类肢体的延伸;离开人类细致入微的操作,其自身无法自动生成任何内容。创作者与工具结合的紧密程度,以及创作者体现出的压倒性的主体性,使得讨论独立创作过程中创作者的创作意图与创作贡献显得毫无意义。
但能自动完成生成过程的生成式AI——虽然仍然需要人类的指示——让人不得不重新思考这个问题。在2017年日本知识产权战略推进事务局关于AI生成物的讨论资料[7]中,重述了1993年关于计算机生成物的著作物性的论点:基于计算机自动生成的特点,有必要斟酌考量创作者的创作意图与创作贡献,以区分“计算机生成物”与“利用计算机作为道具进行创作”两种情形。此外,其中还有意见认为,制作、训练生成式AI者无法知晓何种指令将会被输入、何种内容将会被产出,因此无法视为对最终生成物有创作贡献;应当检视利用AI者的具体利用方式是否能构成创作贡献。
如果将生成式AI视为创作工具,按照著作权法实施条例第三条,提供物质条件(提供工具)并不视为创作,因此自己设定规则或制作工具同样不应被视为创作过程的一部分。而从其对于最终生成物的创作意图与创作贡献的角度来分析:制作工具只能提供创作的可能性,没有任何选择被固定或落实,客观上无法体现任何制作者进行个性选择的倾向,因此缺少认定创作意图的依据,毋宁说这正是“工具”区别于“预制品”的中立性的表现;制作工具时或制作工具者无法限制利用时或利用工具者会如何使用工具,这意味着制作工具的行为并不能对利用该工具进行创作作出无法克服的限制,也无法对最终生成物施加确定的影响(即添加特定的具体表达),若非最终生成物中保留了被嵌入在工具中的预设表达,一般性地认可制作工具的行为的创作贡献是缺乏合理性的。此外,而依据“直接”的文义,既然设定规则的行为与最终生成物之间存在应用规则这一可以被独立与其它阶段的中间阶段,那么这一行为也无法满足“直接”的要求。
那么,应用规则或具体利用生成式AI作为工具能否满足“直接产生”的要求?利用生成式AI的主要方式就是向生成式AI输入指令。虽然选择输入的指令也是一种智力活动,但这种智力活动与著作权实施条例中所列举的不视为创作中的“提供咨询意见”情形恰恰是相似的,究其原因是具体的表达直接来源于AI依据规则自动生成,而非输入的指令,这也就无法能从输入指令(应用规则)的行为中体现表达作者个性的选择。目前的生成式AI依据运行规则的严格程度可以大致分为较为严格和较为松散两种,但均难以满足“直接产生”的要求。
若生成规则较为严格,无论谁输入一样的内容都会得出一样的结果或及其有限的结果,则生成式AI根据规则自主决策与运行的过程已经抹除了其它智力活动投入的空间,使利用者脱离了对生成过程的控制,失去了“作者”与“创作”的存在空间,也就难以评价为生成物是由智力活动“直接产生”的。对于这一过程,王迁教授也曾论述过[8]:
“自动新闻写作”则是综合运用算法与模板的结果,其关键在于针对某一类型文章,如财经新闻、体育新闻等开发出针对原始数据进行分析的算法,再将其分类套入内置的各种模板。以自动对美国职业篮球赛(NBA)进行直播报道的自动写作软件为例,虽然其生成的直播报道足以“以假乱真”,被球迷评价为由人工创作的比率高达90%,但它是基于开发者构建的球队“比分差函数”,运用由该函数的数据分片算法和数据合成算法,对数据进行分类,并填充到开发者事先预定的上百个模板中所产生的结果。……当软件根据函数和算法对原始信息进行筛选和计算后,将所得数据依对应关系填入模板之中,一篇新闻报道就形成了。……这正是人工智能生成内容的本质特征———是计算而非创作。
即使运行规则较为松散,也并不意味着在在规则运行过程中有智力活动投入的空间。在这种情况下,神经网络学习的黑箱模型所体现的随机性“填补”了缺失的规则,与此同时,利用者也同样失去了对生成物内容的支配力,难以评价为“直接产生”了相关内容。与“自动新闻写作”等实用文领域相对应,创造性较高的领域中的生成式AI多属于此种情形。例如,美国著作权局2023年2月对拒绝《Zarya of the Dawn》登记的回信[9]中,分析了申请人使用的AI图像生成工具的运行原理,认为使用AI来获得满意的最终结果与摄影师、作者、画家的创作过程不同,后者可以通过特定步骤来控制最终图像,使图像符合“其独立心灵中的可见形式”,而前者提示的指令或许会影响AI生成的图像,但在控制程度上没有任何可比性——这也是申请人需要花费大量时间才能获得满意的图像,并且生成了大量“中间图像”的原因。
我们可以借助刑法上因果关系的模型对这一情形进行更精确的理解。刑法上的因果关系的介入因素理论颇为复杂,众说纷纭,此处谨借用在我国亦较有影响力的前田雅英教授的观点进行讨论[10][11]:实行行为导致最后结果的发生可能性高低、介入因素异常性的大小、介入因素对结果发生的影响力。在创造性较高的领域中使用生成式AI,往往会生成大量不符合创作意图的中间产物,最后也并不总能生成指定内容的图像,这表明生成式AI的具体运行过程是由AI自主决策的,是外在于利用者智力活动的“介入因素”;从生成指定内容的低成功率或充满随机性的过程出发,也可以评价为“异常性大”;最后,对最终生成物的影响力更大的、填补了输入指令和生成物之间的空隙的是经过训练的生成式AI的自动运行的过程,而非利用者的智力活动。因此,借用刑法上的表述,可以认为生成式AI的自动运行阻断了利用者的智力活动与最终生成物之间的因果关系。不过,刑法上的因果关系模型并不能直接对著作权法上的问题产生效力,而即使在刑法内部,满足了因果关系也只是行为需要对结果负责的条件之一。在其它情形中,虽然有评价为“异常性小”的可能,但存在介入因素本身已经违背了“直接”的规范要求,也让利用者的智力活动难以与最终表达联系起来。
综上,无论是从著作权实施条例所明文列举的不视为创作的情形出发,或是从对创作活动的“直接产生”的要求的理论分析,原告对利用生成式AI生成的内容都无法获得著作权。即使这一生成式AI是原告制作、训练的,也不能为更改这一结论提供什么帮助。如果认可本案的结论,那么将会对著作权法下“创作”的认定带来显著的双重标准风险:
1.假设A委托B创作绘画,并且制作了长篇且详细的需求列表交付给B。如果认可利用生成式AI(输入指令等)的行为可以构成创作,那么对于最终的绘画作品,同理A的行为是否应当也构成创作?
(本案不涉及)2.假设C希望募集特定内容的绘画或文字作品,因此公开了需求并有偿征集作品。在这之后,C收到了数副作品,从中选出了自己认为最优秀的一副,给予其作者D报酬后向大众公开。如果认可从生成式AI的生成物中挑选能构成表达个性的选择进而构成创作,对于D的作品,同理C的行为是否应当构成创作?
3.假设E是F的绘画教师,F从小(6岁)在E的绘画工作室中学习绘画至今(24岁),F从E处学习到诸多绘画技术,绘画风格也深受E的影响。如果认可制作、训练生成式AI的行为可以构成创作,那么对于后续F创作的所有作品,同理E是否也能构成作者?或者退一步而言,对F在E的指示下创作的作品,同理E是否也能构成作者?
在目前的著作权法体系下,这些同样是著作权法实施条例第三条中列举的不构成创作的行为。在生成式AI的制作与运行过程中,利用者的行为同样与上述行为性质相仿。这表明直接利用生成式AI但缺少其它人类介入而进行的“创作”是与目前的著作权法体系不相容的。以条件式因果的思维方式来不断延伸最终生成物与某个行为的“创作”因果关系是没有尽头可言的,这也架空了著作权法对于创作行为的实质要求。而在向前无限延伸的因果关系中特意选取原告这一环,认可其拥有著作权,颇有先射箭再画靶的嫌疑。

三、附论
(一)对李伟民教授文中观点[12]的思考
在为写作本文而查阅资料的过程中,笔者也拜读了李伟民教授的《人工智能智力成果在著作权法的正确定性》一文,但认为其中部分观点有待商榷。
其一,文中认为“最终,《著作权法》规定了法人可以像自然人一样创作作品,也会像人一样享有作品的精神权利和其他权利。足见,把‘智力成果’和‘自然人’必然联系的观点不能成立。”但实际上,回到著作权法中,我们可以发现条文使用的表述是“组织主持”、“代表意志”、“视为作者”,换而言之,创作行为仍然是由具体的自然人完成的,只是权利在创作完成后归属于法人。因此这一观点混淆了作者在创作能力与权利归属两方面的含义。如果根本不存在“事实作者”,著作权从未发生,那么所谓的“法律作者”从何处继受(自然意义而非规范意义上)权利?如何能得出“理论上没有障碍”的结论?
因此,文中继而论述的“在承认法人或者法人之外的‘非生命’主体可以‘创作’,可以是作品‘作者’,可以享有作品著作权的国家,‘非人性’的机器人没有被排除在‘创作’主体的范围外,‘非人性’的机器人有成为作品‘作者’的可能性和基础”,同样是基于其前文的谬误做出的错误判断。实际上,查阅本文在前文注释[7]与[9]中所引用的文件就可以发现,所谓的“机器人没有被排除出创作主体外”的国家——日本与美国,都对这一点作出过十分清晰的否定论断:前者认为“由于它不表达思想或感情,因此不构成作品,也不发生著作权”[13];后者的情况则是,“解释‘作品’一词的法院一致将其限定为人类作者的创作”[14];
其二,文中认为“其中的旨趣在于,部分学者尽量不用‘智力成果’、‘创作’等表述,就是逾越不过人脑和电脑的关系,在回避人工智能代替人进行思考、行动和创作的事实。……人工智能‘生成物’、‘生成内容’等表述不是《著作权法》正式意义的表述,采用人工智能‘智力成果’或者‘智力表达’称谓,是较为妥当的选择”。这一观点令人费解,讨论一个存在争议的对象,避免使用现行法上作为“讨论结果”而存在的词汇,不是很正常的讨论方式吗?反倒是此处的观点一方面指责他人回避思考,一方面自己却又在跳过论证直达结论成立后应当使用的表述。
其三,文中认为“著作权法只保护独创性的表达,不保护作品的创作过程,以创作过程判断人工智能智力成果是否是作品,难免不适当”。这一观点是脱离创作实践的,如果完全不观察创作过程,如何检验作者在创作过程中作出了能表达个性的选择?仅从结果来看,抄袭得到的产物也完全符合作品外观,那抄袭是创作行为吗?因此,独创性的原始内涵就要求考察创作过程,否则无法解释“偶然雷同、独立创作”情况下给予著作权保护的情形;相反,也无法解释拒绝保护抄袭(非公开作品)的情形。
同时,思想表达二分法也不应当是支持著作权法不关注创作过程的论据。由于现实中任何可被识别含义的符号在外观上都是一种表达,因此诞生了思想表达二分法原则,其评价的是某种表达应当被认定为不受保护的“思想”,还是可以受到保护的“表达”,而不是为了区分创作过程与创作结果。思想和表达都是与创作过程紧密结合的,创作过程中也存在已然符合著作物外观特征的表达,而创作结束后的作品更是完整地体现了作者的思想。什么样的创作在过程中不受到某种思想指导,不会经历一个外观简陋的萌芽期和发展期?什么样的创作在最终完成前是完整的表达?如果思想表达二分法是为了区分创作过程与创作结果而创立的,那完全是多此一举。
其四,文中认为“‘独创性’是判断智力成果是不是作品的客观标准,独创性包括两个层面的含义,第一,智力成果由作者独立所完成,第二,具有最低限度的创作。世界各国认定独创性的标准不一,美国有‘额头冒汗’理论,英国有‘劳动回报’理论,瑞士、荷兰、比利时等大陆法系国家用‘勤奋标准的判断方法’。也有观点认为,独创性有高低之分。作者的思想、身份、创作过程等因素,不是判断作品独创性的标准和依据。如果不认可人工智能智力成果版权性,将对认定作品的独创性理论造成冲击。”
这一段论述不甚详尽,因此只能导向自相矛盾的结论。该段论述可以总结为,“人工智能智力成果”符合独创性的要求。但一方面,前文认为“随着科技的发展,机器人深度学习的能力不断提高,人机融合现象成为常态,机器人完全可以像人一样思考和推理,甚至可以采取理性行动超越人类”,在这里却又忽视了AI独立于人自主运行所作出的贡献,认为AI生成物可以符合“作者独立所完成”的要求,颇令人感觉是选择性忽视“人类+AI”过程中AI的部分,然后得出由人类独立创作的结论;另一方面,此处也没有确定到底要采用何种标准的“最低限度”,也未证明相应的合理性。仅从对认定作品的独创性理论造成冲击的标准出发,反而是认可人工智能智力成果版权性才会造成冲击,原因正是笔者在前文所论述的“双重标准”风险:目前直接利用生成式AI生成内容的过程中,人类行为的智力活动强度可以说低之又低,与被著作权实施条例第三条所列举的不视为创作的情形一致。
其五,文中认为不认可AI生成内容的可版权性就无法促进AI产业发展,这完全是脱离于现实商业运行逻辑的。邻接权、反不正当竞争法、合同法同样可以提供各自的保护。例如国外诸多图像生成AI可以依靠付费使用的方式营收[15],这其中体现了合同法的保护;即使不认可AI生成物的可版权性,直接抄袭的行为也可以通过反不正当竞争法来维权;近日见诸报端的“盘古大AI”[16][17]的应用领域涉及的行业包括政务、气象、铁路、制造、金融等,华为与诸多企业实现了商业合作,这体现了AI产业发展本身的多元化,并没有那么依赖著作权法的保护。
(二)基于概率预测模型[18],利用数据库实现的生成是创作吗?
从更宏观的角度观察创作活动,学习既存的作品几乎是必然经历的过程,这也符合人类社会知识积累的一般规律。在创作活动中,新创造的部分正是知识产权法所看重的,这一点从各国对于二次创作作品或改编作品的立法态度中最能明显地看出。虽然人类的创作也需要学习,但依赖人类指令、概率预测与数据训练的生成式AI,虽然表现出很强的学习能力,但却无法像人类一样自主地在学习成果之外添加自己的独立贡献。此外,部分知识产权意识薄弱的AI训练者与利用者的行为,让本就具有几乎是掠夺式的学习能力的生成式AI饱受争议,尤其是在图像生成领域[19][20]。
生成式AI的运行逻辑,与部分人训练、利用生成式AI的方式,打破了在以往的创作活动中学习与创造的微妙平衡,这让许多人重新反思AI生成对于创作的价值。因此,笔者也认为这种生成从宏观角度上看,其价值与意义是难以与创作划等号的。诸多内容平台如Steam、Pixiv、DLsite等,响应了部分创作者与用户的要求,将涉及AI生成的内容下架或独立展示[21][22]。
也有人试图从“涌现”这一复杂科学的概念中寻求线索[23][24]。简而言之,涌现是指,当许多小的个体相互作用后产生了大的整体,而这个整体展现了构成它的个体所不具备的新特性的现象。如果生成式AI受到的训练足够多、复杂,出现了涌现现象,或许意味着即使不需要人类介入,生成式AI的运行过程本身就具有生成创新内容的能力。不过,如何建立评价涌现现象的指标本身也是一个极具挑战性的任务。
(三)如何看待创作中的随机性
这个问题关乎我们如何理解创作活动的本质,或者说,知识产权法应当采取什么样的立场理解创作活动的本质。
从创作自由的理想出发,艺术是不应当有边界的。但回到现实中,艺术创作作为人类社会有机组成的一部分,在与其它社会存在的互动中总会主动或被动地受到限制。自发建立的艺术理论、创作规范的要求或新思想潮流的影响,来自伦理道德、宗教文化或政治权力的约束,都会为创作建立边界。究其原因,是不同系统间价值取向的冲突,而知识产权法也不能免俗。
现代艺术[25]与后现代艺术[26]提出的挑战并不只冲击了艺术创作本身,同样也为著作权法带来了新的命题[27]。虽然著作权法并不天然对创作持有某种立场,毋宁说鼓励多样的创作正是著作权法的立法价值之一,但著作权法提供给予“垄断权”提供创作激励的运作方式要求其必须划清权利与义务的边界,必须明确谁可以成为权利主体,什么可以成为权利对象,也要维护保护与自由的平衡。这反过来要求著作权法必须对创作进行解释,并且在不能兼取的时候要做出取舍。
举例来说:观念艺术[28],例如马塞尔·杜尚知名的“现成品艺术”《现成的自行车轮》、《在折断胳膊之前》、《喷泉》,使用的都是日常中常见的物品,杜尚也没有对这些物品做出修改或其它“创作”行为,相反,他强调一种基于观念转变的审美思想。这固然是有启迪性的艺术尝试,但著作权法实践并不会因此放松对实用品中是否有独立于功能性的审美意义的检验标准[29]。而如果认可这类艺术的作品属性,既会让著作权法与专利权法、实用新型外观设计的功能重叠,也会让正常的社会生产由于著作权的“垄断”而受到阻碍。行为艺术[30],强调通过艺术家的身体行为与观众进行交流,活动的重心是这一充满不确定性的过程——这与强调表达留存的传统艺术形态恰好相反,不过也有构成表演或是通过视听固定构成视听作品的可能性。极简主义的抽象艺术,例如下图[31],由非常简单的几何图形、色彩或线条组成,即使在美学理论上有独特的价值,这样的创作很可能因为构成著作权法上的常见表达而不被认可其作品属性,授予这样的作品著作权也有让公共领域中的几何图形、色彩等被垄断的危险。

而其中与生成式AI有关的,是依靠随机性获得具体表达的创作尝试。在生成式AI出现前,这种创作尝试多表现为抽象艺术的一种,例如杰克逊·波洛克的“滴画”[32]:
“把巨大的画布铺在地上,用棍子或结块的画刷浸入盛着颜料的罐子中,然后在画布上随意走动,把颜色滴到或泼洒到画布上。画笔不接触画布,颜料层层叠加,毫无计划的把画面涂抹成杂乱交错的线条网。”
正如前文所述,在创造性较高的领域使用生成式AI,实际上是外在于人类智力活动的AI自主运行过程产生了具体的表达,对于利用者来说,同样是一个依靠随机性获得具体表达的过程。如果都是依靠随机性来产生具体的表达,一方面认可“滴画”构成作品,一方面不认可生成式AI的生成图像构成作品,是否也是一种双重标准?
当然,也有人认为杰克逊·波洛克的“滴画”是“杂乱却有章法,是画家通过长期对手腕力量控制的训练和颜料密度深刻探究的结果。看上去简单,实际上包含着固定的比例、频率和图样”,并非完全是随机性的产物。即使这一观点成立,也并不妨碍我们的讨论,我们可以设想一些更为“随机”的创作方式作为比较的对象——例如将单一或混合色颜料颜料球从高处落下,通过颜料球破碎时产生的痕迹来完成创作。
抛去对源于人类“亲手”制作的浪漫滤镜,这样的创作方式在技术原理上、外观特征上都难以与生成式AI的产物区分开来。事实上,在2022年NovelAI未经创作者授权通过danbooru网站上的图像数据训练其生成式AI后发布付费图像生成服务以及随之而来的市场热潮之前,AI作画发展较慢,常被提及的也正是其“创作”的抽象画[33]。而如果认可人类的随机性创作可以表达人类的思想或感情,那么生成式AI利用者同样可以辩称其输入的具体指令、调整的具体参数也能体现其思想或感情。因此,著作权法必须对不同的随机性创作持有统一的态度,否则只是一种缺乏依据的歧视。
那么,著作权法应当对随机性创作持有怎样的立场?笔者以为,首先应当区分随机性在创作过程中发挥的作用,结合著作权法的立法价值与对公共领域的保护,采取不同的态度。具体而言,先区分随机性发挥的作用是提供创作的素材、对象或辅助,还是直接提供了主要的表达。这一要求源于著作权法实施条例第三条中“直接产生”的条文表述。
提供创作的素材、对象是指创作前取材的随机性,这在创作活动中是普遍存在的,例如绘画写生、街拍、某些形式的即兴创作等。在创作前没有预先规划或选定创作对象,并不会影响在创作阶段中创作者基于自身的智力活动自主地对创作素材或对象施加影响。提供创作的辅助,是指利用随机性生成部分不占主要地位的表达或完成部分高度重复性的工作,例如在游戏制作中利用随机性生成地图地形、在绘画中利用随机性完成部分装饰性的表达。在这种情形中,随机性通过提供部分表达实现了辅助作用,但不会阻碍创作者的智力活动对主要表达或整体设计的贡献。
相反,当随机性发挥了提供主要表达的作用时,创作者的智力活动的影响就难以从中寻觅了。前文中为“滴画”技巧辩护的人,恰是在试图论证“滴画”创作的随机性可以被杰克逊·波洛克的技巧克服。即使随机性产生的结果是“可预见的”,也不能改变这一结论:即使在委托创作关系中,委托者无比熟悉创作者的创作风格,几乎在下达委托前就能预测到什么样的作品会被提交,委托者也不会因此构成作者;“无限猴子定理”[34]也表明,随机运作的过程不需要智力活动参与,而试图通过这样的过程得到“作品”本身就是一种对创作活动的意义的消解。
著作权法以促进文化繁荣为目标。稍加观察便不难发现,即使随机性创作可能带来有一定审美意义的“表达”,但并不能实现具有内容逻辑的文化积累、也就不能增进人类的感性或理性认知的拓展,与著作权法的目标是相悖的。固然,著作权法不排斥随机性作为一种可能的创作工具或创作尝试,但它就像零食——在零食与正餐出现了冲突的时候,我们不应当对追求零食采取一种“鼓励”的态度。此外,授予随机性创作“垄断权利”也可能会给公共领域造成无法忽视的威胁,随着生成式AI运行效率的显著提升与对噪声数据的逐步克服,以往这一威胁或许只在体量较小的文字创作领域(如诗歌)中体现,未来则可能威胁到所有的创作领域。
(四)摄影能否构成创作的历史争论
每当新兴技术出现的时候,常会对创作手段以及作品形态造成冲击。近年来有关游戏运行画面能否构成作品的争论是如此,曾经对于摄影能否构成创作的争论同样是如此。例如,著作权法发源较早的美国[35]在其历史上就有关于摄影的性质的争论[36]。摄影与生成式AI的相似点在于,对于最后表达而言,有相当一部分内容来自于外在于人类思维或行为的自动运行过程,因此对摄影的争论同样对生成式AI有借鉴意义。
林肯在1865年3月3日,签署授权了一项对《版权法》的修改法案,将其保护范围扩大到照片和摄影底片。但在美国的司法实践中,直到1884 年美国最高法院在Burrows-Giles Lithography Co. v. Sarony案作出裁决后,照片的版权才被正式承认。本案中的原告(初审被告)印刷了被告为案外人拍摄的照片并出售,遭到了被告(初审原告)的起诉。原告认为相片是机械产品,而非被告的作品。最高法院对这一观点进行了回应[37]:
“一张照片是否仅仅是一个机械的复制或者是一个原创的艺术作品,这是一个由原创性、智力生产、作者的思想和概念的事实证明来决定的问题,当版权有争议时,确定这些事实是很重要的。……该条款中的著作(writings)是指这些作者的文学作品,国会非常恰当地宣布这些作品包括所有形式的书写、印刷、版画、蚀刻等,通过这些形式,作者心中的想法得到了可见的表达。”
“……有人说,雕刻、绘画、印刷品确实体现了作者的思想构思,其中有新颖性、发明性、独创性,因此符合宪法的目的,即确保作者的专有使用权或销售权,而照片仅仅是对某些物体(有生命的或无生命的)的物理特征或轮廓的机械再现,不涉及思想的独创性,也不涉及与照片的可见再现形状有关的智力活动中的任何新颖性。……对于普通的照片拍摄来说,可能确实如此,在这种情况下版权不受保护。”
“……因此,与专利权相比,当假定作者起诉侵犯其版权时,更重要的是要证明作者的独创性、智力成果、思想和构思等事实的存在。在本案中,我们认为已经做到了这一点。在第三项事实认定中,关于涉案照片,该照片‘是一幅有用的、新颖的、和谐的、有特色的和优美的照片,原告制作该照片……’。原告完全根据自己最初的心理构思,通过在镜头前摆出奥斯卡·王尔德的姿势,选择和布置服装、帷幔以及照片中的其他各种配饰,安排主体以呈现优美的轮廓,安排和布置光线和阴影,暗示和唤起所需的表情,并根据这些完全由原告进行的布置、安排或表现,制作了本案中的照片。”
可见,美国最高法院通过讨论创作者在具体的创作过程中通过智力活动施加的影响,认定了摄影构成作品的可能性以及需要达到的要求。通过对摄影对象进行安排、调整摄影的角度与光影,创作者制造了具体的摄影图像表达。换而言之,虽然相机会完成“所见即所得”的过程,但摄影师通过影响“所见”来控制最终表达。即使机械会完成对摄影对象的准确复制,创作者仍然有对最终表达施加直接而多样的影响的空间,这与直接利用生成式AI生成内容的过程具有显著差异。
以上。

注释:
[1](2019)粤0305民初14010号。
[2]肖波.深圳审结首例人工智能生成文章作品纠纷案[N].人民法院报,2020-3-19(7987).可参见:http://rmfyb.chinacourt.org/paper/html/2020-03/19/content_166241.htm?div=-1.
[3]由于“独创性”一词的含义可能涉及对作者是否必须为人类的讨论,为了明确所指,故在此处使用外在特征一词。
[4]《与贸易有关的知识产权协定》的内容可参见:http://ipr.mofcom.gov.cn/zhuanti/law/conventions/wto/trips.html.
[5]王迁.知识产权法教程(第六版)[M]. 北京:中国人民大学出版社,2019.54.
[6]直接:不经过中间事物的。与“间接”相对。可参见《现代汉语词典》第六版第1670页。
[7]AIによって生み出される創作物の取扱い(討議用).https://www.kantei.go.jp/jp/singi/titeki2/tyousakai/kensho_hyoka_kikaku/2016/jisedai_tizai/dai4/siryou2.pdf;
AIに関して残された論点(討議用).https://www.kantei.go.jp/jp/singi/titeki2/tyousakai/kensho_hyoka_kikaku/2017/johozai/dai6/siryou4.pdf.
[8]王迁.论人工智能生成的内容在著作权法中的定性[J].法律科学(西北政法大学学报),2017,35(05):148-155.
[9]Re: Zarya of the Dawn (Registration # VAu001480196) .https://www.copyright.gov/docs/zarya-of-the-dawn.pdf.
[10]周光权.刑法中的因果关系和客观归责论[J].江海学刊,2005(03):119-124.
[11]柏浪涛所著的司法考试参考资料《2023法考专题讲座精讲卷刑法》中也有关于这一理论的介绍,此为影响力的例证之一。
[12]李伟民.人工智能智力成果在著作权法的正确定性——与王迁教授商榷[J].东方法学,2018(03):149-160.
[13]思想又は感情を表現したものではないため著作物に該当せず、著作権も発生しないと考えられる。
[14]Courts interpreting the phrase “works of authorship” have uniformly limited it to the creations of human authors.
[15]2023年全网最全的AI绘画工具汇总,商业推荐Midjourney.https://zhuanlan.zhihu.com/p/607045606.
[16]华为发布AI大模型盘古3.0.http://www.news.cn/2023-07/07/c_1129737993.htm.
[17]6000 字详解华为盘古大模型:能否撑起世界 AI 另一极?.https://www.geekpark.net/news/321605.
[18]探究生成式AI技术.https://rohm.eefocus.com/article/id-3309.
[19]AI作画的人机战争走向何方?.https://www.eefocus.com/article/527191.html.
[20]在国外最大艺术平台上,画师们掀起了一场反AI的赛博游行.https://k.sina.cn/article_1893905030_70e2b286027015egg.html?from=animation.
[21]游戏平台Steam下架用AI生成的应用,称存在版权争议.https://m.mp.oeeee.com/a/BAAFRD000020230704815652.html.
[22]政策跟不上变化,Pixiv、DLsite等纷纷拒绝售卖AI作品.http://www.gamelook.com.cn/2023/05/517748.
[23]涌现.https://wiki.swarma.org/index.php/涌现.
[24]大语言模型进化之谜:涌现现象的挑战与争议.https://www.infoq.cn/article/gjljp08ihuud8shahhz3.
[25]现代艺术:历史,特征,运动.https://gallerix.asia/pedia/modern-art.
[26]后现代主义艺术:定义,特征,历史.https://gallerix.asia/pedia/postmodernism.
[27]前田健等.図録 知的財産法[M].东京:弘文堂,2021.45.
[28]观念艺术.https://zh.wikipedia.org/zh-hans/觀念藝術.
[29]王迁.知识产权法教程(第六版)[M]. 北京:中国人民大学出版社,2019.75-81.
[30]行为艺术.https://zh.wikipedia.org/zh-hans/行为艺术.
[31]雅昌专栏|王端廷:极简主义之后,抽象艺术何为? .https://www.sohu.com/a/223270130_149159.
[32]胡乱泼洒的颜料,为什么拍卖出了2亿美金?.https://www.jiemian.com/article/3299734.html.
[33]AI通过了艺术创作图灵测试,你根本分不出来作者是不是人.https://zhuanlan.zhihu.com/p/29601666?utm_source=qq.
[34]无限猴子定理.https://zh.wikipedia.org/wiki/無限猴子定理.
[35]The Evolution of Copyright Law.https://www.copyright.gov/history/copyright-exhibit/evolution.
[36]Lincoln Authorized 1865 Copyright Legislation.https://www.copyright.gov/history/lore/pdfs/200902%20CLore_February2009.pdf.
[37]Burrow-Giles Lithographic Company v. Sarony, 111 U.S. 53 (1884).https://supreme.justia.com/cases/federal/us/111/53.

写在后面:
在提供“建议”的情形中,除建议本身可以构成表达的案例外(例如文字建议-文字作品),长而详细的需求列表、创作指令等对作品产生的影响,能否成为其声张作者身份的实质依据?其产生的影响能否超越“思想”的范畴?这一问题其实不止在AI生成物的著作权问题中出现,也同样在共同创作、职务作品、法人作品等问题中出现。法人的意志、工作人员的职务具体会对作者的认定产生什么影响及相应的根据,也是值得进一步探讨的问题。
此外,文中一方面认为由随机性而产生的“作品”缺乏与著作权立法目标相关的实质价值,另一方面却又认为生成式AI被广泛利用后有著作权爆炸或垄断的风险,这是某种自相矛盾吗?即使是对于文化的发展和积累而言,一个附有作者思想的完整创作过程真的是必需的吗?受众能否完全依靠自身的解读来赋予AI生成物审美或其它方面的意义?对作者的参与的重视是一种源于浪漫主义的执念吗?