论“AI绘画”与虚拟歌手圈

随着算力的发展和人工智能(AI)算法的成熟,AI绘画在今年9月、10月引起了诸多的关注。除了三次元的学术界、产业界有诸多评论之外,互联网上同样掀起了轩然大波。“绘圈”、独立画师、平面设计师、游戏开发者和普通网名争相发表意见,同时也引发了关于AI绘画著作权的法学、伦理学争论。
本文以作者景育的个人视角,评析AI绘画与中国虚拟歌手圈层的关系,探讨AI绘画的未来与前进。
AI绘画简要介绍
AI通过输入海量的、大数据的既有内容,作为训练素材,得到“知识”,然后利用这些“知识”来做出相应的行为。以往的AI下棋,AI物体识别,AI翻译等,都是使用大致如此的原理。AI作画并无不同,也是通过互联网上既有的图片,进行训练,得到了能模仿画图的能力。
AI学习绘画的过程通常需要非常多的图片,以亿为单位的庞大数量进行学习,学习资料以TB为单位或许还更大(参考SD的100TB),进而形成“知识”也就是几个G大小的模型,模型的体积未来还会继续压缩精简。因为模型体积较小,所以在本地计算机部署之后,就算断网也能用AI(也就是这份“知识”)来绘图。
作者:拉格
链接:https://www.zhihu.com/question/548816476/answer/2693895974
按照“绘圈”偏贬义的说法,即将海量的图片肢解为碎片,形成碎片库,再对其进行拼接。
自今年9月依赖,AI绘画平台大量井喷。国外有NovalAI、Midjourney、wombo.art、Google Colab、artbreeder等,而国内有百度文心、6pen、MuseArt。
目前AI的功能
AI可实现“以文生成图”,也可以实现“以图生成图”。
例如百度文心,就支持以文生成图。使用者需要输入多个Prompt(可以理解为“修饰词”),AI将会根据词语生成相应的图像。

以图生成图,这是输入一个图片(甚至可以是照片、简易的手绘图、或者完全无关的东西),生成图像。
下图是利用NovalA根据张献忠的雕塑照片,生成二次元的图像。


不同的AI平台,也允许用户进一步调节参数,实现细节的控制。
AI作画对真人画师的挑战
这是近日来关于AI作画的大议题。在一些社交平台,关于“AI作画能否取代初级画师”的话题引发了大量的讨论。
具体到中国虚拟歌手的领域,这一问题便值得仔细探究。
AI相较于真人画师,其具备部分优点。
1)AI的价格低廉
现在一部分AI平台是免费的,NovalAI本来是收费的,但是“破解版”的库在网络上已经泄露。NovalAI标价会员为10美元(约71.5人民币),可以获得1000积分,然后每幅画需要消耗5积分,相当于71.5人民币200幅画,折合0.36元/幅。
虽然不能一次就画出用户想要的画,但是总的来说,AI作画的价格是极其低廉的。
2)AI的完成度尚可
在今年上半年,AI绘画的作品,并不能达到普通人的审美需求。而今年9月以来,AI绘画的水平已经达到了中初级画师的水平。

下图是NovalAI根据牧心的公式图,以图生成图,得到了图像。

可以看出,AI在头发、眼睛和服装上的绘画水平,并不亚于中初级画师。
下图是网传的AI生成结果,完成度和精美程度已经足够满足观众的需求。

AI还可以模仿指定的画风,完成相应的绘画,例如下图就是模仿了浮世绘画风的二次元画作。


3)AI能够为多人服务
算力允许的情况下,AI可以同时为多个用户服务。亦或者,各个用户在本地部署AI“知识库”,这样就可以各自在本地进行AI绘图。
我觉得虚拟歌手圈的人更容易理解这一点,譬如甲、乙、丙都购买了洛天依的声库,那么他们可以同时使用洛天依唱歌。而真人画师、真人唱见需要排班。小有名气的真人画师在寒暑假可以排班排满,而AI则不需要排班(部分平台的要排队)。这一点是有相似之处的。
4)AI画图速度快
在本地部署AI,AI的出图速度主要取决于GPU的性能和显存大小等硬件指标。对于一般的个人电脑而言,也可以在1个小时的数量级上完成AI绘图。这是真人画师所不可比拟的。
以上是AI绘图相较于真人画师的优点。然而,AI也有不可避免的缺点,至少以现阶段的水平来看,这些缺点AI不可克服,而又是中文虚拟歌手圈的重点。
1)AI的同人水平差
在天钿Daily的QQ群内,有人尝试用本地的novalai平台绘制洛天依的同人图,结果如下:


笔者印象里是有人利用AI绘画了初音未来的同人图,还比较正常。但是对于洛天依等相对冷门的二次元形象,AI似乎并不能正常地画出其同人图。兴许在文字描述里加入“灰发”“绿眼”等字样,可以让AI画出来的结果更接近洛天依。



洛天依已经是中文虚拟歌手知名度最高、同人图最多的角色了,其它角色,只会比洛天依更“冷门”。而目前的AI,尚不能正确地绘画洛天依的同人图,更遑论其它虚拟歌姬。
这是当下AI绘画之于虚拟歌手圈,一个致命的缺点。
2)AI的结果不分图层
如果把AI绘画的结果用作曲绘,拿这样的曲绘作品去做PV,又不得不面临一个新的问题,AI的画作不分图层。虽然不分图层也是可以做PV的,或者PV师自己去补画头发、裙摆后面的背景,但是总的来说,这一点远不如真人画师。
对PV师来说,这是一个比较致命的缺点。
(虽说个别真人画师也不分图层)
3)AI未必能满足甲方需求
甲方一般会在自己脑海中脑补一个大致的图景,如果找画师约稿,画师能够达到大概70%的吻合,甲方可能就会通过验收。如果不通过,可能会进一步要求画师改稿。AI的绘画结果,可能并不能达到70%,会比画师更低。
画师能够和甲方使用自然语言进行沟通,这样的沟通是双向的、互动的。而AI目前只能通过输入一些prompt来单向的、非互动的沟通。
并且画师会在绘画的多个阶段和甲方及时沟通,比如打草稿构图时,问甲方满意与否;线稿完成时,问甲方满意与否;初步上色后,问甲方满意与否……分步骤的交流沟通,与及时修改矫正,能够让画师的作品更吻合甲方脑部的图景。这是当下AI所做不到的。
AI绘画在中文虚拟歌手圈的潜在应用
考虑到大多数的中文虚拟歌手歌曲,是同人曲。比如洛天依唱的歌,曲绘也画洛天依。而且PV制作比较普及使用分图层的曲绘。结合上文AI的三个缺点,AI目前不可能撼动画师在曲绘工作中的地位。
但是这并非代表AI在圈内一无是处。AI绘画仍然有可以应用的地方。
1)AI画底稿,画师细化
在AI绘画之前,就有两种科技,对人工绘画产生了冲击。第一是照相机,第二是3D建模。这二者其实也都并没有取代画师。
在中V圈内,早就有往照片上画曲绘、参考照片画曲绘、修改照片画风使得其成为曲绘,等多种做法了。在圈外,我听说过有Coser邀请有绘画基础的后期,通过绘画的方法,让自己的Cosplay艺术照“更还原”。
至于3D建模,中V圈内不清楚,但是观看B站一些画师的绘画录屏,可以得知,这种行为也并不罕见。一些能够掌握3D建模的画师,能够利用建模软件,高效地完成透视法的绘画。
譬如void新神殿下,是不回避地把建模过程也录入了绘画视频。



画师可以把照片与3D建模的结果,作为绘画的基底或者参考,那么AI的画作,为何不能呢?
在去年AI还不成熟的时候,我就用AI画自己QQ机器人的头像,然后自己再板绘进行修改、完善。目前看来,这样的方法同样适用于现在高水平的AI。
2)AI为PV绘制背景
前文已经提到了,摄影摄像和3D建模对绘画的冲击与帮助。除了从画师的角度看,从PV师的角度,AI绘画或许能为PV背景提供帮助。
现在中国虚拟歌手圈已有把照片等摄影摄像内容,作为PV背景的。本人在《金陵叹》中也使用了处理过的照片,作为PV背景。下面举一些知名度更高的例子:


使用3D建模作为PV素材的,仍然不少见:


那么类似地,在PV中,使用AI绘制的背景图,也是无可非议的。

现在的AI能够绘画精美的、各种画风的场景,那么绘画相对简单的背景,应该不在话下。
AI的版权问题
AI的著作权问题同样是一个争议的焦点。AI使用的训练材料,来自于对Pixiv等网站的爬虫,早在几个月前,日本画师就呼吁抵制这种做法。这一争议本文先搁置不谈,主要讨论AI产出的图片,是否拥有版权。
我在本科时修过“著作权法学”的专业课,我觉得老师问过“张三养的宠物猴子画了一幅画,那么张三拥不拥有这幅画著作权?张三的猴子拥不拥有?”
答案是均不拥有。因为张三没有参与作画,故而没有著作权,这点类似于张三养的儿子画了一幅画,张三也没有著作权;而张三的猴子不是著作权主体(猴子没有主体资格),所以即便是猴子自己画的,但是它也没有著作权。
当时我的老师说,对于AI,理论上也应当如此。张三调用AI画了一幅画,张三有著作权吗?我想如果只是简单的调用,输入一点表述性词汇之类的,那么是没有的。
那如果是张三通过编程、训练,得到了一个AI及其“知识库”,并且用AI绘画呢?这里国内有一个判例。2018年,腾讯公司的AI产品Dreamweaver写了新闻稿,被别人原封不动搬走。
2018 年 8 月 20 日,腾讯证券官网发布文章——《午评:沪指小幅上涨0.11%报2671. 93 点通信运营、石油开采等板块领涨》,根据该文作者栏显示和文末标注内容,该文腾讯机器Dreamwriter自动撰写。
当日,上海盈讯科技有限公司直接复制该文并发布于旗下的网贷之家网站平台发布。腾讯公司认为该行为侵犯其享有的著作权,以盈讯科技为被告提起诉讼。日前,深圳市南山区人民法院就该案作出了判决。
深圳市南山区人民法院认为,该文由技术团队运用Dreamwriter软件生成,符合作品的要素,具有一定的独创性,属于著作权之客体。该作品系原告公司多团队、多人员在原告公司主持下完成的特殊职务作品,原告公司享有著作权并提出相应主张。被告公司未经许可擅自在自运营网站提供侵权作品,侵害了原告公司享有的信息网络传播权,应承担侵权责任。鉴于被告公司已经删除侵权作品,法院最终判定,被告公司赔偿原告公司经济损失及合理的维权费用人民币1500元。
腾讯公司最终胜诉(虽然是南山区法院判的)。这说明,张三对自己写代码、训练数据的AI的生成物,是有著作权的。
那这么说,NovalAI的作者,对NovalAI画的画有著作权,而用户没有?如果NovalAI是腾讯公司做的,而且在南山区审理,那么应该是如此的。
现阶段,关于AI产出物的著作权,尚无明确的立法。
AI同样有可能画出高重复度,低创作性的作品。例如如下两幅图,前一幅是AI的作品,后一幅是画师-Ask-在2020年的作品。可以看出,AI作品重复度高,可能“抄袭”了人类画师。


AI绘画“调校”化
我认为AI绘画的参数会越来越多,精细度会越来越高,未来也会让用户有更多的操作空间。譬如用户想让角色的裙子长一点、短一点,让裙子上的蝴蝶结数量多一点、少一点,让裙子的颜色深一点、浅一点……如此,需要调控的参数也就越来越多。
也有可能会出现分步骤的操作,而不是在一开始输入一堆信息,直接等待最后的结果。
如果未来这样的话,AI绘画就会更接近于现在“调校”的工作。而目前只输入prompt的AI绘画,更接近于“无参”。
如何修改参数让画面更好?如何修改参数来符合甲方要求?
如此,就会出现AI绘画的“调校师”。而且,这不一定是一个独立的工种,既有的真人画师,同样可以兼任此项任务,也可以将AI绘画作为自己绘画的参考、底稿等。
我对AI绘画持有的态度
正如照相机、3D建模先后问世,这些新技术并没有取代绘画,反而丰富了绘画。
不能像失业的手工业者叫嚷着砸掉机器一般,去叫嚷抵制AI。AI不仅在绘画领域趋于成熟,在语音识别、图像识别、竞技游戏、机器翻译、文字撰写……多个方面,也都日益成熟,AI时代的到来不可回避。
有能力的画师应该把AI据为己有,正如有些画师画服装就上淘宝,或者画透视就用3D建模,这都是完全合理的行为。化“AI绘画”为“AI辅助绘画”。机器翻译问世后,并没有取代人工翻译(譬如游戏的本地化),反而能够更高效地辅助翻译师的工作。
至于AI的著作权归属,也只能呼吁早日立法,阐明其中的规则。让AI的开发商向调用的训练库来源付费不太现实(达到了100TB量级)。这么说,AI开发过程中使用了公共资源,那么其产出也应该公共化。我比较担心上文提到的判例,也就是AI白嫖了公共资源,却又最终成为了少数寡头企业的私有物。

毕竟,AI实现了许多画师多年来的梦想:
