欢迎光临散文网 会员登陆 & 注册

该如何看待现阶段的AI绘画?

2022-12-25 13:07 作者:蓝鲸泽维尔  | 我要投稿

不管你是打算用AI做事,还是想寻找对抗AI的思路,看完你都会有收获。

AI绘画作品的生成可以分为三个阶段。

  1. 收集现实中的图片形成训练集。如现在主流AI绘画模型所依赖的公开训练集LAION-5B,包含几亿张从互联网上无差别收集的图像,这种收集肯定是没有授权的。除了这些比较大的图集外,很多模型还使用了非公开的,按特定条件收集的,比较小的图片集,比如像素、二次元等,对公开训练集生成的模型进行二次、三次训练。这些训练集一般只需要几千张,背后有没有授权也无从查证。这些训练集提供给AI的信息有两个,一是图像,二是图像备注的文字信息。这些图集的大小约几个TB。

  2. 通过大型语言模型(LLM)技术,对大规模图集进行成本高昂的计算,把图像和图像备注的文字信息分别解码之后,再重新联系起来。这种联系不是简单的图片-文字,而是图像特征-自然语言。AI不是按照人类给出的条件去分类图像,而是解码人类对图像备注时用到的逻辑,再以这个逻辑建立起一个人类看不到的数码空间。这个空间就是潜在空间

    Stable Diffusion公布出来的那几个G的模型文件,其实就是这个潜在空间的一个截面,里面存储的不是那几个TB图像的压缩版本,而是AI所计算出来的,那些图像和图像备注的文字信息之间蕴含的内在逻辑。

    在这个模型基础上,利用一些小规模训练集进行二次、三次强化,提升它在某些文字上的逻辑后,就形成了一些新的衍生模型,如像素、二次元等。

  3. 使用者用特定程序读取模型后,输入任何文字,都可以按这个逻辑在潜在空间中抓取对应的图像特征,再通过一定程序绘制出来。或者,也可以输入任何图像,看看它在潜在空间中能联系到的文字描述是怎样的。

    这个图像特征的绘制过程,选择让程序展示每步计算生成的图像就能观察到。它的原理是利用一张色块随机分布的噪点图,计算其中的数码排列是否符合你输入文字在潜在空间中所代表的特征值,符合的留下,不符合的删除。经过多步计算,图像稳定下来之后,使用者把它保存下来进行展示。这就是所谓的“AI绘画”。它的多样性和随机性主要是由随机噪点图和文本引导词背后所代表的图像特征来控制的。

    AI绘画程序给出的图像,是使用者用一些文字性提示,让绘图程序按模型文件中存储的内在逻辑读取到相关的图像特征之后,再经过一定的计算将它呈现出来的。

这三个阶段总结起来就是,收集用人类语言标注的图像,让机器进行分析计算,模拟出人类语言与它所代表的图像特征之间的联系逻辑后,再按照这个逻辑,根据人类的提示重新呈现出相应的画面。


现在争议最大的几个问题是

  • 这三个阶段组成的AI绘画生产过程,是否存在侵犯版权行为?

  • 生成的AI绘画产品,版权属于训练集中图片的版权所有者,属于模型文件的计算者、绘图程序的开发者,还是属于使用绘图程序生成图像的使用者?

  • AI绘画作品如果进入市场,该如何判断它的合理价格?

  • 如何评价它的创意、制作难度和艺术价值?

要回答这几个问题,你必须在理解AI绘画生成原理和过程的基础上去思考。

对前三个问题,本质上其实是一种经济利益的博弈,分析起来会非常复杂。

对第四个问题,要探究AI生成物和艺术的关系,我有几句话一直不吐不快。

  • 不是只有画师、画工、美术专业人士才有资格搞艺术。实际上国际艺术圈最有影响力的人物中,很多人都不是纯画家。绘画与展馆现场、社会语境、其他艺术形式的结合才是现在的主流。

  • AI绘画只不过是人工智能发展中一个很小的副产物。大型语言模型基于人类语言对图像特征的深度解码,是在远远超越人类思维的基础上进行的,由此形成的这个逻辑,也就是潜在空间,是人类看不到的新世界。AI生成物的本质其实是对潜在空间的一种探索。

    创造这个潜在空间的意义,是为了让AI模仿人类视觉去“看”,再用人类语言去“说”,或者把这个过程反过来进行。

    把这个技术理解成“制造绘画机器人以淘汰画师”,未免太过狭隘了。

  • AI绘画不是随机和排列组合,用几千万个参数定义的一个语义,绝不是颜色、纹理、滤镜、图层那么简单。只不过它现在由于算力、训练成本和训练集质量的原因,还不能做到对人类图像-语义逻辑的准确模拟,所以表现出来一种无法控制的感觉。

  • AI绘画的创造力还有待开发。现阶段的潜在空间,对人类语言-图像特征逻辑的模拟还非常不准确,很难真的用自然语言设计和精确控制图像。离真正意义上的“用嘴画画”还差得很远。

所以拿到一张可能是AI生成的绘画作品,该如何评价?

  • 划分AI与人工? 这一点以后会越来越难办到。所谓的细节错误会随着模型迭代而减少,而且对LLM模型少数特征值的强化训练成本并不高。随着人工修图+AI生成的合作式绘画普及,按这个标准去评价以后基本是不太可能的。

  • 纯AI生成物中有无人类创意? 随着潜在空间的发展,AI的逻辑更加贴合人类语言的图像逻辑之后,纯AI生成物中的人类创意成份会越来越高。但在现阶段来讲,纯AI生成物体现的更多是人工智能技术的进化,是AI模型的迭代在推进它的发展。自然语言使用者的参与度还是仅限于一种测试和探索,提不到创意和设计的高度。

  • AI生成物与其他艺术的融合?小便池和墙上的烂香蕉是不是艺术?把它放在特定语境中,会不会比人类绘画更有意义?这些问题几十年前就有人探讨过了。

我的看法是,现阶段的AI绘画作品,对潜在空间的探索和把AI生成物放进特定语境的尝试,可能比它的画面本身更重要。

(完)





该如何看待现阶段的AI绘画?的评论 (共 条)

分享到微博请遵守国家法律