不单单依靠肉眼—AI生成画像识别鉴定工具

艺术之所以特别好,就因为在艺术里不能说谎。在恋爱里,在政治里,在医疗里,都能说谎,能够骗人,甚至可以欺骗上帝——这样的事情是有的;然而在艺术里却没有欺骗。
——俄国小说家,戏剧家 契诃夫

在AI图像生成技术应用逐渐发展的当下,虽然对于单一图像的人眼人工识别还并没有什么太大难度,但是随着技术的发展完善,没有相应美术专业理论与实践技术经验的人群想要有效识别AI生成图像已经开始显得有些困难,尤其是现实图像类的AI生成图像,经过人工的修正修改后,几乎已经难以被大众所简单识别——这给了谣言和诈骗一类犯罪愈加以高速有效的发展温床。
但是如果把AI图像识别交给AI来进行呢?(对付一辆坦克最好的方式就是造另外一辆坦克去对付它,简而言之,要用魔法对付魔法)
与人眼人脑对于画像的从大致轮廓到细部从整体色调到具体物品颜色的识别模式在原理方式上的不同,现今的图像生成类AI(以主流扩散模型为例)从学习到生成都是基于图像相邻像素点的分布规律与关系来进行的,这就导致了一些AI图像在经过专业人士的修改与重绘后可能在绝大多数人眼里已经无懈可击——几乎已经难以发现任何可以确定是AI生成的破绽,但是在识别AI眼里这依旧是一张写满了“我是AI图像”的漏洞与破绽百出的图像罢了,甚至还写上了是出自哪位赛博“大画家”的手笔,StableDiffusion、Midjourney、DALL-E、BingImageCreator。
人类出于本能更多的时候一般以图像内容的合理性为依据,进而判断一张图是否是AI生成,这也是早期以及部分目前非专业人士判断一张图时,更多会从多出和缺少的肢体上,以及不符合常识和透视的背景和物品上着手的原因,在这些方面经过AI的发展被很大程度上改善后,判断点也进而转至在瞳孔发梢服饰花纹,等细部的不合理上。
专业人士则会将注意力放在线条连续性,各种画面节奏结构疏密,光影,人体结构,背景透视物体或人体的空间与穿插关系以及明暗交接面的处理和各种细节的末端处理精度上有哪些反直觉与不符合常理的地方。
而 AI 更多是从图像的参数入手,比如像素的排列方式、清晰度、对比度等。这些观察角度与精度是人类难以达到和根本不会去也无法去关注的地方。也因此即使是经过了大规模人工重绘,鉴别AI依旧能够判断出该图像中是否使用了AI生成技术。
下面我就针对目前市面上比较主流使用的Web端在线识别AI图像生成的网站工具进行列举与介绍。
1·Hive moderation

https://hivemoderation.com/ai-generated-content-detection/?demo=image
Hive是目前市场中准确率最高的,在媒体的测试中是一众识别鉴定AI中唯一一个拿下100%通过率的识别AI,在我的实际使用体验中也确实是目前识别准确率最高的,但是100%显然是样本量太小导致的夸大其词了,但是90-95%的准确率个人体感上还是有的。
同时Hive有提供AI文本鉴定,因为有最小的字数篇幅限制,所以我并没有进行太多的测试,至少英语文本的检测率还行。
Hive同时能够为用户提供一整套的AI检测的商业方案
2·A.I or Not

https://www.aiornot.com/#home
个人体验是个针对性很强的AI,对于二次元类图像与部分重绘加工过后的图像检测准确率不算出众,但是针对Midjourney生成的图片具有较高的识别度,特别是风格偏向写实的图像
3·Sensity

https://sensity.ai/
需要付费使用,不过经过注册后可以免费使用7天。从介绍来看与其它AI的不同在于还能针对GAN网络生成的换脸等图像视频进行检测,同时它与Hive类似能够提供给用户和相关公司一整套的AI生成检测商业解决方案。在媒体测试在中规中矩,实际准确率不明。(或许你可以V我50来让我试试它,我绝对不是为了什么疯狂星期四,什么KFC。)
4·illuminarty

各方面中规中矩的检测AI,优点的话,优点可能就是界面简洁,使用起来很方便吧(啊?)
之所以介绍好几个检测AI其实还有一个作用就是交叉检测,以避免误判的可能性。同时我个人是极不推荐只以一张图片的鉴定结果就断论这张图的作者使用了AI,至少也要有大于10张以上的该图作者的作品能够用于检测,才能得出一个相对可信的结果。这个我觉得完全不是难事——AI发布者基本上不可能只在自己的相关平台上只发布几张作品。这时候可能有人会说:“俺手头里就这几张图俺也不知道是谁发在哪儿的图啊?更不用说找到更多同一人发布的图了”
搜图的话我比较推荐Yandex,这个俄罗斯的搜索引擎目前在以图搜图能力方面非常强(https://yandex.com)
要注意,识别AI并非能够每次都能完全准确的识别出图像是否为AI生成。但是如果一名画师的复数画作中大部分画作都被检测为AI生成,那么从概率学上来讲,基本就可以判定为该创作者在创作过程中使用了AI——通过第三者的被动检测,而非大大方方的主动在介绍与标题或者tag里就写出。

开发侧的措施
实际上对于自身产品被滥用与恶意使用的情况,人工智能的相关开发公司也深受其扰,Adobe的Firefly之所以是以云端模式部署,除了对盗版的遏制和减轻客户端的硬件压力的考虑外,很大程度上也是为了杜绝自身的产品产物被应用与非法或可能引起争议与非法事件之中,列如NSFW类的图像制作。(NSFW (無比較級). 〈网〉 不适宜工作场所("Not Safe (or Suitable) For Work;"),即包含成人影像或图片,可能会冒犯到雇主或同事。)
[BBC:利用生成式AI生成大量儿童相关性虐待及性相关图像产物进行大量传播和贩卖的严重问题。{https://www-bbc-com.translate.goog/news/uk-65932372?_x_tr_sl=auto&_x_tr_tl=ja&_x_tr_hl=ja&_x_tr_pto=wapp}其中点明了以利用Stable Diffusion生成的所谓“2.5D”(实际上是pixiv明令禁止的写实风格)儿童相关的性图像及产品在Pixiv上进行传播与贩卖的行为大量存在的现实情况]

为了遏制这种非法犯罪利用的倾向,Stable Diffusion的开发公司Stability AI.宣布将会在后续升级开发的模型产品中加入针对此类行为的限制,同时今年6月由马里兰大学攻读计算机科学博士的Yuxin Wen向Stability AI.提出了一种在生成图像中嵌入难以被各种手段消除的肉眼不可见的数字水印用于实现对使用者归属信息的追踪技术——「Tree-Ring Watermarks(年轮水印)」
并发表了相关技术论文。

[2305.20030] Tree-Ring Watermarks: Fingerprints for Diffusion Images that are Invisible and Robust
https://arxiv.org/abs/2305.20030
Tree-Ring Watermarks的原理是在图像生成过程中将傅里叶变换生成“信息密钥”合并到随机噪声数组(即初始值)中,这个“密钥”在经过标准的生成过程将随机噪声转换为清晰图像后,仍然以微小的潜在布局变化的形式存在,即使人工进行检查,也无法将其与其他随机生成的图像区分开来。

通过在扩散模型中反向处理带有键的图像,可以恢复原始的随机噪声,并确认键的存在与否。由于键是在傅里叶空间中刻录的模式,因此有研究团队目前对该技术进行了验证测试,发现变换图像分辨度对电子水印的影响几乎可以忽略不计,而相比现有的其它方法,它对于裁剪、颜色变更、翻转、旋转和添加噪声等编辑操作更为坚固可靠。
目前该技术已经可以通过API接口与现有的生成式图像人工智能模型进行直接组合调用。
GitHub - YuxinWenRick/tree-ring-watermark
https://github.com/YuxinWenRick/tree-ring-watermark
实际上针对规制AI图像生成技术的研究早在去年10月之前就已经有不少研究开展与成果发表,例如防止AI学习的图像处理与加密技术,破坏i2i生成的图像处理技术等。
只是显然AI以打破一切法律伦理道德底线束缚为代价的野蛮生长的速度与趋势让所有人都措手不及。
关于针对AI图像生成的规制遏制规范技术目前的技术方法研究进度和相关介绍,我会在之后再单独写一篇专栏来专门介绍
在年初就有芝加哥大学的研究小组携手艺术家社区正式推出了人类历史上第一个防止AI学习图像的免费技术软件Glaze,尽管效果差强人意,但也标志着这种以后必然长期大规模存在的攻防拉锯战正式打响。


你憎恨被别人欺骗吗?那就不要去欺骗别人。
——古罗马传教者 克里索斯托