跳转至

人和机器

这里讨论是 StableDiffusion 绘制图像的特征。这些差异是目前正在被优化和需要优化的。

本节内容假定了插图要么是 Ai 绘制要么是人类绘制,且插图中包含脸部描写。下面的技巧只用作参考,因为人和 Ai 的绘画并没有明确的划分,这里更多讨论的是 Ai 插图的缺陷。

这里没有讨论 Img2Img 的技术,在 Img2Img 下,人和机器的差异已经看不清了。

本节内容不能作为你在评论区指责其他人的依据

内容译自 human-or-ai-walkthrough

不能根据

完成度

目前由 StableDiffusion 绘制的插图完成度已经逼近甚至超越了真人画师,所以粗略查看是无法区分是否由 AI 绘制。

主题/风格/氛围

通过学习 prompt editing ,任何人都可以很好的摆脱 StableDiffusion 默认的绘画风格,并让 Ai 生成符合主题/绘画风格的图片(越知名则越容易,例如京都动画的风格)。所以根据插图的主题,画风特征判断已经不可行了。

如何判断

既然不能根据画风或主题鉴别 Ai 绘画,那么我们只能从细节入手。Ai 不擅长保持细节一致,而人类很容易保持细节的一致性。

左右眼形状和高光的一致性

这是最明显的特征。对于人类,除非有特殊原因,如人物处于特殊情况或采用特效,否则左右眼和高光的形状和数量是一致的。

然而,在人工智能绘画的情况下,左眼和右眼的绘画和高光几乎肯定是不同的。人类可以理解 "左眼和右眼在物理上是相同的形状,在相同的情况下,那里当然是一致的",而人工智能却无法理解绘画背后的原理。

其中最明显的是 "高光与眼白融为一体,瞳孔破碎"。人类知道 "首先是眼球,然后是瞳孔,在此基础上,周围的光线反射形成光泽",所以 "即使瞳孔的一部分被高光挡住,瞳孔本身的形状也不会被破坏"是理所当然的,但人工智能不承认任何 "眼白、瞳孔和亮点之间的逻辑关系",它只学习最终的结果。眼睛的不自然变形是判断的另一个依据。人类知道眼睛本质上是一个规则的圆,但人工智能却不知道。

Ai 绘制插图的另一个特点是,它通常会稍微改变左眼和右眼的颜色。当然也有左右两边眼睛颜色不同的角色,但在大多数情况下,这些角色都可以清楚地识别为具有不同颜色。它是可以用来判断一个角色是否一眼看去颜色相同,但仔细观察却又不同的因素之一。

然而,这并不是一个重要的依据,因为这样的插图很常见。 另外,左眼和右眼的颜色因周围环境的不同而显得不同,这是很自然的事情,所以不要搞错。

左右眼的睫毛的一致性

在人类绘制的插图中,睫毛通常是沿脸部中心线对称的。 然而,在人工智能生成的插图中,出现在左眼和右眼的睫毛的数量和位置通常是不同的。

然而,即使在人类绘制的插图中,左眼和右眼的睫毛形状也会有一定程度的差异,所以即使左眼和右眼的睫毛形状不同也没有什么关系。另一方面,如果睫毛的形状从左到右是一致的,同时还有眼睛和高光,那么几乎可以肯定它是由人绘制的插图。

服装的对称性

人类知道 "大多数衣服都是对称制作的";人工智能不知道这一点,但它在某种程度上知道服装设计往往在左边和右边有相似的形状。

结果发生这种情况:

这件衣服有一个对称的设计,但仔细观察,左右两边的设计在拓扑学层面上明显不同。

需要注意的是,特征应该是 在拓扑学(=形状的连接,件数,......)层面上是不同,而不是 对称或不对称。 即使是人类不可能把对称的物体画得完全对称,会出现一些尺寸和形状的失真。不对称的服装设计也很常见,所以不要搞错。

这种不对称性不仅可以适用于服装,也可以适用于皇冠和发饰等装饰品。

重复形状的一致性

这也是一个主要的特征,Ai 不擅长连续绘制相同的形状,即使是一件衣服上的一列纽扣。

当然,即使是人类画出来的,也会稍有偏差,有时还会故意不绘制整齐,所以很难说。但最起码人工智能不可能像人一样故意将相同的形状以相等的间隔排列。

简单的几何形状

人工智能并不擅长画直线、规则的圆和一定大小的干净的椭圆。 这是因为人工智能不知道这些形状的构思。但 Ai 很擅长在背景中画直线,建筑物的边缘、管道等往往被画成直线。

如果插图中出现了简单、清晰的形状,就可以用来判断这幅插图是由人制作的。

人工制品的功能一致性

人工制品的各个部分应该天生具有 "它放在那里的意义 "和 "它提供的功能"。

因此,如果有一个人工制品,它是各部分的聚合,而这些部分是一致的意义,以提供一个特定的功能,我们可以判断该插图是人类绘制的。

需要注意的是,这种不一致的情况不应该被用来判断一幅插图是由人工智能绘制的 这是因为人类也可以有意地画出这样的插图。这只意味着人工智能无法绘制足够好的机械插图。

字符

人工智能无法正确绘制真实的字母。 大多数时候,它输出的字母看起来有些未来主义,或者好像它们是在一个完全不同的文明中发明的。

这是一个非常明显的特征,但需要注意的是,这不应该被认为是人工智能绘画的特征。 人类自然有可能设计出他们从未见过的字母,有许多插图中的神秘字母就是这样设计的。

另一方面,如果字母被画在'正确的位置'和'适当的顺序',这是确定该插图是由人画的一个强有力的因素。 这是因为即使是输出格式良好的文本也很困难,对于今天的人工智能来说,把它放在正确的地方是一项极其困难的任务。

行的作用的一致性

在人类绘画中,绘制物体边界的线不能在线的中间突然变成另一个物体的边界。线条也不能在物体的内部和外部之间变换。

人工智能不知道线条应该是一致的。遇到相近的像素点,它很容易地以 哦,我连! 的想法把线顺理成章地连接起来,渲染成一条线。

溶解、融合和噪点

这是人工智能生成的插图中非常常见的一点。 内部/外部的判断变得模糊不清,导致物体溶解,与其他物体融合,或产生不自然的噪点。

噪点和溶解目前可以通过超分和增量训练进行修复。

背景色

用头发或其他物体(如手臂)围成的一个本应是空的空间,AI 有可能会画成与周围环境不同的背景。通常情况下,封闭的背景被涂上比其他空间稍亮的颜色。

不连续

人类了解一个物体被另一个物体遮挡时,同一物体持续存在于它的下方。人工智能并不了解,即使是一根头发的短暂中断,也可能导致前后对象之间失去连续性。

细节

人类可以理解,物体的大小与它对画面的重要性无关,因此,即使是小的物体,如耳环或皮带,如果它们是画面的重要元素,也会被仔细画出来。 对这种小物体的精心绘制是决定插图是由人绘制的一个主要因素。