国际科技财经移民娱乐民生时事体育

>

AI美女全军覆没！赛博照妖镜下集体变“鬼”，AI代码拆台AI生图

AI美女全军覆没！赛博照妖镜下集体变“鬼”，AI代码拆台AI生图

5月前

明敏克雷西发自凹非寺
量子位 | 公众号 QbitAI

赛博照妖镜下，AI美女全变鬼。

来看它的牙。

把图像饱和度拉满，AI人像的牙齿就会变得非常诡异，边界模糊不清。

整体图片的颜色也正常，麦克风部分更是奇怪。

对比真实人类照片，则应该是这样的。

牙齿是清晰的，图片色块都是均匀一致的。

这个工具已经开放，人人都能拿着照片去试试。

AI生成视频中的某一帧，也难逃此大法。

不漏牙的照片也会暴露问题。

不过BTW，这个工具出自Claude之手。用AI破解AI，奇妙的闭环。

有一说一，最近AI人像太逼真又引发了不小讨论，比如一组大火的“TED演讲者视频”，其实没有一个是真人。

不只是人脸难以区分，就连之前AI的短板——写字，现在都能完全以假乱真。

更关键的是，生成这样的AI人像，成本也不高。低至5分钟、每20秒1.5美元（人民币10块左右）的价格即可搞定。

这下网友们都坐不住了，纷纷搞起AI打假大赛。

近5千人来讨论，这两张图到底哪张是真人。

给出的理由五花八门。有人发现文字、花纹细节很抽象，有人则觉得人物眼神很空洞……

最先进的AI们生成人像有啥规律，逐渐被大家摸索出来了。

不看细节已很难分辨

汇总来看，调整饱和度或许是目前最快速辨别的方法。

AI群像照在这种方法下暴露得更加彻底。

不过它存在一个问题。如果图像用JPEG算法压缩过后，该方法可能失效。

比如确定这张照片是真人照片。

但是由于画质压缩以及光线等问题，人物牙齿也有点模糊。

所以网友们还列出了更多分辨人像是否是AI合成的方法。

第一种方法，简单说就是依靠人类的知识判断。

由于AI学习图像的方式和人类并不一致，难免无法100%掌握人类视角下的视觉信息。

造成的结果就是，AI生成的图片常常包含与现实世界不符之处，这就为图像的鉴别提供了着手之处。

用开头的这张图片作为例子。

从整体上看，人物的皮肤过于光滑，看不到任何的毛孔，这种过于完美的特征反而增加了不真实感。

当然这种“不真实感”并不完全等同于“造假”，毕竟经过磨皮处理的图片同样看不到毛孔。

但这也并非唯一的判断因素，AI在图片中留下的与常识的出入也未必只有一处。

实际上，这张图只要稍微看以下细节，就能看到一个比较明显的特征——胸牌上方挂钩奇特的连接方式。

还有在高饱和度模式下露出破绽的麦克风，放大之后直接用肉眼也能看出端倪。

更为隐蔽的是，头发末端有几根毛发的位置很不合理，但这样的特征，恐怕要拥有列文虎克级别的视力才能看到了。

不过，随着生成技术的进步，能够找到的特征越来越隐蔽，也是一个无法避免的趋势。

还有一种方法是看文字，虽然AI在字型的刻画上正逐渐克服“鬼画符”的问题，但正确地渲染出有正确实际含义的文字还存在一些困难。

比如有网友发现，照片中的人佩戴的胸牌上，Google标志的下方最后一行字中的两个字母是“CA”，表示美国加州，前面的一大长串应该是城市名。

但实际上，加州根本没有名字如此之长的城市。

除了这些物体本身的细节，还有光线、阴影等信息也可以用来判断真伪。

这张图片是从一段视频当中提取的，在它所在的视频当中还有这样的一帧。

在话筒右侧的位置，有一片十分诡异的阴影，这片阴影对应的是人物的一只手，显然AI在这里处理得有所欠缺。

说到视频，由于涉及前后内容一致性，AI倒是比在静态图像中更容易露出鸡脚马脚。

还有一些特征不算“常识错误”，但也体现出了AI在生成图像时的一些偏好。

比如这四张图，都是AI合成的“普通人”（average people），有没有发现什么共同之处？

有网友表示，这四张图里的人，没有一个是笑脸，这点似乎就体现了AI生图的某种特征。

针对这几张图而言确实如此，但这样的判断方式很难形成系统，毕竟不同的AI绘图工具，特点也都不尽相同。

总之，为了应对逐渐进步的AI，一方面可以加大“列文虎克”的力度，一方面还可以引入像拉高饱和度这样的图像处理技术。

但如果这样的“量变”积累得越来越多，肉眼判断也会越来越困难，图像饱和度可能也有被AI攻破的一天。

所以人们也在转变思路，想到了“以模制模”的方法，用AI生成的图片训练检测模型，从图像中分析更多特征。

比如AI生成的图像在频谱、噪声分布等方面存在许多特点，这些特点依靠肉眼无法捕捉，但AI却能看得很清楚。

当然，也不排除检测方法落后、跟不上模型变化，甚至模型开发者专门进行对抗性开发的可能。

比如前文一直在讨论的这张图片，某AI检测工具认为它是AI合成的概率只有2%。

但AI造假和AI检测之间的博弈过程，本身就是一场“猫鼠游戏”。

所以在检测之外，可能还需要模型的开发者也负起一些责任，例如给AI生成的图片打上隐形水印，让AI造假无处遁形。

AI魔高一尺

值得一提的是，如上引发恐慌的AI人像，不少都是由最近爆火的Flux生成/参与制作。

甚至大家已经开始默认，效果太好难以分辨的，就是Flux做的。

它由Stable Diffusion原班人马打造，发布才10天就在网络上掀起轩然大波。

这些精美的假TED演讲照片，都是出自它手。

还有人用Flux和Gen-3一起做出了精美的护肤品广告。

以及多角度的各种合成效果。

它很好解决了AI画手、AI生成图片中文字等问题。

这直接导致现在人类区分AI画图，不能再直接看手和文字了，只能盯着蛛丝马迹猜。

Flux应该是在手部、文字等指标上加强了训练。

这也意味着，如果当下的AI继续在纹理细节、色彩等方面下功夫训练，等到下一代AI画图模型出来时，人类的辨认方法可能又要失效了……

而且Flux还是开源、笔记本电脑上可运行的。不少人现在已经在Forget Midjourney了。

从Stable Diffusion到Flux，用了2年。

从“威尔史密斯吃面条”到“Tedx演讲者”，用了1年。

真不知道以后为了分辨AI生成，人类得想出哪些歪招了……

参考链接：
[1]https://x.com/ChuckBaggett/status/1822686462044754160
[2]https://www.reddit.com/r/artificial/comments/1epjlbl/average_looking_people/
[3]https://www.reddit.com/r/ChatGPT/comments/1epeshq/these_are_all_ai/
[4]https://x.com/levelsio/status/1822751995012268062

— 完 —

量子位年度AI主题策划正在征集中！

欢迎投稿专题 一千零一个AI应用，365行AI落地方案

或与我们分享你在寻找的AI产品，或发现的AI新动向

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

微信扫码关注该文公众号作者

来源：量子位

相关新闻

赛博照妖镜，AI美女集体变“鬼”！AI生图、扩图、去水印……全免费！「Sora 平替」Viva 玩了把大的演示文生图时出现sleep代码，华为回应造假嫌疑；微软将中国AI团队集体打包到美国；百度ECharts创始人“下海”养鱼｜Q资讯和AI「赛博爱情」的时代已经到来特斯拉中国全系降价 1.4 万；华为 Pura 70 手机开售，5499 起；全球「AI 美女」大赛开启 | 极客早知道 “这图一眼就是AI！”那你能展开讲讲么？AI生图可“量身定制”了，华为&清华联手打造个性化多模态生成方法PMG AI浪潮下的“首届”奥运会！巴黎2024开幕在即，AI运动员助手、AI裁判员齐上场屡禁不止！AI生成“裸体图片”席卷澳洲社交媒体，知名学校被卷入！专家深感担忧 “AI文生图”争议，王迁教授的这个观点，至少听两遍！AI「导师」进哈佛！7x24小时辅导CS课程，RAG或成AI教育最后一块拼图阿里1号AI「员工」上岗，007写代码助攻大厂程序员！炸掉祖传屎山代码，Java丝滑改Python OpenAI组建「集体对齐」新团队，确保AI模型与人类价值观保持一致！提前两个月“抢跑”！谷歌Pixel发布会成AI“秀场”，安卓手机未来集体“上车”Gemini，苹果慌不慌？和AI恋爱的年轻人，喜提“赛博亡夫”IJCAI 2024 | 第九届“信也科技杯”全球AI算法大赛正式开赛！聚焦AI尖端赛题，31万奖金池等你挑战！假扮名媛21天免费吃喝，和AI自己谈恋爱…央美女生的“作妖”日常，感动无数人全网无平替的国产AI聊天软件，成了几十万网友的“赛博亡夫”「汪汪」to Vector！密歇根博士生用AI解码狗的声音 | LREC 2024 微软炸裂级单图生数字人，Sora同款思路，“比AI刘强东还真”日均tokens使用量超5000亿，AI生图玩法猛猛上新：豆包大模型为什么越来越「香」了？十年磨一「图」，谷歌震撼发布纳米级人脑图谱！AI加持人类大脑研究 AI也造代码屎山！研究发现GitHub Copilot代码可维护性差，偏爱“无脑重写”而非重构复用已有代码 4名中国学生赴美被关“小黑屋”，3人被遣返！都是理科生，2人研究AI