人类对AI最大的误解,来自AI扩图
这几天,在各大媒体榜单中,你一定看到过“AI扩图”的话题。
为什么会火?
可以说,AI扩图的火爆程度和搞笑程度不相上下。
先上一张传播度很高的AI扩图“佳作”:
这位博主凭借这一条视频单条视频点赞量171.7万,转发量213.2万,评论区有23.2万互动量。
许多网友纷纷效仿,在评论区留下自己通过AI扩图后的离谱照片,有些评论都能达到几万到几十万的点赞。
当然,明星和影视剧成了AI扩图搞笑创作的“重灾区”,有这样:
AI扩图仿佛打开了一扇新世界的大门,让普通人和AI也能轻松发生交集,只是可能会让人类产生“AI很弱”的错觉罢了。
其实,专业选手是十分惊艳的。
AI扩图的顶流们
但,作为AI扩图圈的大哥大,Adobe Firefly可不是用来搞笑的。
它需要用户使用画笔进行添加或减去图片内容,进行局部重绘。随后,就可以输入新的描述词进行再创作。
值得一提的是,Adobe向Photoshop Beta用户免费开放公测的AI功能——Generative Expand,其核心功能就是扩展。
这就是Midjourney在它最新5.2版本中带来的Zoom Out功能。
效果一出,不少网友在惊叹“太疯狂”之余,也在猜测着它“扩”了多少次,有网友大胆地给出了预估:50次!!
更多网友则是纷纷自己开始搞花活,不到一个小时,直接出一部大片:
如此来看,MidJourney的扩图功能还是相当可以的。
此外,还有我们前几天介绍过的——Pika1.0。其可以完成视频的扩展。
AI扩图另类出圈
真的很想撬开AI的脑袋,看看它到底在想什么?!
不过,作为一款娱乐工具,可以给它们打个满分,毕竟它为很多博主带来了不少的粉丝和流量。
真正的AI扩图技术
针对AI扩图,其实不管是Midjourney、Photoshop、DALL-E 2还是Stable Diffusion,其背后原理也有些相似之处。
像DALL-E、Stable Diffusion、Photoshop的Generative Fill等都用到了一种叫做Outpainting的技术。
Outpainting是一种图像处理技术,与Inpainting(图像内部填充)相反,可以根据现有图像的内容、风格和上下文,合成与原始图像相协调的新内容,从而扩展图像的视觉范围。
Outpainting通常依赖于深度学习模型,有基于内容扩散的、基于GAN的、基于语义理解的等。
此外,AI扩图不仅是增加像素的数量,更重要的是增加图像分辨率的过程。
例如,CNN是AI扩图中常用的神经网络,通过学习大量的低分辨率和高分辨率图像对,来理解图像特征,学习如何从低分辨率重建高分辨率图像。
超分辨率技术使得模型能够填补低分辨率图像中缺失的像素,从而生成更高分辨率的图像。
在扩图过程中为了保证图像细节还要注意细节增强、噪声抑制等。
虽然目前AI扩图技术有了很大进展,但实时处理能力还有待提升,通常来说更高质量的图像扩展需要更多的计算时间。
现有的很多AI扩图工具生成速度已经有了不小的提高,不过成品的质量是否符合逻辑,这个概率还是比较随机的。
「往期推荐」
微信扫码关注该文公众号作者