Bendi新闻
>
不用 20 张图!一张图就能生成 AI 头像,这个来自中国团队的项目太好用了

不用 20 张图!一张图就能生成 AI 头像,这个来自中国团队的项目太好用了

5月前

前两天,一个来自小红书的大佬发了个新项目——InstantID,是用一张你的随意角度的照片,就能生成一个 AI 头像。
比如这样:
它的使用非常简单,打开 Hugging Face 上的 Demo 页面:
https://huggingface.co/spaces/InstantX/InstantID
然后上传一张图片、写或者不写 prompt都可以、点击 Submit 等待 30 秒左右就可以拿到图片了。
在不了解技术细节的初体验下,方便、快速、效果好是第一印象。不需要像之前的同类产品那样,需要特定角度的照片或者是很多张照片,一张足矣。
这个项目说是 AI 个性化图片生成领域的重磅炸弹显得有点一惊一乍的,毕竟现在 AI 界每天值得“震撼”的新闻太多了。
但 InstantID 这个项目在 X 上,一众大佬都关注到了这款产品,比如Yann LeCun:
Yann LeCun想要一个钢铁侠的衣服,于是这个项目的作者亲自下场,做了一组漫威LeCun宇宙:
据InstantX Team表示,他们采用的即插即用(plug-and-play)模块只需使用单张面部图像就能处理各种风格的图像个性化工作,同时确保人物面部的高保真效果。几位团队成员都亲自下场做了一系列自己的 AI 头像:
和其他同类型的产品相比,InstantID有几点不同:
首先,InstantID不训练 UNet,因此可以保留原始文本到图像模型的生成能力,并与社区中现有的预训练模型和 ControlNets 兼容;其次,InstantID不需要在测试时进行调整,因此对于特定的字符,不需要收集多张图像进行微调,只需要推断一次单一图像。而且在实际应用中不难发现,InstantID实现了更好的人脸保真度,并保留了文本的可编辑性。
通过风格的选择,可以用一张图实现多个风格的变换。
除了出色的一致性之外,还可通过提示词进行二次加工,同时也展现了与现有 ControlNet的兼容性。
在有多张参考图像的前提下,会取 ID 嵌入的平均值作为图像提示。其实一张图的时候效果就已经很不错了。
在官方的 Paper 中,还探讨了几个有趣的使用案例。其中包括视图合成,InstantID 可以在保持角色一致性的同时创建新的视角和角度。比如创建一张 20% 泰勒斯威夫特和 80%杨幂长相的图片。
以及 InstantID 无缝融合多种身份特征的能力,能管理涉及多个角色的复杂场景。这些应用都展现了 InstantID 在各种创意和实际环境中的多功能性和有效性。比如像是人类与萌宠相结合:
在论文中还有一些跟过去原有技术的对比,感兴趣的可以直接在官方页面查看:
https://instantid.github.io/
目前可以查到的,InstantX Team的主要成员之一王浩帆,是一名来自小红书的研究工程师(research engineer),主页链接:
https://haofanwang.github.io/
之后我们会持续关注InstantX Team这个团队的进展,也会有更多这样的新项目分享给大家,有好的项目也欢迎各位向我们安利。


欢迎加入这个星球,见证硅基时代发展↓


点个在看,再走吧👀

微信扫码关注该文公众号作者

来源:硅星人Pro

相关新闻

外挂来了!中科院博士都在用的AI工具,不用翻墙就能用!2小时就能完成一篇SCI……“别肝论文了!用好AI,20分钟就能完成!”与同行聊天记录曝光后,网友都看傻了!爽!AI工具用得好,20分钟就能拿下1篇SCI?实战攻略来了……(内附提示词)开源日报 | AI PC价值在哪?Windows格式化对话框的UI用了30年;丑头像生成器;独立Redis Copyleft分支豪赌!哈佛辍学华人竟然发布了只支持Transformer一种算法的AI芯片,一张顶20张H100 ,比GB200快“羡慕走线的人,不用花这么多钱,来了美国就能工作”!中国留学生感叹留美太难...现在都用AI画分析图了!麦当劳塌房了!一张麦当劳工作人员的图,刷爆小红书和外网!“好恶心,再也不去了!”就因为我用了AI出图,甲方逼我辞职...ChatGPT不注册就能用了;苹果公布生成式AI新进展;阿里云AI001号员工上岗丨AIGC大事日报用AI画分析图,真的太方便了!“还不如走线好了,不用花这么多钱,来了美国就能工作”!中国留学生感叹留美太难...库存告急!这个30分钟就能独立演奏的乐器,最后的入手机会来了!无限回购!别看的瓶子小、是国产,大油头用了就知道有多好!一张图证明,你爸妈来美国了!笑着笑着就哭了......超复杂的流程图PPT,用上这招简直绝了!炸裂更新!这个最像人类的机器人又进化了,还能模仿马斯克抢爆了!百元起就能入手亚瑟士新出的跑鞋,实在的太好穿了!小米的PPT,只有一张丑图和一段文字,这样排版太高级了!AI 鲜测|2024 年谁还用手画原画啊!直接 Midjourney 生成就行了中国版 Sora 来了!一键生成 16 秒 1080P 视频,清华系团队能对标 OpenAI 吗?太真实了!一张图证明,你爸妈来美国了!求求你,别再做奇奇怪怪的分析图了!马岩松也用AI出图了吗?
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。