Bendi新闻
>
ECCV 2024 | 南洋理工三维数字人生成新范式:结构扩散模型
ECCV 2024 | 南洋理工三维数字人生成新范式:结构扩散模型
3月前
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]
论文标题:StructLDM: Structured Latent Diffusion for 3D Human Generation
论文地址:https://arxiv.org/pdf/2404.01241 项目主页:https://taohuumd.github.io/projects/StructLDM 实验室主页:https://www.ntu.edu.sg/s-lab
结构化自动解码:给定人体姿态信息 SMPL 和相机参数,自动解码器对训练集中每个人物个体拟合出一个结构化 UV latent。该过程的难点在于如何把不同姿态、不同相机视角、不同着装的人物图像拟合到统一的 UV latent 中,为此 StructLDM 提出了结构化局部 NeRF 对身体每个部位分别建模,并通过全局风格混合器把身体各部分合并在一起,学习整体的人物外观。此外,为解决姿态估计误差问题,自动解码器训练过程中引入了对抗式学习。在这一阶段,自动解码器把训练集中每个人物个体转化为一系列 UV latent。 结构扩散模型:该扩散模型学习第一阶段得到的 UV latent 空间,以此学习人体三维先验。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
来源:机器之心
相关新闻
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像,中科大哈工大度小满出品Stability AI开源上新:3D生成引入视频扩散模型,质量一致性up,4090可玩港大和字节提出Groma:多模态大模型新范式!模拟人类先感知后认知,精确定位图中物体!商汤进入2.0时代:“日日新”大模型驱动生成式AI业务收入率先突破10亿巧解「数据稀缺」问题!清华开源GPD:用扩散模型生成神经网络参数|ICLR 2024量化大模型退化严重?ETH北航字节推出LoRA新范式 | ICML 2024清华提出时间序列大模型:面向通用时序分析的生成式Transformer | ICML 2024ICML 2024 | 面向第三代推荐系统:Meta提出首个生成式推荐系统模型一秒侦破大模型“高分低能”:贾佳亚团队联手剑桥清华等共推评测新范式扩散模型也能推荐短视频!港大腾讯提出新范式DiffMMICML 2024 | 量化大模型退化严重?ETH北航字节推出LoRA新范式库克称苹果今年引入生成式AI;文心一言数字分身功能内测;商汤大模型体系日日新4.0发布丨AIGC大事日报ECCV 2024 | 数字人也懂惯性定律!上海AI Lab团队提出3D人体姿态序列建模港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体ECCV 2024 | ZigMa:Mamba遇见扩散模型!强强联合!大模型卷爆数字人:5分钟实现定制,跳舞主持带货都能hold住大模型卷爆数字人:一句话5分钟实现定制,跳舞主持带货都能hold住生成扩散模型漫谈:信噪比与大图生成(下)CVPR 2024|让图像扩散模型生成高质量360度场景,只需要一个语言模型Diffusion4D:首个4D视频生成扩散模型!数分钟内实现4D内容生成,超81K的4D数据集已开源!3D重建范式变革!最新模型MVDiffusion++:刷新视图合成和3D重建SOTA!3D重建范式变革!最新模型MVDiffusion++:无需相机姿态,即可实现高清3D模型重建南大周志华团队8年力作!「学件」系统解决机器学习复用难题,「模型融合」涌现科研新范式品牌人说 | 空手:增量大模型,数字时代的品牌方法论