Bendi新闻
>
DiT架构大一统:一个框架集成图像、视频、音频和3D生成,可编辑、能试玩
DiT架构大一统:一个框架集成图像、视频、音频和3D生成,可编辑、能试玩
6月前
基于 Diffusion Transformer(DiT)又迎来一大力作「Flag-DiT」,这次要将图像、视频、音频和 3D「一网打尽」。
论文地址:https://arxiv.org/pdf/2405.05945 GitHub 地址:https://github.com/Alpha-VLLM/Lumina-T2X 模型下载地址:https://huggingface.co/Alpha-VLLM/Lumina-T2I/tree/main 论文标题:Lumina-T2X: Transforming Text into Any Modality, Resolution, and Duration via Flow-based Large Diffusion Transformers
试用地址 1:http://106.14.2.150:10021/ 试用地址 2:http://106.14.2.150:10022/
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
来源:机器之心
相关新闻
更美图像生成、直出分钟级视频,国产自研DiT架构的越级之旅知名学者与顶级投资人领衔!视频、3D、音乐生成玩家都来了,中国生成式AI大会嘉宾阵容更新,4月开启!能治好180高血压和腹泻、开车多活30年、10多万汽车0元购……这个车圈老板玩大了年轻人的闲鱼账号:一种能玩、能赚的新型“电子财产”统一角色、百变场景,视频生成神器PixVerse被网友玩出了花,超强一致性成「杀招」大模型如何用于游戏?游戏玩家代理与大模型综述:方法、应用与挑战宝可梦公司启动调查!《幻兽帕鲁》CEO采访:没有侵权、玩法更像方舟震惊全球!2024年科技大势曝光!奇特新玩意亮相美国!静音口罩、月球漫步鞋、透明电视、智能马桶升级,还有这些...【酷玩一日】7.10 周三出发,超级美国梦、龟背动物~ 多行程可选~嗨翻玩乐一整天!乱了!印度找工团抢占加拿大:随时上岗能搬家!网友怒曝简历、面试造假玩出花!乱了!印度找工团抢占多伦多:随时上岗能搬家!网友怒曝简历、面试造假玩出花!国内大模型五虎融资仅是巨头零花钱?谷歌、微软、Meta:每季度拿不出 100 亿美元别玩 AI国内大模型五虎融资仅是巨头零花钱?谷歌、微软、Meta:每季度拿不出100亿美元别玩AIStability AI开源上新:3D生成引入视频扩散模型,质量一致性up,4090可玩中山大学和字节发布「视频虚拟试穿」扩散模型VITON-DiT,一键生成换装后视频!黑匣子被打开了!能玩的Transformer可视化解释工具,本地运行GPT-2、还可实时推理【忽然一周】泡泡玛特一季度营收涨四成;美泰、孩之宝发布一季度财报;奥飞娱乐获得外观设计专利授权:“陀螺玩具(摩动SW)”这真必须冲!499元一价全包,吃喝玩乐2天1晚,还能9店通用,囊括近郊、草原、大海...爽歪歪!够酷、够有趣!2024 HarmonyOS 极客马拉松,准备玩一场大的!| Q推荐【玩具日报】大摩:上调泡泡玛特目标价位至38港元;淘宝宣布生意参谋、客服机器人、图片空间等多项服务免费北京最没有“班味儿”的公司:打麻将、玩游戏、看夕阳硬核遛娃!维多利亚日长周末去哪儿玩:儿童节、夜市、湖心岛...行前必读!新加坡环球影城攻略:必玩设施、快速通关、交通方式黑龙江“风流书记”:玩三陪女、搞情妇、与三姐妹共震……