Bendi新闻
>
LeCun上月球?南开、字节开源StoryDiffusion让多图漫画和长视频更连贯
LeCun上月球?南开、字节开源StoryDiffusion让多图漫画和长视频更连贯
1月前
有了 StoryDiffusion,更加一致性的图像和视频生成得到了保障。
论文地址:https://arxiv.org/pdf/2405.01434v1 项目主页:https://storydiffusion.github.io/
图 1: 通过该团队 StroyDiffusion 生成的图像和视频
图 2:StoryDiffusion 生成主题一致图像的流程概述
图3:生成转场视频以获得主题一致图像的方法。
图4: 与目前方法在一致性图像生成上的对比结果图
表 1: 一致性图像生成的定量对比结果
图 5: 目前使用各种最先进方法的转场视频生成对比
表 2: 与目前最先进转场视频生成模型的定量对比
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
来源:机器之心
相关新闻
LeCun登上月球?南开&字节新作StoryDiffusion:让多图漫画和长视频更连贯小红书开源「InstantID」效果炸裂,被Yann LeCun点赞,迅速蹿上Github热榜脑电合成自然语音!LeCun转发Nature子刊新成果,代码开源这个「AI 写真」开源项目火了! GitHub 一周暴涨四千星,Yann LeCun 亲自转发马斯克与LeCun隔空开怼!竟上升到人身攻击!xAI最新估值240亿美元!马斯克xAI估值240亿美元,LeCun隔空开怼,竟上升到人身攻击!OpenAI像素级抄袭好莱坞IP,反手开撕《纽约时报》,LeCun舌战网友疑似站队支持一次连贯的品牌升级长什么样?百事可乐用宇宙心跳写下满分答案今日Arxiv最热NLP大模型论文:MIT推出新方法,大幅提升LLMs的连贯性、准确性和可更新性!图灵巨头现身ICLR,顶会现场疯狂追星LeCun、Bengio!中国团队三大技术趋势引爆AGI新想象ConvNet与Transformer谁更强?Meta评测4个领先视觉模型,LeCun转赞LeCun转发!大连理工卢湖川、贾旭团队提出可插入图像/视频/3D生成的StableIdentity12年前上手深度学习,Karpathy掀起一波AlexNet时代回忆杀,LeCun、Goodfellow等都下场Hinton、LeCun、Bengio、清华马维英等人当选2023 ACM Fellow!Hinton、LeCun、Bengio三巨头,马维英、陈海波等华人入选,2023 ACM Fellow公布LeCun转发,AI让失语者重新说话!纽约大学发布全新「神经-语音」解码器|Nature子刊Code Llama 70B霸榜3连发,练习5个月击败GPT-4!小扎LeCun亲自官宣上新马毅LeCun谢赛宁曝出多模态LLM重大缺陷!开创性研究显著增强视觉理解能力Yann LeCun:生成模型不适合处理视频,AI得在抽象空间中进行预测鹅厂最新AI工具刷屏!杨幂寡姐多风格写真秒秒钟生成,LeCun点赞 | 可免费体验菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLMACL 2024论文盖棺定论:大语言模型≠世界模拟器,Yann LeCun:太对了GPT-4不是世界模型,LeCun双手赞同!ACL力证LLM永远无法模拟世界LeCun新作:分层世界模型,数据驱动的人型机器人控制