腾讯发布Project xDiT!打造DiT并行推理的vLLM
上半年,我们见证了国内视频生成领域的迅猛发展。四月份,生数科技的 ViDu [1] 成功生成了 16 秒的电影级视频,不仅在视频号上引发了热烈反响,更揭开了中国 Sora 们崭露头角的序幕。而到了六月份,快手可灵 [2] 的发布,以其逼真的老铁风格,让人一时间真假难辨,更难能可贵的是它面向公众开放使用,使得迟迟未敢公测的 Sora,被戏称为“美国可灵”。
与此同时,阿里 EMO [3]、智谱清影 [4] 等视频类产品也相继问世,共同推动了这一领域的繁荣发展。不能忽视的是,在传统的图片生成领域,SD3、Flux、Pixart 等等也持续发力,图片更加高清、细节更加逼真。
论文标题:
xDiT: A Scalable Inference Engine for Diffusion Transformers (DiTs) on multi-GPU Clusters
https://github.com/xdit-project/xDiT
现在,DiT 推理最关键的问题是如何高效并行,业界的方案也比较匮乏,xDiT 携我们创新的 PipeFusion+ 前人的 Sequence Parallel 亮相。做一个比喻,vLLM=huggingface transformers+Batching,xDiT=huggingface diffusers+Parallel。
DiT 和 LLM 推理任务特点不一样,这导致二者软件设计哲学也有差异:
作为可扩展的高性能推理 DiT 引擎,xDiT 有如下核心能力:
Pipefusion Parallel [7]:TeraPipe 方式流水线并行方法,在弱互联,比如 pcie/以太网,的网络硬件上有优势,比如以太网互联的多机多卡情境下效率远高于其他方法。也是我们的创新工作。 Sequence Parallel:混合序列并行,使用 ring & ulysses sequence parallel 混合方式 USP [8]。 Data Parallel:在输入多个 prompt 或单个 prompt 生成多张图片时,在 image 间并行处理。 CFG Parallel, a.k.a Split Batch:在模型使用 classifier free guidance(CFG)时可以开启,并行度恒定为 2。
xDiT 中这四种并行方式可以以任何形式排列组合,混合策略在通信量和通信拓扑两方面可以取得最佳效果,使 xDiT 可达到近似线性的扩展性。
第二,Parallel VAE:针对扩散模型后处理的解码 VAE 模块在高分辨率图像生成时 OOM 问题,xDiT 实现了 Patch Parallel 版本的 VAE。
第三,简单灵活的开发接口:xDiT 轻松帮助用户支持新的 DiT 模型。它尽可能复用开源社区 diffuser,完成对模型推理的并行化改造。这套接口也是让 xDiT 从之前的不同并行方法集合变成一个灵活开发工具。通过 xDiT 接口,实测 15 分钟可以让 Pixart-Sigma 模型并行起来!
xDiT 本次的重构的核心,由一名本科生潘瑾哲 @Eigensystem 完成,瑾哲是华科超算队队长,架构功力超过了很多正式员工。关于项目更多细节,可以参考瑾哲文章 [9]。
▲ xDiT的方法
PipeFusion
https://zhuanlan.zhihu.com/p/699612077
https://zhuanlan.zhihu.com/p/706475158
USP:混合序列并行
序列并行我在之前写了太多文章,这里不在赘述,简单来说我们可以混合 ulysses 和 ring 两种并行,xDiT 的并行 args 也提供了 ring_degree 和 ulysses_degree 可以配置。
https://zhuanlan.zhihu.com/p/698031151
CFG Parallel
Hybrid Parallel
Parallel VAE
https://github.com/xdit-project/DistVAE
未来工作
参考文献
更多阅读
#投 稿 通 道#
让你的文字被更多人看到
如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。
总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。
PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。
📝 稿件基本要求:
• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注
• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题
• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算
📬 投稿通道:
• 投稿邮箱:[email protected]
• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者
• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿
△长按添加PaperWeekly小编
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
微信扫码关注该文公众号作者