86个开源的Mamba魔改!
今年基于Mamba的改进变体层出不穷。涵盖图像分割、时序、视频音频、点云、多模态等方向。2024上半年已有近百篇相关论文,更有多篇被CVPR、ICLR、ECCV等顶会收录!
未来几年内Mamba都是一个很好出论文的方向,今天分享86个Mamba魔改思路!共分为11个方向,而且全部都有开源代码!今天无偿分享给大家!
11个Mamba魔改方向 | ||
状态空间模型 | 扩散模型 | 视觉 |
推荐系统 | 语音/音频 | 视频 |
时间序列 | 多模态 | 图表 |
医学图像 | 点云 |
扫码领取86个Mamba魔改思路
部分热门Mamba架构改进
【Mamba-2】Transformers are SSMs: Generalized Models and Efficient Algorithms Through Structured State Space Duality
Mamba原作者出手,大名鼎鼎的Mamba-2。提出了一种将Transformer模型与结构化状态空间模型(SSM)相结合的新方法,揭示了Transformer模型可以视作一种广义的SSM。通过引入结构化状态空间对偶性,作者开发了高效的算法来增强Transformer模型的性能和计算效率。
扫码领取86个Mamba魔改思路
【MICCAI24】SegMamba: Long-range Sequential Modeling Mamba For 3D Medical Image Segmentation
首个专门为3D医学图像分割设计的Mamba。引入三向空间Mamba模块来增强3D特征的序列建模,并设计了门控空间卷积模块以提高空间维度上的特征表示。SegMamba在保持高推理效率的同时,有效捕捉了体积数据中的长距离依赖关系,与传统的基于CNN和基于Transformer的方法相比,表现出优越的性能。
扫码领取86个Mamba魔改思路
SegMamba: Long-range Sequential Modeling Mamba For 3D Medical Image Segmentation
一种新型简化Mamba架构,它通过结合Einstein FFT进行通道建模和Mamba模块进行序列建模,解决了传统注意力网络在处理长序列时的低归纳偏置和二次复杂度问题。SiMBA在图像识别和多变量时间序列预测方面表现出色,超越了现有的状态空间模型,并在ImageNet以及转移学习基准测试上取得了与最先进变换器相媲美的性能。
扫码领取86个Mamba魔改思路
微信扫码关注该文公众号作者