多模态，又一波大爆发。。

国际科技财经移民娱乐民生时事体育

Bendi新闻

多模态，又一波大爆发。。

1月前

大家好，今天分享一个我认为未来最好发论文的方向：多模态融合。

我总结了56个多模态融合的创新点，并整理了对应论文，来自ICLR2024、AAAI2024等顶会。想发论文的同学们赶快扫下方二维码下载资料合集，找到你的顶会idea！

下滑查看全部56个多模态融合创新点

多模态融合的渐进式融合
多模态学习中的正交序列融合
视听融合中多任务学习的集成框架
量化半监督多模态学习中的交互
基于Hypergraph的自监督多模态表示学习
可扩展的多模态融合
多模态嵌入式问答
从多任务混合视角看待缺失模态
多模态学习单模态偏差理论
交替单模态适应
深度平衡方法
多模态攻击框架
基于注意力机制的多模态融合
联合自回归混合框架
处理缺失模态的鲁棒多模态学习
基于变压器的3D对象检测模型
图对比学习方法
多模态系统数据平衡
多模态数据集降维
多模态上下文学习
多个变压网络融合
新的多模态对比学习框架
动态多模态融合
质量感知多模态融合
跳跃-交叉网络融合架构
MMSR-自适应顺序融合模态特征
cross-attention特征融合
迭代多模态交互
图像与点云融合的语义分割模型
跨模态边缘特权知识蒸馏框架
鸟瞰图特征级融合方法
多模态融合TransFuser
两种模态对比学习
动量蒸馏
基于线性的特征融合
改进的具有类名语义的原型网络
基于双线性的特征融合
基于交叉注意力的特征融合
encoding特征提取融合特征图
三模态深度融合
样本不平衡数据处理方法
多模态实体集扩展数据集
跨领域多任务学习的多模态对齐提示
多模态提示学习的标签对齐
场景图知识增强多模态结构化表示
多模态视觉提示跟踪模型
大规模神经元追踪的多模态体积特征
基于扩散的一次性字体生成方法
扩展潜在空间的VAE模型
新型3D物体生成框架
新型端到端多模态融合框架
同质多模态特征融合和交互的三维物体检测
自主检测和定位预定义对象的框架
知识蒸馏方法压缩TDS-Net
关联驱动特征分解融合网络
基于因果注意力的特征融合

扫码免费领56个多模态融合

最新创新点论文资料

通关多模态：基础与实战系列课

学习多模态融合，需要掌握一定的多模态领域基础知识。

针对刚入门的同学们，我分享一个由顶会审稿人、高校博士联手打造的4节基础课与14节Kaggle全程实战课（含全部课件、代码、数据集）的多模态系列课程。并为你配套195篇多模态基础论文与272页《多模态深度学习》综述书PDF。

课程原价是196元，我的粉丝限时0.01元解锁全部课程与资料！

课程涵盖了多模态生成、多模态学习等诸多方向的基础知识，Kaggle全程实战讲解课程的机会更是非常难得，大家抓紧扫码学习！

扫码0.01元解锁18节多模态基础系列课！

《通关多模态基础与实战》课程大纲

多模态生成

-Image caption、 Image generation

-Video caption、Video generation

多模态深度学习

-多模态任务：视觉语言问答、多模态情感分析、对话系统...

-多模态技术：GAN、VAE、CLIP...

多模态Paper精读（一、二）

-CLIP— 多模态领域鸿蒙之钟巨作

Kaggle实战：商品匹配大赛

-赛题介绍与Baseline讲解

-图像特征提取与图像检索

-文本特征提取与文本检索

-商品多模态匹配

-信息检索比赛复盘

-模型融合与集成

-问题答疑

-复赛冲刺

Kaggle实战：宠物预测大赛

-赛题介绍与Baseline讲解

-CV相关理论介绍及其代码讲解

-调参技巧与数据增强设计

-多模态特证聚合理论介绍

-CV和其他模态数据讲解

-比赛总结复盘

扫码0.01元解锁18节多模态基础系列课！

海量多模态论文资料

56个多模态融合的创新点

195篇多模态各领域论文

扫码免费领56个多模态融合创新点

195篇多模态各领域论文

《多模态深度学习》PDF

概述了多模态深度学习中使用的SOTA方法，以克服来自非结构化数据和组合不同模态输入的挑战。

该书内容涵盖广泛且通俗易懂，无论作为深入学习还是知识扩展都是一本极好的书籍。共272页，可以扫描下方二维码下载。

扫码免费领多模态海量资料合集

微信扫码关注该文公众号作者

来源：Jack Cui

多模态，又一波大爆发。。

相关新闻