Bendi新闻
>
Apple多模态最新工作4M-21:搞定21种模态!刷新多个SOTA!

Apple多模态最新工作4M-21:搞定21种模态!刷新多个SOTA!

6天前

微信扫码关注该文公众号作者

来源:CVer

相关新闻

太全了!苹果上新视觉模型4M-21,搞定21种模态刷新多个SOTA!腾讯优图提出统一模态新架构UniM-OV3D:3D开放词汇场景理解完全开源!谢赛宁发布最新SOTA多模态模型Cambrian-1,“不与GPT-4V媲美”Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA顶刊TPAMI 2024!多模态图像修复与融合新突破!DeepM2CDL:多种任务实现SOTA性能多模态融合再度领跑ICLR 2024!这56种创新SOTA方案必看超越 GPT-4V 和 Gemini Pro!HyperGAI 发布最新多模态大模型 HPT,已开源港大和字节提出Groma:多模态大模型新范式!模拟人类先感知后认知,精确定位图中物体!Mamba再下一城!Cobra:将Mamba扩展到多模态大语言模型37项SOTA!全模态预训练范式MiCo:理解任何模态并学习通用表示|港中文&中科院吴恩达团队新作ManyICL:多样本上下文学习显著提高多模态基础模型性能!GPT-4V只能排第二!华科大等发布多模态大模型新基准:五大任务14个模型全面测评GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4统一所有模态的3D范式来了!Any2Point:仅需训练1%的参数量,超越SOTA!面壁智能发布最强端侧多模态模型:超越Gemini Pro 、GPT-4V,图像编码快150倍!梗图理解“天花板”!港中文终身教授贾佳亚团队推出多模态模型:GPT-4+DALL-E 3,王炸组合刷爆榜单轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便AGI 加速降临!人大系多模态模型首次实现自主更新,写真视频生成力压 Sora​第一个基于Llama 3的多模态大模型!Bunny-Llama-3-8B-V上线!Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了CVPR 2024 中科院自动化所36篇入选!新主干/多模态/3D视觉/自动驾驶等全都有!国产黑马一年肝出万亿参数MoE!霸榜多模态,剑指AGI只要千元级,人人可用百亿级多模态大模型!国产「AI模盒」秒级训练推理看视频、画CAD、运动想像识别!75B的多模态工业大模型太能干了
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。