Bendi新闻
>
首个多模态视频竞技场Video-MME来了!Gemini全面超越GPT-4o,Jeff Dean连转三次
首个多模态视频竞技场Video-MME来了!Gemini全面超越GPT-4o,Jeff Dean连转三次
5月前
新智元报道
新智元报道
【新智元导读】近日,首个多模态LLM视频分析综合评估基准Video-MME诞生!在这场全新的考试中,Gemini 1.5 Pro一路遥遥领先,谷歌首席科学家Jeff Dean更是愉快地连续转了3次推。
论文地址:https://arxiv.org/pdf/2405.21075
Video-MME
数据集构建
数据集统计
微信扫码关注该文公众号作者
来源:新智元
相关新闻
Gemini终于赢了GPT-4o!Video-MME首个视频多模态基准来了!中国版GPT-4o炸场:国内首个流式多模态交互模型,现场实时且丝滑全球首个自主进化多模态MoE震撼登场!写真视频击败Sora,人大系团队自研底座VDTMeta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA上海AI Lab开源首个可替代GPT-4V的多模态大模型首个超越 GPT-4o 的开源模型提前泄露!Hugging Face 紧急 404 | 附下载链接日本东京地方法院驳回AI“发明”专利申请:发明人仅限于人类;Meta首发「变色龙」挑战GPT-4o,引领多模态革命丨AIGC日报最强GPT-4o也才刚及格?智源联合多所高校推出首个多任务长视频评测基准MLVU(4)Llama3比GPT-4o更爱说谎,首个大模型“诚实性”评估基准来了 | 上海交大首个WebAgent在线评测框架和流程数据管理平台来了,GPT-4、Qwen登顶闭源和开源榜首!Falcon Mamba来了!首个无注意力大模型!再次挑战Transformer!AI早知道|元象开源首个多模态大模型XVERSE-V;信通院发布国内首个汽车大模型标准元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入终于来了!中国首个接入大模型的Linux开源操作系统正式发布!宇宙人(1503期)小米卫星通信独立APP要来了!我国首个火箭发动机垂直高空模拟试验台完成首次点火试验;图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东今年首场寒潮来袭!多车次停运→3D 版 SORA 来了!DreamTech 推出全球首个原生 3D-DiT 大模型 Direct3D速度秒杀GPT-4o!Mistral开源首个22B代码模型破记录,支持80+编程语言新加坡首个儿童集市来了!工作坊、艺术展览、拍卖等活动,遛娃绝了新加坡首个天灯节要来了!万盏天灯整齐放飞,太梦幻了!首个通用双向Adapter多模态目标追踪方法BAT,入选AAAI 2024西北大学CSSA国内首场新生见面会,hooli来了!清华开源全球首个基于U-ViT的多模态扩散大模型UniDiffuser