Bendi新闻
>
清华、华为等提出iVideoGPT:专攻交互式世界模型
清华、华为等提出iVideoGPT:专攻交互式世界模型
5月前
iVideoGPT,满足世界模型高交互性需求。
论文地址:https://arxiv.org/pdf/2405.15223 论文标题:iVideoGPT: Interactive VideoGPTs are Scalable World Models
首先,它显著减少了 token 化后视频的序列长度,该长度随帧数的增加而线性增长,但增长率 n 要小得多; 其次,通过条件编码,预测后续 token 的 transformer 可以更容易地保持上下文的时间一致性,并专注于建模必要的动态信息。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
来源:机器之心
相关新闻
CVPR 2024 | 和马赛克说拜拜!华为、清华等提出基于认知的万物超分大模型清华提出时间序列大模型:面向通用时序分析的生成式Transformer | ICML 2024一秒侦破大模型“高分低能”:贾佳亚团队联手剑桥清华等共推评测新范式ECCV 2024 | 深入探索GAN先验,哈工大、清华提出模型反演新方案WWW 2024 | 华为、清华提出个性化多模态生成新方法,让AIGC更懂你NUS、清华提出STAR:一句话生成高质量4D Avatar,代码已开源刷短视频上头?它正在“吃掉”你的大脑!清华、浙大等多研究:短视频不仅影响心理健康,还改变大脑功能视觉全新主干!中科院&华为提出VMamba:视觉状态空间模型OCR小模型仍有机会!华科等提出VIMTS:零样本视频端到端识别新SOTA2024谷歌研究学者计划名单公布:清华、北大、上交ACM班等校友在列吵翻天!全网群嘲澳洲大学“充多了”!2025QS世界大学排名公开!墨大、悉大力压清华,世界TOP20?网友:表情包来了...视觉Mamba模型的Swin时刻,中国科学院、华为等推出VMamba清华、小米、华为、 vivo、理想等多机构联合综述,首提个人LLM智能体、划分5级智能水平微软&清华提出全新预训练范式,指令预训练让8B模型实力暴涨!实力碾压70B模型清华、智谱AI团队:Loss才是涌现的关键,而非模型参数重塑3D生成核心理论:VAST、港大、清华用「零」训练数据生成了3D模型万字综述大模型高效推理:无问芯穹与清华、上交最新联合研究全面解析大模型推理优化中科大联合华为诺亚提出Entropy Law,揭秘大模型性能、数据压缩率以及训练损失关系丰田、本田、马自达等车企造假,斯坦福团队抄袭清华系大模型,巴菲特公司股票跌98%,周星驰首部短剧上线,这就是今天的其他大新闻!专治大模型说胡话,精确率100%!华科等提出首个「故障token」检测/分类方法ECCV 2024 | 清华提出PYRA:超轻量级ViT适应&推理高效微调模块AAAI 2024 | 清华提出DRM:无偏差的新类发现与定位新方法今日arXiv最热大模型论文:清华把大模型用于城市规划,回龙观和大红门地区成研究对象华人工程师夫妇在美身亡:均为清华本科,生前就职于谷歌