Bendi新闻
>
揭秘Sora:用大语言模型的方法理解视频,实现了对物理世界的“涌现”
揭秘Sora:用大语言模型的方法理解视频,实现了对物理世界的“涌现”
简单粗暴的理解,就是语言能力足够强大之后,它带来的泛化能力直接可以学习图像视频数据和它体现出的模式,然后还可以直接用学习来的图像生成模型最能理解的方式,给这些利用了引擎等已有的强大而成熟的视频生成技术的视觉模型模块下指令,最终生成我们看到的逼真而强大的对物理世界体现出“理解”的视频。
用大语言模型的方法理解视频
实现对物理世界的“涌现”
微信扫码关注该文公众号作者
来源:硅星人Pro
相关新闻
一文解读:如何理解“大模型时代”的狂飙趋势?|投资笔记第162期LLM性能最高60%提升!谷歌ICLR 2024力作:让大语言模型学会「图的语言」2024傅盛开年大课:企业“私有化大模型的时代”来了?进度赶超大厂,中国最接近Sora的视频模型出自一家「清华系」公司|New Things可复用的“企业AI人才梯队搭建”方法论:《数智时代的AI人才粮仓模型解读白皮书(2024版)》发布!| 极客邦科技双数研究院王小川评AI大模型“价格战”:在中国市场,API服务对创业公司是走不通的;科大讯飞:讯飞星火Lite版永久免费丨AIGC日报揭秘最强视频生成模型 Sora,OpenAI 是怎么实现 1 分钟一镜到底的?Sora幕后团队揭秘:4位华人,印度裔小哥“牵头”,还有高中就创业的00后..揭秘:包下整架747,飞去打橄榄球赛是怎样的体验?如果突然航班还取消了呢?「ACICFG X 北美票帝」从Claude 3中提取数百万特征,首次详细理解大模型的「思维」大模型的“瘦身”革命:巨头逐鹿轻量化大模型 | 大模型一周大事阶跃星辰:大模型「new game」里的新玩家暴富机会!2024年澳洲最值得买房的地区!这10个被曝光了!但新州州长承认,“画的大饼”无法实现了...从“百模”到“千体”:大模型智能体的竞争格局、商业模式和技术挑战CoT提出者Jason Wei:大模型评估基准的「七宗罪」大神Karpathy强推,分词领域必读:自动钓鱼让大模型“发疯”的token,来自Transformer作者创业公司母亲节整个活儿:用各个国家的语言说“妈妈”,你能听懂几个?大模型「上车」,小鹏交出了自己的答卷解密PC的AI进化:AI大模型如何“压”进PC?英伟达再创新高!黄仁勋揭秘「没有对手」的三大原因,豪言:下一场工业革命已开始北大袁粒:用户不会为只能“闲聊”的大模型买单 | 中国AIGC产业峰会旅行者1号「复活」:世界最慢的电脑,被成功修复了AI视觉的“大一统”:从CV到多模态,从行业大模型到机器人,旷视如何布局?破茧成蝶:赋能精准诊疗的“利刃”NGS,揭秘临床下一代测序的自动化与常规