Bendi新闻
>
腾讯混元文生图大模型开源:Sora 同架构,更懂中文,已支持 16s 视频生成
腾讯混元文生图大模型开源:Sora 同架构,更懂中文,已支持 16s 视频生成
6月前
作者 | 连冉
编辑 | 郑玄
又一家大模型开源了,这次是腾讯。
01
为什么开源?
02
DiT 会是多模态的答案吗?
03
性能指标「最强」?
04
如何发掘场景需求?
社交领域:
在社交场景中,我们可能会采用智能体的形式,通过包装成小型的互动玩法来促进社交传播。
举例来说,可以利用图像生成技术,如使用个人照片训练生成新的写真形象,这些更侧重于智能体的互动性。
游戏领域:
游戏制作流程复杂,从概念设计到最终的 3D 模型,涉及上百个步骤。
对于视觉和图像生成的需求各不相同,需要为每个步骤提供定制化的技术解决方案,以提高游戏生产的效率。
广告领域:
广告更注重效果,广告主关注的是点击率和商品的转化率,而非单纯的美观。
在设计广告素材时,需要紧密结合广告效果数据,如点击率和转化率,以生成更具吸引力和转化潜力的图片。
05
接下来的挑战?
微信扫码关注该文公众号作者
来源:极客公园
相关新闻
腾讯混元文生图大模型全面开源!Sora同架构,更懂中文,免费商用腾讯混元大模型升级:部分中文能力已追平GPT-4,支持16s视频生成;索尼音乐禁止人工智能开发商使用其音乐内容丨AIGC日报首个中文原生DiT架构!腾讯混元文生图大模型全面开源,免费商用AI早知道|腾讯混元文生图大模型开源训练代码;知网推出AI学术研究助手4.0AI早知道|Stability AI 资金危机或考虑出售;腾讯混元大模型支持 16s 视频生成腾讯研发了快一年的混元文生图模型,说开源就开源了?Open-Sora全面开源升级:支持16s视频生成和720p分辨率Open-Sora 全面开源升级:支持 16s 视频生成和 720p 分辨率Open-Sora 全面开源升级:支持单镜头16s视频生成和720p分辨率多模态CoT思维链架构来了,现已开源|来自厦大&腾讯优图揭秘腾讯混元大模型:400+场景落地,协作SaaS产品全面接入OpenAI或将在5月9日发布ChatGPT版搜索引擎;中文大模型最新排名出炉,腾讯混元位居前三丨AIGC日报AI早知道|360安全大模型3.0发布;通义听悟上线音视频问答助手;腾讯混元大模型参数规模扩展至万亿Diffusion4D:首个4D视频生成扩散模型!数分钟内实现4D内容生成,超81K的4D数据集已开源!腾讯混元大模型产品品鉴会邀约 | 7月3日16:00 一起来体验混元大模型的全新产品方案腾讯混元大模型全面降价!混元-lite 即日起免费打磨三年、支持万亿 MoE,腾讯混元模型团队的真实推理实力到底如何?Stability AI开源上新:3D生成引入视频扩散模型,质量一致性up,4090可玩快手版Sora「可灵」开放测试:生成超120s视频,更懂物理,复杂运动也能精准建模Sora不开源,微软给你开源!全球最接近Sora视频模型诞生,12秒生成效果逼真炸裂讯飞医疗递交IPO申请;Meta发开源大模型Code Llama 70B;马化腾称两年内不会有纯原生AI大应用丨AIGC大事日报AI早知道|商汤发布日日新5.0大模型;微软推出小语言模型Phi-3;腾讯旗下协作SaaS产品全面接入混元大模型哪里要动点哪里!腾讯联合清华、港科大推出全新图生视频大模型开源日报 | 华为腾讯相爱相杀;Redis不再 “开源”;老黄集齐Transformer论文七大作者;“中国大模型第一城”争夺战