Bendi新闻
>
Sora超逼真视频引恐慌!Nature刊文警示AI视频模型,或在2024年颠覆科学和社会

Sora超逼真视频引恐慌!Nature刊文警示AI视频模型,或在2024年颠覆科学和社会

7月前



  新智元报道  

编辑:LRS
【新智元导读】王炸Sora发布后,想要分辨AI视频和真实视频变得更难了,各行各业都面临新的挑战与危机。


技术的发展总是伴随着被滥用的风险,从ChatGPT到最近发布的文本转视频工具Sora,AI生成的内容越是逼真,被滥用的风险也就越高。


仅仅一年前,大家还在嘲笑AI生成的「威尔史密斯吃意大利面」不自然,手部、嘴部、面条没有一个真实的;但现在的顶级AI模型已经可以生成「录像级」的视频了,达到了以假乱真的水平。


无论是普通用户还是专业的研究人员,大多对AI的发展速度感到「震惊」,除了兴奋外,大家也开始担心生成的假视频可能会危及2024年的全球政治,或是颠覆内容创作领域。


最近,Nature上的一篇新闻文章总结了Sora等文本转视频工具对当下的「科学和社会」可能产生的影响,也是继deepfake换脸后,大众又要面临的「分辨假视频」考验,而且这次的考验更加严峻,连可供参考的原始视频都没有。


英国莱斯特德蒙福特大学的数字文化专家Tracy Harwood认为,错误信息是AI模型要面临的主要挑战,「我们很快就会被淹没在大量看似真实的信息中」。


Sora带来社会恐惧


2月16日,OpenAI的Sora模型横空出世,用户只需要通过几个简短的文本提示就能创建逼真的视频,比如「一个女人在东京一条灯光明亮的街道上行走」。


Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.


虽然此前也有类似的模型,如Runway发布的Gen-2,或是谷歌开发的Lumiere,但这些工具并没有引起公众的关注:模型呈现给出的内容非常普通,并且需要非常具体的提示才能让模型生成令人满意的作品。


相比之下,Sora提高了作品的质量,还拉低了AI作品的制作门槛。


与此同时,Sora也给即将到来的英国大选和11月的美国总统选举带来了新的问题,英国阅读大学研究人工智能和电影制作的Dominic Lees表示,届时将会有大量的假视频和假音频流传出来,影响公众的判断。


2023年10月,英国工党领袖Keir Starmer的假音频被公开,今年1月,美国总统拜登鼓励民主党人不要投票的假音频也被流传出来。



目前可用的一种解决方案是要求文本到视频的AI使用水印,可以是视频中可见标记的形式,或是添加在视频元数据中的人工签名,但Dominic Lees对这种措施的有效性仍然保持怀疑:水印可以被删掉,元数据签名需要用户特意查看视频的真实性才行,要求世界各地的观众在观看每个视频时都查看元数据是不切实际的。


Sora也同样影响到了影视创业行业,好莱坞演员、电影制片人和工作室老板Tyler Perry在目睹了 Sora 的能力之后,迅速中止了12 个摄影棚的设计和建造等一系列的影视工作室扩建计划。


Perry还表示,包括演员、场务、电工、交通协调、音效师和剪辑师这些行业人士都将受到影响,Sora 将触及影视行业的每一个角落。


美国演员汤姆·汉克斯去年也表示,人工智能可以让他在死后继续出现在电影中,但如果你是一个雄心勃勃的年轻演员,在争取机会的同时,却被告知「对不起,汤姆汉克斯总是会扮演主角」,你会期待这样的影视未来吗?



文本到视频的人工智能将会为社会带来更广泛的问题。


Harwood认为,我们必须学会重新评估看到的内容,这些文本转视频工具让每个人都有机会成为媒体内容创作者,我们需要处理由此产生的后果,也代表着作品消费方式的根本转变。


AI对社会的益处


不过AI技术也对社会的发展存在益处,Harwood认为文本转视频技术可以被用来「以一种更容易理解的格式」呈现较难理解的文本,比如把学术论文可视化等。


Harwood表示,文本转视频模型可以用来做的最重要的事情之一就是「向外行观众传达专业的研究结果」,其能够将相当复杂的概念进行可视化。


另一个潜在的用途可能是在医疗保健领域,文本转视频AI能够代替人类医生与患者交谈,但英国科学传播顾问Claire Malone认为:虽然有些人可能会觉得这项技术不够靠谱,但在用过之后,他们可能会发现如果他们想多次向医疗专业人士提问,就会非常方便。


Malone也认为,文本转视频的AI模型可以帮助研究人员获取海量数据,如由欧洲粒子物理实验室欧洲核子研究中心在瑞士日内瓦附近和其他大型科学项目产生的数据集。


生成式AI可以完成一些普通的研究任务,如对代码进行筛选等;也可以做更复杂的工作,例如输入数据并要求模型做出预测。


参考资料:
https://www.nature.com/articles/d41586-024-00661-0



微信扫码关注该文公众号作者

来源:新智元

相关新闻

硅谷恐慌:Open AI发布全新视频模型Sora!现实,不存在了超越Sora极限,120秒超长AI视频模型诞生!终局之战!OpenAI Sora大佬专访:AI视频模型仍处在GPT-1时代谷歌2小时疯狂复仇,终极杀器硬刚GPT-4o!Gemini颠覆搜索,视频AI震破SoraSora不开源,微软给你开源!全球最接近Sora视频模型诞生,12秒生成效果逼真炸裂中国版Sora震撼登场,原生16秒直出超清视频!国产黑马火了,世界模型签约多个大客户别等 Sora 了!Runway 深夜发布 Gen-3 模型,演示惊艳网友,AI 视频卷出新高度OpenAI甩出AI模型Sora,做视频的我又要失业了……国产版Sora到来!视频大模型更上一层楼 | 大模型一周大事一锤降维!解密OpenAI超级视频模型Sora技术报告,虚拟世界涌现了让四郎开口唱“朕EMO啦”,硬刚Sora的国产AI视频工具爆红!OpenAI CEO最新演讲:GPT-5性能远超GPT-4;媲美Sora,视频生成模型EMO上线通义APP丨AIGC日报周鸿祎谈视频模型Sora;胖东来回应员工悄悄尝面;极兔快递股价跳水;支付宝:6亿人次参与AI年俗...领先Sora的三家AI视频公司,能让你的图片变大片!最强视频大模型易主?比Sora更真实还直接免费!服务器瞬间挤爆万兴科技朱伟:Sora至今没有商业化,视频模型成熟需要周期丨GenAICon 2024智谱的视频模型来了,它远非Sora,但却让这家公司更像OpenAI|对话智谱AI CEO 张鹏Sora进驻Adobe视频编辑软件!新版Premiere Pro开启AI剪辑时代|亮马桥小纪严选Sora进驻Adobe视频编辑软件!新版Premiere Pro开启AI剪辑时代中国如何复刻Sora,华人团队长文解构!996 OpenAI研究员:Sora是视频GPT-2时刻AGI 加速降临!人大系多模态模型首次实现自主更新,写真视频生成力压 Sora规格拉满!Llama和Sora作者都来刷脸的中国AI春晚,还开源了一大堆大模型成果英伟达布局AI视频,Sora风头快被抢完了进度赶超大厂,中国最接近Sora的视频模型出自一家「清华系」公司|New Things
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。