Bendi新闻
>
AI内容战,卷向跨模态

AI内容战,卷向跨模态

8月前

作者|不空

围绕生成式AI的讨论,总是离不开“震撼”、“高效”等关键词。

从ChatGPT到Sora,短短两三年的时间里,生成式AI掀起的重重浪潮让这个时代充分领略到AIGC的技术魅力。这场以聊天机器、智能生成、人机交互为表征,以深度学习、训练数据、大语言模型为技术内核的变革,不仅在重塑各行业的发展格局,更在改写每一位内容生产者、普通用户的创作逻辑。

先从宏观视角来看,AIGC产业链不断向外泛化,各行各业都在积极讨论生成式AI的落地与发展,文娱行业更是其中的排头兵。

近期正在举办的第十四届北京电影节启幕了首届AIGC单元,举行业之力,探索AIGC技术在电影创作过程中的应用空间。这一国家级电影节的转向足以印证AIGC为行业带来的冲击力。

百度文库AI生成的电影主题漫画

再从微观个体视角看,强调高效、智能的生成式AI已然渗透至用户的日常生活、工作流中,越来越多的用户正在尝试、拥抱、应用生成式AI。百度文库的迭代轨迹为这一观点提供了有力支撑。

“从去年开始,我们用AI重构了百度文库,使它成为用户‘内容生产的起点’。”4月16日,百度创始人、董事长兼首席执行官李彦宏在“Create2024百度AI开发者大会”如此强调道。大模型赋能下,百度文库重构为「一站式AI内容创作平台」,据悉,百度文库AI新功能上线至今,累计AI用户数已超1亿,累计功能使用次数超8亿。

百度文库所描摹的AI内容创作蓝图远不止于此。

除已经领先行业的智能PPT、智能研报、智能脑图等生成能力外,李彦宏也在当天现场演示了两项百度文库的新功能——智能漫画、智能画本,可以零门槛、一站式生成不同风格、情境的漫画和画本。

在李彦宏看来,这两大功能将内容生产场景延伸到了更加有趣的跨模态创作领域,“让每一个有创意、有想法的人,都能做出好作品。”

AI向深,创作向简

AIGC技术的最大魅力,是对普通个体能量的极致释放。

生成式AI的技术表达瓦解了横亘在用户面前的内容壁垒,在过去两年中,无论是有着专业知识储备的内容创作者,还是跃跃欲试的新手,都不自觉地卷入到这场技术洪流中,完成了一次时代符号的宏大共创。

根据李彦宏的演示,百度文库推出的智能漫画和智能画本功能,可以说正在实现“人人都是漫画师”的远景。娱乐资本论也拿到此次内测名额,抢先一步感受了百度文库强劲的AI势能。

内容形式不同,创作难度也有差异。相较于常见的文本编辑,漫画创作的专业要求更高,大到风格选择、情节设定,小到光影变幻、面部表情,每一个步骤都需要调动专业知识。

正因如此,许多用户虽有精妙绝伦的创意,却困于创作壁垒,难以进行完整的内容输出。百度文库的智能漫画便锚定了这一痛点,巧妙利用跨模态处理能力,降低内容创作的成本和门槛。

李彦宏以《周处除三害》为例,用户只需要输入一句话设定漫画主题,几分钟内,百度文库便可以全自动生成完整漫画作品。这种简单、直接的自然语言交互形式,大幅降低了普通用户的创作门槛和学习成本。

娱乐资本论也亲自上手,以行业热议的短剧为方向,设定了“重生之我在短剧当演员”这一主题。与同类型AI产品直接输出单张图片不同的是,百度文库首先自动生成了一份完整的故事分镜和脚本。

在百度文库提供的脚本和分镜基础上,用户可以根据需求再度调整。除此之外,用户还可以自主选择漫画风格、角色形象,这些内容偏好成为了百度文库内容生成的依据。这一设置意味着,百度文库并没有为了追求效率盲目输出,而是考量到了用户的个性化需求,并预留出调整空间。

完成了一系列设置后,百度文库AI便按需生成,原本漫长、繁复的创作被高效提速,压缩至分钟级。

创作全程中,用户只需要输入创意主题,再完成几个简单的设置,就可以创作出高质量的漫画作品。从最初的脚本、分镜,到后续精细的人物对话,漫画创作的全流程都集成在百度文库这一平台,百度文库也切实考虑到不同用户在实操过程中的使用成本,将漫画创作化繁为简,即便是零基础的用户也能够轻松上手。 

与用户覆盖度更广的智能漫画相比,智能画本在应用场景方面进一步聚焦,关注家庭教育等方面需求。

图文并茂的画本早已成为家庭教育的重要道具,画本故事以生动趣味的形式,不仅能够帮助父母解决与孩子的沟通难题,还可以增加亲子之间的互动。然而,受限于成本、内容等因素,画本故事在中国的普及远远不够。

百度文库推出的智能画本功能,为亿万中国家庭提供了一个零成本、零门槛的解决方案。用户仅需输入一句话,就能够在三分钟内创作出鲜活形象、人声朗读的视频画本。即便是没有绘画基础的父母,也能够随时随地为孩子创作丰富个性的画本故事。

正值世界读书日,家长可以借助画本故事培养孩子的阅读兴趣。在百度文库输入“帮我生成一篇主题为「小绒球不爱读书」的绘本”,百度文库AI便会自动生成故事脚本,用户还可以自主选择画本风格,几分钟后,AI就可以创作出一个完整的视频画本。

与乏味的说教相比,灵动的画本故事显著增强了亲子交流的互动性和趣味性,而百度文库AI的智能画本又通过赋能个体,针对孩子的个性化问题创作专属画本,实现因材施教。

个体能力的释放,源于百度文库对AI技术的一步步沉淀,通过打开内容创作繁冗的锁链,为更多普通用户提供低门槛创作平台,激活创作活力,吹响全民化、大众化内容创作的号角。

AI迭代,行业焕新

不止于个体能量的想象力,百度文库更加高效、优质的AI能力也为行业打开了一扇新的窗口。

智能漫画、智能画本的产品功能不只解决了内容转化的效率问题,更是沿着内容创作的全流程,搭建出了一个完整的生产链条,在简化内容创作流程的同时,确保内容输出的质量。种种产品功能集成至百度文库这一平台,实现了全链路、一站式的内容生产。

在最初的创意环节,百度文库AI海量、庞大的数据资源能够反哺创作者,激发创作者灵感,找准主题方向,进而快速形成故事框架,创作效率指数级提升。

进入到内容创作环节,AI工具的应用还存在不少痛点。娱乐资本论在走访影视后期制作公司、游戏公司时发现,行业虽然认可AI工具在效率端的提升,但却对其产出质量顾虑重重,许多AI产出的内容都需要长时间的后期调整,并不能直接使用。

百度文库从两方面对这一问题进行优化。一方面,百度文库沿循行业创作标准流程,提供脚本、分镜、风格等因素的调整,进一步深化理解用户的创作需求,减少输出误差,保障内容产出的质量。

以智能漫画为例,用户可以根据情节发展,自主调整分镜,丰富环境描述,把控画面内容。画面生成后,创作者还可以在画面编辑器中,对人物对话文本等内容进一步精调。通过创作过程中细致的打磨,把控AI内容的交付水准。

另一方面,百度文库不断深入行业,向头部团队“取经”。为了提升AI生成的质量,百度文库与曾参与打造《秦时明月》《斗罗大陆》的幕后团队玄机科技达成合作,接轨行业需求,以一线IP运营经验赋能百度文库的升级与迭代。

正因如此,百度文库尤为重视内容要素的一致性与完整性,这在智能漫画、智能画本的产品表现中均有体现。

同样以画面复杂度更高的智能漫画为例,无论是多场景、多人物处理,还是人物一致性、故事完整度等方面都表现得十分出众,逼近真实漫画,甚至难以被识别为AI作品,足见其专业程度。这一技术升级真正考虑到行业的应用需求,在兼顾创作效率的同时,还能够确保内容产出的实用性。

百度文库AI智能漫画生成

到了内容交付环节,百度文库还关照到了内容的互动性,以更加丰富、多元的内容形式和体验驱动消费,促进行业正向发展。

在百度文库智能画本功能中,为了打造阅读的沉浸体验和拟真环境,百度文库生成的视频画本可以实现纸质画本相似的翻页功能,培养孩子的阅读习惯。除此之外,智能画本的语音朗读体验以及即将上线的配音功能,大幅提升内容体验感,完成新一轮的内容升级。

更快、更好、更强,AI串联亿万普通个体

事实上,在智能漫画、智能画本功能更新前,百度文库的智能PPT、思维导图等功能就颇受用户认可。

PPT智能生成更是成为不少打工人的“上班搭子”。与同类型产品相比,百度文库不仅支持一句话生成PPT、上传文档生成PPT、PPT内生成专业图表、PPT在线调整编辑等功能,还能一键生成相匹配的演讲稿和思维导图。

与此同时,百度文库进一步打通了12亿专业文档资源,不同行业、领域的打工人都能够在百度文库检索到所需知识,从而进行一站式内容创作,实现效率和质量的双重赋能。

这一点在百度文库的“研究报告生成”功能上体现得更为直观。今年3月,百度文库与国家信息中心中经网旗下中经数据达成数据合作,借助中经数据在工业、石油、电力等24个核心行业领域的数据资源,保障研究报告内容的准确性和专业度。

百度文库智能PPT、智能研报、智能脑图的生成能力不仅在用户中好评如潮,也受到了行业认可。

今年2月份,国家工业信息安全发展研究中心发布《大模型赋能智慧办公评测报告——PPT生成》,对国内主流大模型生成PPT产品进行多维评测,结果显示,百度文库在生成质量、意图理解、排版美化等五项指标中收获四项第一,并以总分86分的成绩位列榜首,彰显出百度文库AI的领先能力。

百度文库之所以能够实现能力升级、产品出圈,源自对用户需求的深入洞察。

生成式AI大势下,相关产品如雨后春笋般涌现而出,然而,许多生成式AI工具虽然以提效为营销噱头,却设置了一系列复杂、晦涩的操作流程,致使用户望而却步。 

有鉴于此,百度文库打造出全场景指令创作和编辑功能,简化操作流程,提升用户体验,让生成式AI真正走进普罗大众的生活与工作。

百度文库APP首页的蓝色悬浮球按钮是AI交互的入口,用户只需要通过简单的语音交互就可以生成包括演讲稿、研报、思维导图在内的各种类型的内容。不仅如此,用户还可以通过语音指令的形式完成对文档的排版调整、内容细节优化、数据图表制作等,真正实现高效创作。

更为重要的是,百度文库还在不断打通、连接内容创作的各种形式,从文本生成到文档编辑,从思维导图、PPT、研究报告到漫画、画本,将生成式AI的触角延伸至不同垂类人群,实现从创意激发到内容生成的一站式AI创作链路。我们看到,在这样的能力下,百度文库已经成为了职场办公神器、家庭教育利器和兼职赚钱的暗器。

而智能漫画、智能画本功能的升级,意味着百度文库在跨模态AI内容创作上的布局,内容创作能力再升一级,夯实百度文库「一站式AI内容创作平台」的产品特性。

可以预见,百度文库引领的此番内容创作方式的变革,必将在时代浪潮中激荡起回声。

加拿大传播学家麦克卢汉曾提出,媒介是人的延伸,在他看来,不同媒介的使用会影响人们的思想和行为方式。当生成式AI与内容创作深度兼容后,同样也会重塑人们对内容生产逻辑的认知,内容创作的主导权将真正回归到普罗大众手中。

以百度文库为起点,一个全民创作的内容时代正在徐徐展开。

话题互动:

你怎么看百度文库的智能漫画和智能画本?

作者

推荐阅读

长城将雷军、李斌轰进直播间,
车企营销卷麻了
点击观看
↓↓↓
如需商务合作后台回复【商务】
如有转载需求后台回复【转载】
更多文娱产业背后的经济逻辑,来关注↓↓↓

微信扫码关注该文公众号作者

来源:娱乐资本论

相关新闻

AI早知道|字节AI教育平台Gauth占美国教育应用第2名;钉钉AI多模态升级;亚马逊向Anthropic追投27.5亿美元亚马逊向人工智能初创公司Anthropic追加27.5亿美元投资;钉钉AI升级多模态,新增图片理解、工作流等丨AIGC日报刷新多个记录!DOFA:遥感领域的跨模态基础大模型专访 LanceDB 创始人:多模态 AI 需要下一代数据基建多模态AI是医学的未来,谷歌推出三个新模型,Med-Gemini迎来大升级斯坦福20亿参数端测多模态AI Agent模型大升级,手机汽车机器人都能用中国的AI,卷向欧洲AI早知道|国内首个兰花AI智能对话机器人;全球首款集成多模态AI 助手的眼镜字节版GPTs“扣子”上线;阿里推自主多模态AI代理MobileAgent;王仲远加入智源研究院任院长丨AIGC日报北京内推 | ​搜狐畅游AI中心招聘游戏AI多模态算法工程师/实习生AI多模态「六边形战士」,原创音乐、1分钟百页PPT、抖音爆款……天才创始人对谈AI教父Hinton:多模态是AI的未来,医疗将发挥AI最大的潜力揭秘 AI 多模态融合的“智慧核心”:六校联合发布低质数据融合新篇章AI内容创作开卷,为什么百度文库成为超强玩家?GPT-4o 与 Gemini 能否用多模态撬开下一代 AI 的新进程?人大系多模态模型迈向AGI:首次实现自主更新,写真视频生成力压Sora社交出海,开卷“多模态”?李未可科技古鉴:发布自研多模态大模型WAKE-AI,三大优化让AI眼镜交互体验升级 丨GenAICon 2024关于 RAG、AI Agent、多模态,我们的理解与探索今日arXiv最热NLP大模型论文:像人一样浏览网页执行任务,腾讯AI lab发布多模态端到端Agent北京/上海内推 | Liblib AI招聘文生图多模态算法工程师/研究员/实习生等Cell Genomics | 同济大学刘琦教授团队开发面向TCR和T细胞转录谱多模态整合的免疫数字解码AI框架只要千元级,人人可用百亿级多模态大模型!国产「AI模盒」秒级训练推理跨境电商狂“卷”AI,阿里国际将推专业版AI搜索引擎
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。