年前工作日,AI急救打工人
如果要从科技视角找到2023年的关键词,可能只有“大模型”最贴切。
去年2月初,ChatGPT引发全球热议,时隔一年,国内也全面进入大模型时代。以百度、阿里、华为为代表的头部企业开启群雄逐鹿,紧锣密鼓地对大模型进行专利布局和技术创新。
近期,国家工业信息安全发展研究中心、工信部电子知识产权中心发布了《中国AI大模型创新和专利技术分析报告》,百度、腾讯、阿里等专利申请数量均突破400件。其中,百度大模型专利申请量、授权量排名中国第一,并且是唯一大模型专利创新竞争指数超过90分的公司。
眼下,大模型正在渗透到越来越多的领域,催生出过去从来没有过的AI原生应用。基于大模型孵化全新的AI原生应用,正在成为专利布局重点方向。
大模型发展到了“最后一公里”的环节,如何从云端的研发落地,在全球大厂中首先发布对标ChatGPT大模型产品文心一言的百度,正在尝试给出自己的答案。从各方面的动作看,它都在积极深入产业、工作及生活的各个场景,加速推进大模型生态的构建与应用发展。
01
为了个性化创作
不久前,百度文库团队看到了一个很有意思的用户反馈。
一位用户在小红书上分享,自己利用百度文库在非常短的时间内,生成了一份面向客户的销售方案PPT以及配套演讲稿。
在过去销售人员要花很长时间整合大量信息才能做成一份售前方案,但现在只要把资料上传给百度文库去理解、提取和融合,就能非常快地完成。去年,以百度文库为阵地,百度文库团队开启了一场为期半年的重构攻坚战。
2023年上半年之前,人们对百度文库的印象还停留在,它是找资料、找数据、找模板、找专业内容的文档分享平台。而那时,团队其实已经发现用户的需求不止于此,用户更多的是为了个人内容创作来百度文库寻找服务。
几乎同一时间,大模型爆发的窗口期到来,在理解、生成、逻辑和记忆这4个方面的能力有着极为出色的表现。能快速从各个领域的海量数据中学习,从而生成新的内容,是大模型的优势所在,而百度文库正好拥有海量的专业内容。
有了这样的技术基础,百度文库团队认为,用户真正想要的个人化的内容创作,百度文库有能力做。
它可以成为用户的“助手”,当一个工作有众多机械繁重的支线任务时,便可以通过百度文库来协助完成。以此为思路,生活和工作中的各个场景,百度文库其实都能发挥作用。
一个经典的真实应用场景就发生在老师身上,为了给学生讲述隋唐历史,吴铭在百度文库的协助下快速准备了一份讲课PPT。
如果自己独立操作,吴铭要经历这样的步骤:先是大海捞针式的找各种资料、阅读总结资料,后期再针对素材梳理逻辑大纲、整合提炼,撰写教案,最终再形成PPT,并配文、配图。整个过程耗时耗力,他不仅要面对海量内容,还可能是跨平台的海量格式。
而在百度文库,吴铭简单输入“帮我做一个隋唐历史教案大纲的思维导图”指令,AI马上就基于百度文库海量的历史文档资料,以思维导图的形式生成逻辑清晰、内容全面的教案大纲,其中有一些节点是吴铭讲课的重点,他还会要求AI继续做详细的扩写;在这份思维导图的基础上,吴铭让AI直接生成了一篇教案,有哪里需要润色、调整语气,也都直接在文库让AI帮忙编辑;再基于这份编辑好的教案文档,吴铭点击一键生成PPT的按钮,在文库提供的丰富PPT模版中选择最合适的一个,几十秒内AI就给出了排版精美、配图恰当的PPT,还可一键全篇调整字体、颜色,整个过程完全都是在百度文库一个平台内完成的。
当冗杂、机械的工作有百度文库随时随地来协助完成时,用户便拥有了充足的时间和精力集中在个性化创作上。
团队内有一个生动的比喻,“用户来百度文库不再只是找素材,还可以像炒菜一样,把这些素材按自己的洞察、思路、架构提供给大模型,进行实时的人机交互,与大模型一同去创作。最后用户拿到手的,便是他此时此刻所需求的东西”。
至此,百度文库实现了重构,从一个“行业领先的文档共享平台”进阶成“一站式AI内容创作平台”,不再是模板,而是与用户开启个人化、定制化的即刻内容创作时代。
用了半年左右的时间,最初一个10人不到的小团队,把AI DAU做到了百万量级以上。据透露,重构后的百度文库AI功能用户增速一直保持在环比两位数的增长水平。
02
顺着用户思维
在百度世界大会2023上,百度创始人李彦宏表示,百度文库从根本上“革了自己的命”,是目前“AI重构最彻底的产品”。
百度文库相关的专利储备,也侧面印证了他的说法。在AI重构过程中,百度文库已申请相关专利140件左右,放眼智能文档领域,专利数量位居第一梯队。
自从启动重构项目起,百度文库团队的出发点很明确,文库AI产品负责人钟昊说,“我们其实最关注的就是,百度文库帮助用户一起生产出来的内容,他是不是真的拿去用了”。
可用性,是大模型加持下判断AI重构是否成功的重要标准,也是百度文库一直以来的习惯和思考方式。
只有用户在日常工作和生活中真的实际用到了文库的智能PPT生成和编辑、智能文本生成和编辑等能力,而且使用频率非常高,能够一次性满足需求,重构才有意义。
这需要顺着用户的需求去做场景,而且“这是一个逐步挖掘的过程”。在文库AI功能的开发过程中,大家对智能思维导图功能就有过深度讨论。
什么是思维导图、什么是一个好的思维导图,随着团队对用户需求有更深入的理解,它们的定义其实会发生变化。而且开发过程中,还会发现新的需求。
那段时间,团队的核心人员保持着极其高频的对话节奏,基本每天都会凑到一起,根据最新的用户需求洞察去打磨和迭代技术。
而像智能思维导图一样,在每个环节彻彻底底去研究一遍用户,已经成了团队的日常。
重构完成之后的百度文库确实兑现了承诺,基本把自己重新做了一遍,而不是简单地增加了一些AI能力或入口。现在,百度文库在文档生成和编辑、PPT生成、思维导图、研报智能生成等方面都形成了完整且业界领先的能力,从一个“行业领先的文档共享平台”进阶成“一站式AI内容创作平台”。
在百度文库团队看来,这是顺着用户痛点做产品的必然,“我们需要一个环节、一个环节地贴着用户需求去打磨,让他们能用最简便易用的方式得到最可用的内容”。
大模型时代到来,要想将大模型的能力落地到用户的日常生活中也不外乎于此,即永远要反复问自己,“我们推出这个功能到底给用户带来了什么帮助”。
03
普通人的“云一朵”助理
与此同时,另一边百度网盘也在全力推进AI重构工作。
ChatGPT甫一问世,没等到国内掀起的全民讨论热浪,百度网盘团队就早已沸腾。
每一个目光炯炯的技术人似乎都有这样的嗅觉,ChatGPT的风靡意味着生成式AI和大模型技术走到台前了。面对这样的时代巨浪,任何一位百度同学都不可能允许自己错过这场冲锋。
2023年春节刚过,百度网盘团队便围绕“大模型与智能化开发”进行了排兵布阵。当年2月底,名为“云一朵”的个人云AI智能助理成为部门重构战役的主战场。
对于百度网盘而言,重构的第一步是了解自己并吃透大模型技术。百度网盘存储了海量的用户个人数据,而大模型拥有极强的理解、生成、逻辑推理等特性,不仅如此,大模型还带来一种全新的交互方式,即机器能够听懂人的自然语言。
在这样的思考基础上,基于文心大模型,“云一朵”聊天机器人诞生。同时,它也是国内首个网盘智能助理,重点功能的专利布局也随着技术的创新和产品的迭代水到渠成。
本质上,“云一朵”是提供更便捷的服务。用户只要通过简单的对话,甚至一句话,就能对网盘内的文件、图片、视频实现快速搜索、智能摘要、金句提炼等。
这些功能都可以一一对应并应用到具体的生活或者工作场景中。例如,用户可以直接对“云一朵”说“帮我找下去年野餐的照片”,利用文心一言大模型优势,“云一朵”就可以直接理解语义,快速返回用户所需要的内容。
在工作场景中,用户可能面对的是一篇英文财报。他只要说,“总结一下百度在大模型领域的布局”,“云一朵”就会自动分析并在对话框内返回中文答案,并将文档从pdf转化成word格式。而如果换做以前,这些往往需要使用多个APP才能完成。
让团队感到惊喜的是,因为“云一朵”推出了快速了解视频内容的功能,并对此进行了专利布局,很多用户甚至把“云一朵”用成了高效的学习工具。
以往,人们想要了解一个视频内容比如课程录屏,必须完整地看完,效率很低。于是,不少用户就会直接求助“云一朵”,让它预先了解视频内容或针对视频提炼生成重点,方便之后巩固学习。
参与百度网盘AI重构的研发同学记得,从开放预约的那天起,有些急着体验的用户就不断私信客服,希望“云一朵”早点上线。
而真正到“云一朵”正式上线初期那段时间,焦虑转移到了全体研发者的头上,“大晚上地,大家一起一条一条看最新用户评论,一看一个不吱声”,直到看到“我愿称之为网盘近年来最重大的一次更新”,才松了一口气。
用户量的持续上涨给大家吃了定心丸。作为国内第一批上线的AI产品,早在2023年10月份,百度网盘“云一朵”使用用户已累积突破2000万。
一个更有意思的反馈是,“云一朵”提供了全新的语言交互方式,它不止在生活和工作中产生实用,更会带来更多意想不到的全新体验,比如占星、用心理学解梦、给猫起名,甚至是写Rap。
一位用户曾分享道:“学习压力大时,我会让‘云一朵’帮我解释昨天的梦,看看是否有潜意识的焦虑”。
很多同学现在回想起来,重构研发的那段日子其实脑子一直绷得很紧,“当时感觉重构真难啊,换了脑子,换了打法,全新的技术……但等到坚持下来,回头看一切都是值得的”。
04
从信息到知识
“云一朵”是百度网盘重构中最精彩的部分之一,但显然它不是全部。
百度网盘这次最根本的变化在于理念的彻底迭代,用它自己的话说则是,百度网盘正在从信息化向知识化过渡。
网盘发展至今,从面上看,经历了太多故事,轰轰烈烈有时,暗淡关停有时,但若从底层的用户需求变化看,其实有3个明显的阶段性。
11年前,随着移动互联网和手机的发展,数据爆炸式增长,越来越多的想法、生活瞬间变成了数据。人们急需一个无限量的空间,去留住生活和工作中重要的时刻。
网盘的出现,让超低成本且方便可靠的存储成为可能,用户可以随时从网盘上传和下载文件。
到2.0阶段,网盘已经在想怎么盘活这些庞大的数据。这时,以百度为代表的网盘玩家开始提供在线化的云服务,尝试着去管理和整理数据。用户在网盘观看某张照片,可以知道照片的时间、地点、里面有什么物体。
不过,这本质上是信息收集,只能对数据达成非常分散且浅层的理解。再多样的个性化需求,还很难在网盘实现。
而当AI时代到来,百度智能云网盘技术部总经理唐海浩表示,“未来将迎来全面知识化的阶段”。相比于信息化,知识化会向前跨一大步。
百度网盘的同学指出,当前网盘的总数据规模已达到千亿GB规模,活跃用户的人均文件个数达数十万级别,并且在持续增长。
如何通过智能化能力,帮用户分析、整理、提炼自己的海量数据,把这些信息转变为知识时,才是当前用户需求的最新痛点。比如,网盘能否帮他从累计了1年、甚至多年的文档中提炼理解出业务方向、思路、关键进展等。
只有完成这个任务,百度网盘才能从一个单纯的存储介质,转变为一个智能数字管家,在信息链路处理上的更进一步。
大模型的到来,它尤其善于用自己的阅读理解、逻辑推理和信息抽取等能力,从海量信息中总结提炼,捕捉重点,而这正是“信息”变成“知识”的过程。
用户通过一句话向“云一朵”求助,希望它对整个视频进行总结提炼,或是从海量的照片中精准找到“去年在海边的照片”,则是具体体现。
网盘进入下半场,文件本身不再是最重要的,除了基础的存储服务,做好个人文件的智能服务是当下百度网盘更重视的核心目标之一。
它清楚地意识到,与用户建立连接,真正成为用户的“第二大脑”才是未来。
这意味着交互与服务将更智能化、个性化,每一个用户都是服务的中心。百度网盘需要随时随地帮助他们,从数据库中更加高效地接收、理解并调用“知识”。
眼下,百度网盘的野心还不止于此。在未来,它希望百度网盘也能“万物互联”,让每个人都能拥有一个随时随地都在的超级助理。
对于百度文库而言,下一步的重点则是让平台不设边界。用户只要有需要,百度文库就可以帮助他。例如,用户可以用任何内容形态的素材与百度文库去人机协作,共同完成任意形态的内容创作。
百度网盘与百度文库的变化是有目共睹的。其实不止它们,无论传统业务还是新兴业务,都可以联手大模型开启巨大的想象空间,并得到令人惊喜的改变。
百度具有这样的技术底气。2023年初,韩国知识产权局发布过一项以ChatGPT为核心的“超级人工智能(AI)”技术专利调查,在这项榜单中,百度是国内唯一一家进入全球五强的公司。同年7月,中国信通院知识产权与创新发展中心发布了《中国人工智能产业创新人才竞争力报告(2023年)》,百度在众多科技型企业和顶级高校评比中,以85.5分显著优势,在AI产业创新人才中排名第一。
百度的大模型技术储备和优势已毋庸置疑,对它而言,探索新技术不再是唯一目标。眼下,它已进入大模型的下一阶段,即不断把技术能力转化为各个领域的生产力。
百度旗下的各个业务和产品率先做出了探索并取得了不错的成绩,但大模型是一片原生的沃土,这个应用生态还可以更大。只要有想象力和需求,任何领域都可以和大模型碰撞出超预期的结果。
- End -
本文仅代表作者观点,不代表平台立场
作者 | 姜苏仁
编辑 | 吴丽雪
统筹 | 杨园园
排版 | 静 山
投稿、投简历:[email protected]
广告、商务合作: NFCmagJiang
微信扫码关注该文公众号作者