● 来 源:笔记侠(ID:Notesman);内容来源:本文来自量子教育,企业人才培养优质内容及创新解决方案服务商。分享嘉宾:赵德旭,SAP中国研究院ECO 2.0人工智能专家组组长,2018年度、2019年度中国数字化领军人物。 责编:金木研;排版:五月
大家好,今天世界各地正在达成这样一种共识:AI是衡量先进生产力核心指标或者是唯一指标。我今天的分享从三个方面进行:第一,生成式AI为何是新质生产力的核心?这一轮的生成式AI与之前的AI都有哪些本质区别?第二,为什么AI模型和AI技术不是企业最核心资产,而是私域数据。第三,如何根据企业不同现状,实现从低成本Prompt应用到建设企业智能体及垂直模型,构建企业核心竞争力。生成式AI是新质生产力的核心
2007年的Iphone时刻,乔布斯2分钟重新定义手机。2023年3月GPT-4发布,预示着Al进入Iphone时刻。对于它的出现,英伟达CEO黄仁勋说Chat GPT带来AI的iPhone时刻。Open AI创始人Sam Altman表示这与人类的印刷机相比是同样伟大的发明。谷歌CEO孙达尔·皮柴( Sundar PichAI)表示这是人类的另一次火和电发明。比尔·盖茨也表示GPT是他一生中见到的两项最具革命性技术之一。埃隆马斯克前两天也提到生成式AI比核武器厉害很多倍。某乳液公司开发的新款牛奶采用了新的瞬时杀菌技术,那如何将这种新的瞬时杀菌技术转化为销售卖点?一般情况下,我们会让市场部提炼一个好的卖点语言,这样下来可能需要非常高的价格。有了人工智能,现在的做法就不一样。具体步骤有:首先,描述背景,了解产品类型。其次,提出要求,如请你帮我思考在卖点过程中需要表达哪些核心内容等。最后,通过逐轮与大模型交互,最终可以得出几个答案。事实上,提炼这些宣传卖点话术或者宣传用语,如果没有5年市场经验是很难达到这个水平,也许他无法与叶茂中相比,但借助人工智能,还是很容易超越5年内的市场人员。我们都知道,服装有不同布料、不同颜色以及各种款式。那么,如何快速进行仿真和模拟,实现服装设计过程中的快速、高效迭代和创新?借助人工智能,如上图所示,我们可以很轻松的进行创新设计。首先,选择世界上知名的服装风格。其次,选择需要的颜色和细节,例如花岸上衣或其他风格。第三,选好后输入交互信息,如请帮我设计一个礼服,使其看起来更加青春等。这里需要注意的是,它可以结合很多特点进行细化设计,例如采用了一些经典款式等。目前,人工智能模型得到进一步发展,如在服装设计过程中,我们在纸上画一个线稿,直接放上去,它会生成整个模特的实际图片。同时,在展示效果上,如风吹效果,无论是丝绸还是亚麻,还是各种不同布料,都可以根据重量和物理属性,展示出穿着过程中的飘逸感觉,以此判断出设计效果。接下来,我们再探讨一个涉及某保险公司与健康检测公司产品推荐的案例。我们知道,保险业务中,保险人员变动非常频繁,所以,在与客户交互过程中,通过人工智能方式搭建了一个人工智能Agent。首先,它会读取检测报告中的信息,同时植入专家解读的内容,它会根据专家解读的信息匹配适合的保险产品。此外,它还会借鉴历史销售数据,特别是金牌销售人员的经验,将这些销售经验总结生成话术。这时,你会发现,保险销售人员会更像一个演员,带着已经准备好的脚本和产品,在客户面前表演。这样,大大提高了我们与客户交互的效率和成效,同时也体现出专业性。另外,通过自然语言交互,银行人员也可以对自己的信贷进行判断,并与系统、行业指标和各种数据相结合判断信贷风险。这一举措标志着岗位自动化的初步实现。目前,在AI的广泛应用过程中,我们已逐步从单一岗位的简单任务自动化向复杂任务自动化迈进。在未来2-3年内,会有很多岗位实现全面自动化。我们再看一个智能招聘Agent+RPA+专家知识的综合自动化应用案例。智能招聘助手可以快速、专业地评价候选人。它会根据JD(岗位职责)要求对应求职者的简历,并针对关键信息给出评价。为了保证评估的精准性,我们依托丰富的专家背景知识,使招聘助手能够深入理解院校、专业等招聘要素,对候选人作出更为专业的评价。HR招聘人员可轻松通过后台创建和编辑职位信息,进入招聘页面后,新增岗位、填写JD并一键解析,相关信息将自动填充至相应栏目。智能助理还能对招聘数据进行深度分析,为HR管理者提供精确的数据支持和结果解读,帮助管理者快速理解招聘现状。借助智能招聘助手的专家知识库,我们可以更精准地进行简历筛选,并在面试过程中生成个性化的面试题目和答案,确保应聘者与业务需求的精准匹配,并将推荐结果及时送达业务人员。综上所述,关于人工智能的应用,其核心在于首先推动单岗位任务的智能化升级。并且,随着技术的不断进步,系统将逐步具备专家的能力,并通过复制和放大这种能力,实现复杂流程的自动化。最终真正为组织赋予新质的生产力。 3 Chat-GPT-4出现,人类可以跟机器自由对话通过对前面讲到的实际应用案例,不难发现,我们的交互方式正悄然发生变化。第一,DOS命令时代。在那个时期,我们通过输入DOS命令来执行操作。用户需要具备一定的编程知识,通过编写代码来完成任务。第二,图形交互时代。比尔·盖茨曾赞誉Windows的发明为人类的第二次伟大创新。图形交互时代的开创性产品Windows,以及后来的iPhone等设备,实现了人与图形界面的直观交互,极大地提高了用户体验。第三,自然语言交互时代。随着Chat GPT等技术的出现,我们迎来了自然语言交互的新篇章。Chat GPT具备多种功能,如作画、编写代码、翻译资料、收集信息以及视频处理等,展现了多功能、多模态人工智能的强大能力。通过自然语言交互,用户可以更加便捷地与计算机进行沟通和交流。2024年的2月,Sora在春节期间引起轰动。我们首次在人类视频中看到一位时尚女性走在充满温暖的霓虹灯和动画城市标牌的东京街道。我们看到生成的视频,此时此刻很难分辨真假,它在霓虹灯底下、湿的、下过雨的地面上的倒影以及各种符合现实世界的情形。埃隆马斯克在观察Sora出现之后表示:人类应该认赌服输。Sora被Open AI定义为世界模拟器,其深远意义超越了简单的视频生成范畴,而是为理解和模拟现实世界提供了坚实基础。同时,Sora的潜力被认为有助于实现通用人工智能的目标。通用人工智能理论上能够完全取代人类的治理活动。英伟达高级研究科学家Jim Fa更是直接断言:“sora是一个数据驱动的物理引擎,是一个可学习的模拟器,或世界模型”。通过先前的与Chat GPT的交流,我们虽然聚焦于文字层面,但未真正涉足物理世界。考虑到我们的三维环境根植于物理法则,Sora的能力显得尤为突出。它能够自主生成图像,进而深化对物理世界的理解。举例来说,现代机器人装备了摄像头,使其能够捕捉并解析现实的物理环境,包括建筑物、街道以及人与人之间的互动。这不仅让机器人理解物理世界,还促进了数字世界与真实物理世界之间的交互。Sora的出现之所以引起广泛关注,是因为它为我们提供了一种方法和路径,将数字世界和物理世界的智能打通。通过Sora,我们正在构建一个反映物理世界真实面貌的模型。因此,我们说GPT解决了机器与人的自然语言互动,而Sora解决了机器通过摄像头与世界之间的互动。2023年3月figure01更新,使GPT拥有身体,机器人拥有灵魂。突出表现在开放式自由交流完全自主判断驱动,没有任何人控制。如上图所示,它与机器人的互动完全自由,类似于我们之前提到的小米小爱音箱或其他指令式的操作。机器人的动作与真人一样,可以自由应答。例如,我在桌子上询问他是否可以吃苹果,他直接递给我一个苹果,并回答我说可以帮我收拾一下。这个过程中机器人的动作完全由自主判断,而非人控制和驱动。它是一种真正的新质生产力和革命性技术。Chat GPT的出现,我们看到了Sora正在构建一个世界物理模型,这个模型被称为Figure 01,也被称为具身智能。实际上它与机器人结合,将能够执行那些需要人类身体、智慧和灵魂共同协作的任务。这一发展标志着人工智能正在逐步且全面地融入我们的社会各个领域。人类社会迎来了一个新的存在,即机器人和人工智能。机器人可能还有另一个物种,即人与人工智能机器相结合的生物Cyberman(赛博人,泛指半人半机器的生物)。在现实生活中,例如通过在人眼中植入芯片,如埃隆·马斯克所研发的New Link,人们已经开始了与机器的初步融合。更进一步,如果我将此类芯片植入大脑,那我就可以讲各个国家的语言。甚至,如果我将我的眼睛与大脑直接相连,我还能够通过CT扫描进行深入的分析。第一,人类历史上首次机器理解了人类语言的含义,实现了与人自由对话。第二,驱动技术发生变化,从技术驱动技术转变为自然语言驱动技术。在以前,推动技术创新和社会变革的核心力量是那些掌握技术的人群,但技术往往掌握在少数人手中。如今,人类可以借助人工智能通过大白话获取深入的知识和智力。这意味着技术创新不再局限于少数人,而是变成所有人。因此,我们进入了智力分发的时代。智力就像电能一样,可以赋能给每一个人,这对我们的职业和未来产生巨大影响。什么样的人才能成为未来有价值的人?我们需要反思我们教育。我们的教育不应该是是拷贝式的教育,而应注重培养独立思考、独立认知和独立人格的教育,这才是未来社会所需要的教育方式和能力。过去,我们一直自豪地认为人类是上帝发明的最伟大物种,人类大脑必不可少。然而现在,人类的大脑已经不再是必不可少的。实际上,人类语言比我们所知道的更加结构化和简单,最终可能以相当简单的规则来描述如何组织这样的语言。GPT发明者伊尔亚·苏茨克维说:GPT的主要思路是通过生成获取世界模型的压缩表示。沃尔弗拉姆也说:GPT和人类的本质,并没有特别之处。在计算方面,我们与自然中许多系统基本等价。我们意识到人工智能已经具备人类过去认为独有的创造力和情感判断力。未来AI将逐步发展成自己的世界,这是一个新生态,可能会有自己的宪章,人类需要与之适应、共存共融。① Chat-GPT没出现前,人工智是一种决策式AI自1950年起,人工智能的发展历程逐渐展开。在ChatGPT之前,我们可以将人工智能视为一种决策式AI。这种AI主要依赖于输入的大量人类数据和历史数据,通过分析和评估可能的结果来模拟人类的决策过程,从而做出最优决策。它并不自行创造全新的逻辑和内容,而是基于现有数据进行优化。然而,随着Alphago和特别是Alphago Zero的出现,情况发生了变化。Alphago在围棋领域取得了巨大突破,打败了世界围棋冠军。尽管它学习了人类历史上的各种棋谱,但其认知和能力并未超越人类总和。然而,Alphago Zero则完全不同。它不再学习人类的棋谱,而是基于简单的规则让机器自行生成不同的棋谱并与自己对战。经过一段时间的训练,Alphago Zero以100:0的成绩打败了Alphago,这标志着一种全新类型的AI——生成式AI的诞生。生成式AI不仅限于特定领域,而是具有更广泛的应用范围。例如,2022年至2023年间出现的GPT和Sora等生成式AI系统,它们能够像人类一样进行通用任务智能的处理。与决策式AI不同,生成式AI能够自行创造全新的逻辑和内容,这使得它们在许多领域都能发挥出色的作用。生成式人工智能(AI)是一种人工智能,它能够基于输入的数据自行创建、生成新的数据或内容。与传统的分析型AI不同,生成式AI不仅仅能够理解数据,还能够利用学到的信息创造出全新的、未曾存在的数据实例。它具有敢于质疑、连续对话能力、承认不知道、用户意图有效捕捉、提升准确度、上下文理解等能力,同时拥有逻辑判断、推理各种能力。整个生成式AI的胜利有一个基本思想,这是我们强化学习之父萨顿的理论。理查德·萨顿在《苦涩的教训》中指出:历史上AI研究的关键错误在于过分依赖人类的直觉和经验,试图通过精心设计的规则和算法模拟智能。过去我们犯了一个错误,即人工智能必须按照我们人的规则教给他们。然而今天我们看到利用大规模算力和数据,通过学习算法自主发现解决问题的方法。AI通过自主学习和大规模算力发现和提炼知识,而非直接依赖人类的显式规则。当模型足够大时,通过让AI系统自主学习物理世界的运作原理,尝试构建一个能够超越人类直观理解的通用物理世界模拟器。通过它自己学习创建新规则,实现超越人类。人工智能的原理可追溯至1888年,卡哈尔因其关于树突棘在神经信号传递中重要作用的推测而获得诺贝尔奖。此前,人们普遍认为人类在认识事物时能够立即全面把握,然而,通过对大脑神经的显影分析,发现这一过程实际上是逐层传递的,类似于公路交通中必须按照特定路径逐步前行,如先至南京再至徐州。每个大脑神经细胞都拥有约1000个不同的连接点,而整个人脑则包含了大约1000亿个这样的神经细胞。这些神经细胞通过庞大的神经网络相互连接和传递信息,通过电信号的激活,形成了人类独特的人工智能。卡尔尔的研究正是基于这一领域,探索计算机模拟是否能够学习并模仿人类大脑的工作方式。经过一系列的技术演变与发展,我们今天所称谓的神经网络得以形成。以图像识别为例,如下图所示:无论是识别人脸还是狗,这一过程并非一蹴而就。相反,它是通过一系列的网络层级,逐步进行边界识别,并在这一过程中捕捉和识别狗的特征,最终作出是否为狗的判断。在针对狗的实体图像进行识别时,五层网络结构足以应对这一相对简单的任务。因此,在探讨Sora为何能够理解和重现人类物理世界的现象时,我们发现其关键在于对每个图片进行的精细切割处理。这一过程与神经网络紧密相连。通过综合判断,Sora根据预设规则将这些图像颗粒进行组合,最终生成视频。这种处理方式使得Sora具备了丰富的物理常识。例如,当纸飞机撞到树上时,Sora能够准确判断纸飞机无法穿透树木,并因此预测纸飞机会掉落下来。2018年GPT 1.0时,其参数规模仅为1.75亿,而到了2019年GPT 2.0时,参数数量激增至15亿。到了3.0版本,参数规模更是飙升至1750亿,这时已展现出相当的智能水平。在GPT 1.0和2.0时期,Open AI并不被外界看好,甚至有人质疑其真实性。然而,到了3.0时期,智能的表现已经初见端倪。进入4.0时代,GPT展现出了与人类相似的智能水平,并首次通过了由人工智能之父图灵提出的图灵测试。图灵测试是衡量机器是否具备真正人工智能的标准,即当人与机器和另一个人通过键盘交互时,如果无法分辨对方是机器还是人,那么就可以认为机器具备了真正的人工智能。2023年3月,Chat-GPT成功通过了图灵测试,标志着人类迎来了第一个真正的人工智能机器,引起了全球的震动。此外,2023年12月,Open AI董事会已经开发出了Q星模型,预计参数规模将达到125万亿。在此背景下,Sam和黄仁勋等人预测,未来五年内将出现通用人工智能,这种人工智能将有可能完全取代人类。在近期对Chat GPT大型模型训练的过程中,我们意外地发现了一个未解之谜:当神经元数量超过100亿时,出现了智能涌现。这种情况在人类社会中前所未有,它并非简单个体数量的累积,而是产生了质的飞跃。例如,单个蚂蚁或沙丁鱼并不具备显著的智能,但当蚂蚁集结成群,它们能协同完成极其复杂的工程任务,展现出了超常的智能;同样,尽管沙丁鱼个体的智商不高,但当它们汇集成群时,却能够形成强大的群体运动,有效抵御鲸鱼、鲨鱼和各种风暴的威胁。虽然我们在动物界中尚未发现与人类智能相匹配的模型,但在模型训练的特定阶段,我们观察到,当神经元数量达到100亿级别时,该模型开始展现出人工智能的特性,能够理解并输出超越原始输入的信息,这一现象令人震惊,并标志着Chat GPT的一次重大突破。随着神经参数的不断增加,智能水平也在持续提升。与此同时,全球范围内对GPU的争夺愈发激烈,这是因为随着神经元数量的增加,对GPU的需求也在急剧增长。因此,未来决胜世界的是AI,而决胜AI的又是GPU和硬件。Jackson于2024年3月3日在《Hacker News》上发表的一篇题为“Revealing Open AI's Plan to Create AGI by 2027”的报道。
报道概述了Open AI自2022年8月开始训练的一个参数规模达到125万亿的多模态模型。该模型的第一阶段被称为阿拉基斯(Arakis),亦称作Q星(Q-Star)。根据报道,Q星计划在2023年已完成48%的智商水平。原计划在2024年达到96的智商水平,2025年则预期达到145的智商水平。值得注意的是,智商水平是以爱因斯坦的160为参照,全球平均智商水平约为70-80,而较高的平均水平则为110。因此,当Q星计划的智商水平达到96时,已超越某些地区的平均智商水平。我们看到AI技术为商业领域带来了巨大价值,这一点从英伟达市值突破2万亿美金便可看出。然而,当前AI技术仍存在不完善之处。例如,上图中在老奶奶吹生日蜡烛的场景中,尽管她正在吹蜡烛,但蜡烛并未移动。同样地,当水杯倾斜时,AI难以准确捕捉水流动的具体时刻。此外,当果汁开始滴落但尚未滴落时,AI也面临着挑战。这些都显示出AI在刻画物理世界的因果关系方面仍有不足,但随着技术的不断进步和知识的不断积累,AI将迅速取得突破。毕竟,它全天候地在学习全球知识,每一刻都在不断进化。众所周知,摩尔定律揭示了一个规律:处理器的性能大约每两年就会翻倍,而价格则会减半。然而,OpenAI的CEO Sam Altman提出了一个全新的观点,他称之为“新摩尔定律”,即宇宙中的智能每18个月就会翻倍。Sam强调,正是这一快速的发展速度,让我们每个月都能感受到前所未有的信息冲击,对我们产生深远影响。当我们考虑如何训练模型以产生人工智能时,最重要的因素之一是企业的数据和行业经验。这是因为只有借助我们的数据和行业经验,我们才能有效地训练模型,使其产生超越我们自身的智能。因此,对于任何寻求在人工智能领域取得突破的企业来说,积累和利用自身的数据和行业经验都是至关重要的。第一阶段,我们采取了一种相对简单直接的方式,即利用当前广泛使用的对话型AI工具,如文心一言、智谱清言和Kimi助手等。它们可以协助我们完成文章撰写等任务,通过网络便可轻松与之建立联系。第二阶段,使用AI Agent,即目前AI界最热门的智能体。AI Agent(人工智能体)是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的人工智能,AI Agent 具备通过独立思考、调用工具去逐步完成给定目标的能力。智能体可以将大模型的能力与过去掌握的内容、系统知识、判断复杂业务的逻辑等结合起来进行智能组合。AI Agent和大模型的区别在于,大模型与人类之间的交互是基于prompt 实现的。而AI Agent的工作仅需给定一个目标,它就能够针对目标独立思考并做出行动。AI Agent通过接收来自外部世界的数据(如环境传感、用户输入等)来感知其所处的环境。通过各类传感器、物联网设备AI可以从物理世界获得信息,通过API接口AI可以从数字世界获取信息。这相当于人类的感觉器官,是智能体与世界建立联系的基础。处理和分析这些数据之后,AI需要有一定的记忆能力,将当前的环境信息与历史上的决策对比。AI Agent需要具备决策能力,能够基于当前的环境和内置的目标来规划下一步行动,并且在仿真环境中模拟出决策后可能的结果。这类似于人类的大脑思考过程,涉及到理解、规划和解决问题的能力。决策之后,AI Agent需要将决策转化为实际的动作,可能是通过机械动作操控物理设备,或者是通过API和RPA与其他系统交互。系统交互。执行后的结果又会被用作新的输入,形成一个闭环反馈系统,确保智能体可以适应并优化其行为。AI Agent不仅是处理信息的工具,更是具备自主学习、适应和创新能力的智能实体,能够在复杂多变的环境中自我优化,并实现目标的有效达成。在人工智能社会,每个组织和企业是由多个AI Agent组成的智能体,AI Agent从完成单一岗位的自动化到完成复杂任务多岗位自动化。AI Agent之间还可以相互调用组合。所以对于企业组织最需要的是智能体的应用和开发,而非大模型。商用的超大规模模型,如Chat GPT,这些模型是在构建人类社会的数字大脑,而对于细分行业和领域,往往缺乏相应的知识与深度专家经验。目前,许多关键知识仍旧储存于专家的脑海中及组织结构里。这些行业的私有数据和专业知识是企业的核心资产,正如同每个婴儿所需的母乳,拥有了这些数据,就像拥有了养分,孩子才能健康成长。因此,每个企业组织都需要建立自己的模型,一方面让企业积累的数据和经验在通用人工智能的助力下孕育出新的智能实体,另一方面通过自建模型,企业能够明确在未来智能体的发展中所需的具体数据类型。总之,AI落地过程大致会分为这几个路径,需要说明的是,第一阶段是最便宜的方案。我们可以不花钱或很少的钱直接采用Promt提示词的方式与AI互动,接触到AI世界。然后再根据所需场景开发自己的智能体系,使企业或组织工作从单一岗位自动化逐步实现多岗位自动化,最后搭建并训练属于企业自己的模型。如上图所示,这就是Promt提示词的交互方式,即我们对话的方式。同时,它也是一个应用工具,我们可以分步骤对problem(问题需求)进行应用和处理。第一,大模型有时会对某些事物做出错误的判断,甚至存在编谎话,而它本身并不知道他会编谎话。第二,当我们把核心数据输入到大型模型中时,这些数据很可能会被全球共享,从而导致我们的核心竞争力受损。因此,建立本地的数据库和小型模型变得至关重要。第三,许多企业正致力于构建自己的数据库,但问题却是用大型模型去生成结果,这样做也会产生风险。当我们在大型模型中交互时,模型会自动学习并吸收这些内容,进而成为公共知识的一部分。这可能导致我们的核心知识被泄露,因为模型会逐步形成对我们数据的整体画像,无法做到保密。对企业和组织来说需要拥有私有的知识、经验和技能,以便对其进行有效保护,并实现长远发展。因此,需要建立属于自己的私域模型。此外,在构建私域模型时,企业或组织应该更关心的是如何在有限的空间和范围内构建模型,而不是构建一个全球性的模型。从数据处理的角度来看,大概包含约60亿数据的模型就能够满足需求,而这样的模型只需要花费四五十万购买设备和CPU机器就能运行,实际成本并不高。此外,每个企业和组织都有自己的管理规则、流程和质量控制体系,这些都需要在AI应用中予以考虑。综上所述,企业在应用AI时,应采取一种综合式的方法。这种方法应涵盖基于人类规则的决策型AI、具备自我创造性的生成式AI,以及内外部数据、系统和人的判断等相结合。第一层是L0层,即你对大模型有一定感性认知,我建议大家可以先快速搭建场景、低成本应用之后,再与自己的业务和运营结合,逐步实现多岗位自动化,形成三级体系。为了确保AI技术在企业中发挥最大价值,高层领导需从文化层面进行全面传导。在定义AI应用场景时,应优先识别出与业务紧密相关的场景,并鼓励具备丰富业务经验的员工参与场景定义。这样,不仅能确保所定义的场景具有实际价值,还能充分发挥AI技术的优势,这非常关键。*文章为作者独立观点,不代表首席品牌官立场。
*了解更多精彩案例,点击下方关注首席品牌官公众号。
首席品牌官 创立于 2013 年,是品牌人成长及经验共享平台,平台包括自媒体、社群、培训和品牌活动。
「首席品牌官」自媒体系“CMO 价值营销自媒体联盟”发起机构、“公关传播行业最具影响力原创自媒体”。投稿、内容合作,请联系「品妹」。