对话实在智能&语核科技:Agentic Workflow如何加速企业自动化
邮箱|[email protected]
本次直播邀请到了两位在该领域深耕的创业者——语核科技的创始人兼CEO翟星吉,以及实在智能的合伙人、产品创新部负责人周春照作为嘉宾,讨论主要聚焦于AI如何利用Agent来引领企业自动化和智能化的新浪潮。我们深入探讨了Agent Workflow在重塑企业业务流程、提升效率以及创造新的商业机会方面的作用。
从AutoGPT项目的火热到吴恩达等学者的呼吁,我们见证了Agent AI作为新兴方式不断拓宽自动化和智能化的边界,包括端侧轻量智能化、整体部署以及更复杂的多智能体协同。这种趋势正日益明显,为大家理解Agent在B端应用提供新的启发。
AI与企业自动化
翟星吉: 我们的使命是让AI去真正赋能企业的实际业务,核心是在企业端将Agent落地为真实生产力。AI的核心价值在于对企业业务的深入理解以及在边缘场景中实现准确率的可控性。
大型AI模型将是类似电力的基础设施,其类似于电力,其本身并不创造价值,而是通过与企业的具体业务结合,通过各种设备和应用来实现价值的创造。企业需要的是能够解决其特定业务痛点的定制化AI应用,而不是通用的基础模型。
落地的过程中,核心会遇到两个痛点,第一个痛点是选什么场景?第二个痛点是怎么把它做好?在场景选择上,我们要真正的去找核心业务流程里面的阻塞点,这一块的价值是最显性的。
大模型的应用跟传统的SaaS关系很重要的差异是,传统的SaaS只是把一种工具服务化工具云上服务化,让大家可以按量付费,但是它并不能真的去帮一个企业获得更多的线索,只是一个工具思维。而大模型能做的是业务价值的交付,为企业带来的是更高级的专家型数字员工。
第二个痛点是选好了之后怎么做好。我们得出的共识是要做一个真实可控的生产力的产品,能去真实的去帮助企业解决问题,而不是一个看起来很炫酷、但是对企业实际业务增长带来的帮助有限或实际使用的稳定性很差的产品。
在Agent的技术实际落地过程中,我们一般会有两个技术小方向。第一个方向是通过RAG实现高效、精准地信息组织和检索,第二个方向是基于企业真实数据和信息的推理Agent,我们认为RAG是企业内部做Agent的基础。
在现阶段Base Model推理能力有限的情况下,建议企业先从一些轻推理场景入手,使Agent Workflow在企业内部先快速落地、看见成果。
我们认为当前行业正处在解决方案级的交付阶段,而非标准产品交付,核心原因在于Base Model的推理能力不足、需要Workflow构建者具有前沿技术和业务的两方面的Know-How。Workflow作为一个产品形态,提供了灵活多变的组合方式,有助于企业构建一系列小助手,如HR助手、采购助手和售前助手等。这些小助手通过Workflow实现业务流程的深度耦合,利用大模型的推理能力,在当前范围内为企业带来实际价值。因此,至少在现阶段,通过Workflow深度耦合业务流,并充分利用大模型的能力,可能是企业实现数字化转型的最佳路径。
周春照:AI workflow是将一个任务拆解成多个子任务。每个子任务又由单个的Agent来承接,好比以前Agent是单个能力的人,现在有了这个,它可以把一群人组织起来,你吩咐一个任务,我可以交给一个团队。而且这个团队之间是密切配合的,每个人自主自觉地执行任务,还能够感觉到执行过程当中环境的变化,自动调整策略来适应变化。这就好比众人拾柴火焰高,把原来将Agent的单兵作战提升到multi Agent的团队协同。所以这个思路和方向肯定是非常好的。多智能体协同是已经存在的。而且也是已经有些尝试了。
在我们打造产品过程当中,理解上面也产生了一些变化:第一,是思路上面的变化,以前一个人搞不定,现在可以让多个人来协同。第二点是开发方式的变化,原来我们是通过添加多个工具、对话的智能体,或者说引入了工作流的,其实更多是通过单次的提示词加多个工具的一个来实现这个功能,而且它每一次处理上下文长度是非常长的,消耗token是比较多的。现在我们可以把它每个节点可以分成多个简单的任务一步一步来处理,这样对提示工具的使用其实更加简单,也更加范围更广。基于flow的工作流去拆解任务,把多个节点进行执行,其实我们之前已经这么做了。
这个时代或当前就是大模型创业的最好的时代,也是一个让人兴奋的时刻。你要是有一个想法去做人工智能创业的项目,其实是比历史任何时刻的门槛和成本都低的。很多相对比较成熟的一些大模型都可以支持你想要的。而且还有很多资源可以用。那缺的是什么呢?其实缺的就是好的应用场景,有深度、有价值的业务的赋能。
如何看待大模型能力的提升与AI workflow开发之间的关系以及大模型迭代对这个产品的威胁和影响?
周春照:大模型的能力与AI workflow是一个互惠互利的关系,二者缺一不可。大模型的能力的不断提升,能够更大限度地发挥双方的能力。但再好的技术和能力只有跟业务场景结合,也只有跟行业的Know-How加持,才能发挥它的作用和价值。我个人感觉在未来可能具备某个场景、行业专业知识的人,其实是更有机会去构建一个有价值的智能体系系统的应用,而且它这个应用是有门槛,有壁垒的。
文生自动化流程的产品是如何实现的?
周春照:我们公司的业务核心在于利用人工智能技术,特别是结合AI和RPA助力企业实现数智化升级。在大模型技术普及之前,就已着手开发智能自动化解决方案,通过定制AI专家模型来扩展自动化的边界。随着技术的进步,公司迭代了多个版本,从智能推荐到屏幕语义理解技术,目标是简化自动化流程的构建,让非技术人员也能轻松使用。公司长远目标是为社会贡献100万个数字员工,这需要业务人员能够自主构建和使用自动化流程。我们进而开发了易于使用的自动化工具,通过屏幕理解和智能推荐技术,实现了业务操作的自动化,无需复杂的编程知识。
除此之外,我们还训练了垂直领域的大模型,以理解特定行业的知识和操作,结合屏幕语义理解技术,实现了无需API接口即可执行任务的能力。这种技术不仅提高了自动化的效率和准确性,还扩大了数字员工的使用范围,简化了企业自动化流程的引入和实施。
对于行业内大公司如苹果在屏幕语义理解技术上的发展,由于信息安全和定制化服务的需求,我们更倾向于提供针对性强、成本效益高的定制化解决方案,以满足企业特定的业务需求。
实在智能的自动化技术实现主要依托于三个核心要素:首先,我们开发了针对特定行业的垂直大模型,它能够深入理解用户输入并进行任务规划;同时我们引入了先进的屏幕理解技术,使系统能够在执行任务过程中实时感知并适应环境变化;我们还结合了丰富的RPA流程自动化经验。这一技术实现了从分析到执行再到反馈的闭环操作,极大地简化了数字员工的使用流程,使其更加易于操作,并且拓宽了自动化技术的应用场景,从而显著提升了工作效率。
我们的技术实现至少需要具备三个关键要素:第一,必须拥有针对特定自动化领域的垂直大模型训练能力;其次,需要具备先进的屏幕和语音理解技术;最后,必须有丰富的RPA流程自动化经验积累。这三点构成了行业的技术门槛,也是我们创新和领先的关键所在。
如何理解AI Agent和AI workflow?这过程中有没有一些变化?
翟星吉: 关于Agent和Agent Workflow的理解,我发现许多人,特别是企业或开发者,对Agent的定义还比较狭隘,倾向于将其视为单一的Prompt Engine。然而,一个完整的Agent定义应包括推理、规划、记忆和行动等一整套框架。Agent workflow的核心在于通过流程将规划、推理、行动等内部组件与外部工具等元素结合起来,与业务流程深度耦合,以实现真正的业务自动化。这与传统的单一Prompt相比,后者过于简单,往往无法解决复杂问题。这种对Agent和Workflow的全面理解是实现业务自动化的关键差异。
在产品落地方面是否遇到了一些挑战,比如不同用户对你们的产品理解存在差异?
翟星吉:无论是通过Workflow的低代码形式还是完全的Coding定制化形式,只要能够提升业务效率,比如将销售线索的转化率从20%提升到25%,那么它们带来的业务价值是相同的。Coding可能会带来更高的维护成本,而使用Workflow产品可以降低时间成本,提高开发效率,尤其是在需要新增或调整流程时。除此之外,研发团队是否青睐产品取决于产品本身的易用性和问题解决能力。如果产品平台能够通过简单的配置快速实现需求,减少重复劳动,研发团队会更愿意使用。对于非技术用户,重要的是提出具体的场景需求,让专业人士处理技术实现。用户应关注业务价值,而不是技术细节,只需确认技术解决方案是否能够满足其业务需求,并达到预期的准确率和效果。
大模型迭代对Agent workflow产品的影响?
翟星吉:在实现Agent的工作流程中,我们主要关注三个方面:首先,是信息的高效组织和检索,确保在用户多变的问题下,能够快速准确地找到所需信息。这不仅要求我们构建一个全面的Workflow,而且对企业来说,这是实现产品价值的基础。企业追求的不是通用的基础模型,而是能够针对其特定问题提供解决方案的定制化Agent。其次,是推理能力的强化。在检索到相关信息后,代理需要进行推理以解答用户的问题。这可能涉及轻推理或重推理,并且往往需要通过工程化的Workflow来补充基础模型在推理方面的不足。然而,如果基础模型足够智能,能够自主进行推理,那么Workflow在弥补模型推理能力方面的作用可能会减少。最后,是业务流程的全面覆盖。
企业问题通常复杂,涉及多个步骤,这就需要一个Workflow来管理整个流程。即便单个智能代理在处理特定任务上表现出色,整体业务流程的协调和管理仍然不可或缺。关键在于深刻理解大模型的迭代方向,并在平台的能力范围内做出明智的选择,确定在哪些方面发力,以最大化地发挥Agent的价值。这要求我们不仅要看透技术本身,还要结合企业的具体需求,做出合适的技术应用决策。
在语核科技,我们积累了丰富的经验,特别是在处理企业数据和推理场景方面。我们主要聚焦于两个核心任务:首先是优化企业自身的数据处理,其次是在新的推理场景中实现高效处理。以一个工业场景为例,我们处理过零部件的研制报告。报告中包含一张表格,记录了零部件进行的30次测试及其电阻值。传统的做法可能只是简单地切割数据然后进行召回,但这种方法的召回率和准确性都很差。我们采取了不同的策略:将表格数据重写为描述性语言,比如“零部件第一次测试的电阻值是多少”,“第二次测试的电阻值是多少”,等等。
这样一来,检索的召回率和准确率显著提高。
另一个例子是我们的一个客户,他们从事电子元器件设计。设计文档中包含许多电气参数,如输入输出电压等。为了基于这些电气参数特性表进行问答,我们不能仅仅依赖传统的检索方法,也不能简单地转换为描述性语言。我们选择将这些参数结构化,提取并入库,然后采用Text to Sql的方案来处理。
我们深刻理解,在不同的场景下,需要完全不同的解决方案来应对客户的真实需求。这不仅仅是简单的数据切片或格式优化,而是需要深入理解企业的真实场景,处理复杂的数据逻辑,甚至解决文档前后文逻辑冲突的问题。这需要大量的工程化工作,进行数据清洗、重写和重新组织。只有真正投入这项工作的人,才能体会到其中的挑战和价值。
在避开巨头的延长线上,有什么经验可以分享?
翟星吉:去年,我们语核科技取得了不错的成绩,从6月到9月,我们的用户数量增长到了6万,同时在B站也积累了4万多的粉丝,整个产品发展得相当不错。然而,在深入探索这个行业的过程中,我们逐渐认识到了一些基础性的事实。
首先,我们清晰地意识到大模型本身就是一场极其底层的生产力革命,它的重要性不亚于蒸汽或电力革命。这些革命替代的是劳动力,而大模型则替代的是脑力劳动,本质上是对社会各行各业的深度变革。
在这场革命中,大模型作为工具的本质作用是放大器,它能够放大价值。工具的效用等于价值基数乘以放大的杠杆。在C端用户上,个人的价值基数有限,即使使用大模型或相关工具,带来的增量价值也相对有限。但在企业场景中,情况就完全不同了。企业追求的是生产力的提升,哪怕生产力基数的提升只有1%,其带来的价值也可能是巨大的。
以营销线索的转换率为例,如果原来的比例是20%,现在提升到30%,虽然只是10%的增长,但相对于原来的基数来说,这是一个50%的提升。对于年营收2000万的企业来说,这可能意味着直接增加到3000万的营收,增量价值非常显著。
因此,我们选择将工具的应用更进一步地拓展到企业级场景。当然,C端应用还有另一个完全不同的赛道——泛娱乐领域,无论是陪伴场景还是游戏场景,它们的逻辑与效率工具完全不同,这一块我们可以留待未来进一步探讨。
微信扫码关注该文公众号作者