编者按:3月18日,澜舟科技召开以“创新落地,生态共赢”为主题的大模型技术和产品发布会。会上,发布了孟子大模型及“一横N纵”的全方位技术与产品体系,分享了其在金融等领域所取得的技术创新、应用探索和丰富的落地实践案例。澜舟科技在会上集中呈现了落地大模型的思考。这是周明与澜舟科技历时三年,摸索出来的大模型与产业结合的方法论的集大成。在被称为大模型商业化元年的当下,有其独特的产业价值和参考价值。
文:李夜 智谕思
编辑:马继伟
01
赌半生积累创业
作为科学家,周明无疑是成功的。从连篇累牍的报道中可知,他是世界顶尖的NLP专家,2023年度ACL Fellow,中国计算机学会会士和中国人工智能学会会士以及中国五所著名高校的博士生导师。他是中国和国际上NLP领域的领导者之一,曾任国际计算语言学会的President,中国计算机学会副理事长。他在NLP最高会议ACL发表的论文数名列世界前茅。创办澜舟科技之前,他曾任微软亚洲研究院的副院长。微软工作期间,他取得的成绩用“硕果累累”形容也不为过。仅以论文、产品以及人才培养为例,他领导的自然语言计算研究组在国际顶级学术会议ACL上发表了超过100篇文章,技术成果应用在微软重要的产品中,譬如Windows、Office、Bing、Azure。他主持开发的微软对联、输入法、必应词典等产品被众多用户试用,成为微软中文自然语言处理的代表性成果。该组研发的对话引擎、诗歌生成、新闻推荐等产品应用于当时引起关注的微软小冰中。20多年间,MSRA自然语言计算组共计培养了500位实习生、20位博士生和20位博士后,这些人后来都成为NLP领域的技术骨干和领导者。周明走上创业路。既出人意料,也在情理之中。但在采访中,可以感受到他的全力以赴。他赌上了“几乎前半生所有的积累”都用在创业上了。这些积累包括但不限于能力、人脉、学识等。对于干了半辈子科研的周明来说,创业挑战巨大且不适。他的不适感,在初出来创业时,尤为明显。采访时,他用了以下几个词来形容:“巨大错觉”、“人生百态”、“社会百态”。也可以理解,他原来无论是在哈工大、清华还是微软接触到的大多是知识分子,“说话都比较温和,不争不抢,大家把自己的事做好就行了”。踏入创业圈,他见到了之前圈子里完全见不到的人和事儿。他充分感受到了世界的参差,感受到公司的参差,感受到创业境界的参差。不过,这些不适并没有让其后退,他首先考虑的是如何融入。“它是一个多样化的社会。但你作为创业家,怎样把自己融入到社会,和社会一起前进。”其次,他考虑的是如何审时度势,寻找一个属于自己的发展路径。他试着向着企业未来发展方向去考虑,从市场的角度考虑技术发展而非从技术的角度看市场发展,“以终为始来做创业和发展。”第三,“恰如其分”。科学家具有前瞻性思维,往往着眼于未来,往往想在当下落地需要10年、20年完成的事儿,结果发现无法落地。而创业家只做企业恰如其分需要做的事情。这个事情既不会落后其他人一代、也不会太超前,却匹配当下市场所处阶段。“你怎么恰如其分地去匹配,这是科学家创业要掌握的事情。”02
抉择背后:context和基因
这三点,在澜舟科技未来目标的选择上展现得淋漓尽致。周明将澜舟科技的发展目标设定为“中国大模型技术和应用综合能力领先的企业”。这个目标中有两个关键词——“技术”和“应用”。技术偏向算法研究,应用则对接起算法研究和用户需求,解决用户实际问题。“我们特别注重两条腿走路,希望团队是有综合能力的。”周明认为,看似创业之路千万条,但在context和个人基因的约束之下,创业者能做的选择并不多。个人基因易懂。“context”指的是创业者所处的历史时期,所在的国家、城市经济发展。“你是context中的一个人或是一个公司,然后再加上基因,决定你公司目前的定位和未来走向。”澜舟科技面前最大的“context”是刚刚起步的大模型。没有人定义出它的未来。也没有人能够定义出技术应该走到什么程度、应用应该如何对接。周明认为澜舟科技恰好处于这样的历史时期。有机会参与到参与制定大模型技术和应用的全过程。他们希望弄清楚技术应该往哪走,做什么、不做什么,应用应该怎么对接技术。“我们要晚成立5年,可能会选一个应用去做;我们如果早成立一两年,可能就去做技术了,因为应用还没起来。但恰好在这个历史时刻,可以巧妙地对接起技术和应用。它是最有价值的。”据悉,澜舟科技成立于2021年6月10日。而2022年11月30日,OpenAI发布GPT-3.5模型驱动的ChatGPT。周明的基因也支持技术与应用并举。前面提到周明在微软亚洲研究院的经历。该院有别于高校科研院所,是能够精准对接技术和应用并形成有效效果的地方。“我们只做有用的技术。知道在不同技术都有缺陷的前提下,如何与应用进行有效对接。这是我在微软养成的能力。我把这个基因带到了澜舟。我希望在这样的历史时刻加上我本身的基因,去做一家技术和应用综合实力领先的企业。”如此,澜舟科技站在应用的角度看技术的发展,有助于其看清楚并选择出重要技术,并排除花里胡哨的干扰项;站在技术的角度看应用,则知道应该重点发展哪些应用,将来如何取长补短。换言之,澜舟科技可以作为连接者,将技术和应用充分地连接起来。“左手和右手要通过它拉起来。因为有时候技术发展跟不上,重要的技术不发展,不重要的技术整天花里胡哨,你就可以通过应用拉一下技术。之后,你有时当意见领袖,有时参与其中,对接起应用和技术并形成一个循环,然后你就跟着发展,社会也因此受益。所以我们倡导技术和应用综合起来,两条腿走路。”某种程度上,大模型落地产业的当下,需要两边都懂的人、两边都懂的公司。作为连接者,它可以知道如何相互协调技术与应用,并形成一套反馈机制将两者纳入其中。周明提到,像澜舟科技这样的公司在中美都是稀缺的、少见的。“在美国这种企业也是非常少的。他们重技术,只要有钱,整天高举高打,弄空中楼阁;而在中国,我们天天脚踏实地,整天做实在的的应用。其实这两种做法都有其弊。我们需要将两者结合。既要看到未来,又要回到当下,做好连接技术和应用的桥梁。”而对于周明来说,这条路径是“很辛苦的”。他既要看技术,又要看应用,还要知道怎么把它们对接起来,但如何使它们能够像轮子一样运转起来并互相反馈,周明最大的收获也在于此。03
澜舟科技是一个“神经网络”
为了实现未来目标,为了探索出大模型落地的第三条路径,周明将澜舟科技打造成一个“神经网络”系统。通过系统来保障未来目标的实现。神经网络是大模型的基础。它由底层、中间层、输出层等多层构成,每层包含N个节点,N个神经元。层与层之间完全互联,节点与节点之间相互连接、相互影响。这种连接与影响,可简单类比为两个各有十名员工的部门,员工间相互作用。当然,不同节点的权重不同,领导层的影响力相对较大,而普通员工的影响力较小。公司的运作类似于神经网络的工作原理——从输入(X)开始,代表人力、资金投入及个人能力,输出(Y)则代表市场和用户。工作成果在到达输出时会受到评估,与用户期望总会存在着差异或不匹配。这种差异或不匹配可以通过特定公式计算,用以量化输出结果与用户期望之间的差距。例如,如果用户期待值是1.0,而实际成果仅为0.5297,表明存在不足。根据反馈,公司需评估与用户的差距并开始一层层、一个个节点进行调整,其中或涉及产品设计、技术水平、用户需求或团队能力等。通过反馈机制,企业可以识别并着手调整网络,以图解决问题。最初,神经网络通过随机初始化建立起来,类似于新员工加入公司的过程。网络通过学习不断调整的过程,类似于公司根据客户反馈优化产品或服务。例如,若客户反映技术水平不足,则调整技术差的神经网络部件部分;若产品未考虑客户需求,需调整产品策略。“这就是一个神经网络式的公司,不停地学习,接触的案例越多,能力就越强。有了这个架构,有了学习之心,公司就应该勇敢地去面对客户,多接触客户,多接触案例,所有信号都会帮公司把未来的事情做得更好,因为公司网络在一天天的调整。所以对于公司而言,出现问题是好事,用户对公司有反馈也是好事,你就回过来修正你的网络。”总的来看,公司文化相当于神经网络中的网络连接机制。不同部门和员工就像网络的节点。资本投入和个人能力是输入,满足用户需求的产品或服务是输出。正负反馈信号调整每个网络节点,使网络逐渐改善。尽管网络不会因单一反馈立即完善,但通过反复调整和经验积累,它会趋向稳定。这个稳定化过程需要数年时间。一旦网络稳定,公司在处理常规情况时不太可能遇到问题,尽管处理特殊情况时可能面临挑战,但仍可以凭借经验从容应对。第一,要有勇敢面对的心态。“有的人不愿意面对现实。他不愿意干中练、干中学。还有的人知道应该干中练、干中学,但没有机制,也不知道怎样做这个事。”第二,要打造一个全链接的深度学习机制。创业家需要弄清楚并建立起公司架构——架构分多少层,成员分工以及如何协调;需要建立起文化体系、奖惩体系。第三,要有灵活的心态。灵活调整输入、输出和网络。锚定方向向前,过程中发现网络不收敛,设法调好。这时候,要灵活起来,甚至敢于换赛道。04
澜舟方案:大模型落地的第三条路径
大模型落地场景,何其复杂。但在3月18日的澜舟科技大模型技术和产品发布会上,周明尝试着用两张图加以说明。这两张图分别是“一横N纵”孟子大模型系列产品、大模型分层落地体系。这两张图看似简单,但浓缩、提炼了澜舟科技成立近三年来的思考与总结,体现了澜舟科技关于大模型落地第三条路径的系统性思考。“一横N纵”孟子大模型系列产品包括三层,也即“一横”模型层,“N纵”应用产品层以及场景层。“一横”模型层包括孟子GPT通用大模型以及以孟子通用大模型为基础开发的孟子GPT金融大模型、孟子GPT编程大模型、其他垂直领域大模型等。澜舟科技自成立以来一直致力于孟子大模型的打造。本次发布会上,发布了新的孟子大模型- Mengzi3-13B。该模型将于3月底面向公众进行开源。N纵也即N个纵列,纵建立于模型层之上,每一纵列代表着一种核心能力。通过对不同行业如金融、文娱和营销的客户需求调研发现,尽管这些行业的业务不尽相同,但它们对能力的需求基本相似,可以总结为六大核心能力。这六大能力能够满足大约80%的用户需求。针对这六大核心能力,进行聚焦,确保每项能力都做到最好。这种聚焦策略的优势在于,团队成员能够明确自己的工作重点,即无论开发什么样的大模型,都要确保能够突出这六大核心能力。这样的聚焦减少了日常工作的焦虑和不确定性,避免了“样样都做,样样不精”的局面。此外,当客户了解到这六大能力是澜舟的强项时,他们在需要这些特定能力时会主动寻求合作。可以大幅减少沟通成本。交付时,交付成本也随之降低。客户只需提供所需数据,团队便能迅速实施解决方案,实现即插即用的高效服务。“一横N纵”服务于各种场景,其中选择适合的场景需遵循三个标准:需求、市场空间和人脉关系。具体而言:需求是关键。在选择场景时,需要找出对于大模型技术有真切需求的领域。不可盲目地将技术应用于可能缺乏需求的领域。澜舟通过调研锁定了五大重点领域。其次,市场空间同样重要。这包括了解用户需求的规模、主要竞争对手,以及评估自身的能力是否能满足客户需求。此外,还需要制定一个清晰的战略路线图,明确先后进入哪些场景,也是成功的关键。最后,人脉关系是进入到某些领域的前提。进入某些领域需要领进门的“师傅”,也依赖于公司或个人长久以来所梳理的品牌美誉度、知名度、关系网等。因此,在每个领域中,都需要投入大量的时间、精力拓展客户网络,了解他们的需求,做出标杆案例,徐图发展。以上便是澜舟科技面对客户定义需求、由需求定义能力的全过程,也是“一横N纵”孟子大模型系列产品的背后逻辑。在澜舟公司的大模型战略中,采用了“一横N纵”孟子大模型系列产品和大模型分层落地体系两种相互补充的方法,它们分别面向不同的受众群体。首先,“一横N纵”的孟子大模型系列产品主要面向客户。这种策略是向客户展示澜舟拥有的核心能力,并强调如果客户需要这些特定能力,他们可以选择澜舟。这个方法将大模型定义为一系列的能力,而非单一的全能解决方案,因为用户更关心的是这些具体能力,而非大模型本身。周明认为,这种思路在国内大模型领域极为先进。另一方面,大模型分层落地体系则主要针对澜舟的研究人员和市场人员。这个体系强调模型之间存在层次关系,且大模型不是万能的。例如,最底层无论是ChatGPT还是孟子GPT通用模型都无法解决垂直领域的问题,因此大模型需要从通用走到行业再走入场景中(分别对应通用大模型、行业大模型、场景任务模型)。在这个体系中,“一横N纵”代表的是模型对应的能力,而N纵与模型层之间是正交关系,即每一纵植根于模型层,并根据需要调用不同程度的模型能力。因此,这两种策略虽然面向不同的群体,但互为补充,共同推进澜舟大模型的落地。(3)如何形成:拜客户为师 Bottom up&Top down两张图都是澜舟科技跟客户、市场打交道的过程中提炼出来的。在这个过程中,周明一直向团队强调要技术和应用两条腿走路。以客户需求为牵引,以技术为支撑,两张图逐渐从无到有,从有到丰富。以大模型分层落地体系为例,大模型分层落地体系分为L1-L2-L3-L4四层。当澜舟科技落地大模型时,客户反馈澜舟的模型在具体场景中的表现不如预期,甚至不如自己开发的模型。这种技术与场景之间的不匹配导致了模型的效果不佳。为了解决这个问题,澜舟科技首先确定目标行业。然后,通过与行业内的标杆客户合作,深入了解特定行业的需求。这样的合作有助于澜舟科技的模型了解具体行业的Know-how,通过增加特定的数据或知识,基于孟子通用大模型(L1)打造出行业大模型(L2),以更好地满足行业需求。随后,澜舟继续与该行业内的其他客户合作,再继续总结和提炼需求,并将这些知识灌入模型中,实现迭代和优化。这种方法不仅提升了模型在该领域的表现,也为后续在其他行业的应用打下了基础。澜舟意识到,即使澜舟的模型层十分强大但仍无法解决所有场景问题,但通过不断地结合场景做优化,形成场景任务模型(L3),并进一步扩大业务覆盖面。这种所谓的场景模型使得业务逐渐增长,并降低了交付成本。这个过程,也是周明拜客户为师的过程。他亲力亲为,几乎没有落下任何场景和客户。“你要知道你的目标,边学习,边在脑海中形成从L1-L4的图层。人要有一个自下而上(Bottom up)和自上而下(Top down)的能力。Bottom up,总结事实,并将之归类。Top down则是形成理论之后,回到业务上去。你的脑海里一直要有Bottom up和Top down这种迭代的能力。”在这个过程中,与每个企业接触时,虽然这些企业反馈的只是自己的业务,但周明站在整个行业的角度上,甄别企业所反馈的痛点和需求。接着,他采取“自上而下”(Top-down)的方法,结合通过与各企业的接触所获得的信息,以及通过阅读所获得的知识,逐渐形成对行业相对全面的认识。基于此,可以决定重点发展哪些技术,不做哪些覆盖面较窄或效益较低的技术。然后,再次采用“自上而下”的策略,推广那些被选定的核心技术,同时避免投资于那些不重要或非必需的技术领域。值得一提的是,无论是“一横N纵”孟子大模型系列产品还是大模型分层落地体系,它们现有的产品架构及打造它们的方法论,均具有泛行业的普适性,也即使用澜舟科技的方法论,可以为任何其他行业量身打造一套产品,并嵌入到现有的产品架构中。标准化是周明必须要做的事情。3月18日的发布会,可以看作他向标准化的再一次努力。他提到ToB业务务必推行标准化,否则将无法生存,甚至无法覆盖成本。周明认为,标准化的关键在于做出取舍。企业面临众多选择,重点在于决定哪些事项是重要且必须做的,哪些则可以舍弃。其次,技术支持在标准化过程中至关重要。企业必须确保拥有足够的技术能力来支撑标准化。例如,如果技术体系不完善,即使有意向实现文档标准化,也难以实现,这样的标准化也丧失了意义。推广是第三个关键步骤。销售团队清楚谁是他的目标客户,价格体系因标准化产品而一目了然。交易过程变得透明直接,客户清楚地知道他为所勾选的每项功能付出了多少成本。最后一个步骤是交付。标准化的交付周期明确,交付难度降低。在规定时间内,帮助客户完成测试、数据整理等,并看到成效。标准化的对立面是项目制。周明认为公司要有一定之规,才能避免项目制黑洞中。“最重要的是有一定之规,只做什么不做什么。永远要有一定之规,一定要有不做什么的精神。像一横N纵定义清楚之后,不要轻易改动,我们就打磨好几个能力,然后去做商业化、提升标准化,做不好之前,不轻易开辟第二条战线。”05
2024年是大模型商业化元年
创业是周明的新课题,他正在努力答题。目前,他关注的是商业化。“过去三年辛辛苦苦就是那两张图,而接下来三年是商业化。”周明说。当前,国内外的大模型技术正在探索商业化。ToC方面的商业化如OpenAI的GPTs已经被公众所知。国内也有许多企业推出搜索、角色扮演、个人助理、陪伴聊天和交友等应用,显示出大模型技术在ToC探索的多样化。同时,在ToB(企业)领域,也有许多努力在进行中。尽管这些商业化尝试正在展开,但处于初期阶段,无论是ToC还是ToB,都还未形成一个规模化体系。主要原因有二:第一,时间。大模型技术需要时间成长、发展和成熟。第二,用户将大模型视为一个技术而非产品,同时大模型技术本身也在持续迭代,未完全成型。周明判断,接下来的阶段,大模型技术需要从纯粹的技术追求转向产品开发。这意味着要从客户需求出发,巧妙地应用大模型技术,而不是因为有了大模型就非得用起来。如何设计产品?他提到,一是如何通过大模型降低现有业务成本并提高效率;另一个是利用大模型的新技术创造全新的产品和服务。周明将2024年称作大模型技术的“落地年”。外界预期大模型将开始商业化。这并不意味着万事俱备,而是外界认为大模型基于2023年一整年积累的诸多技术和一定影响力,现在应该可以满足ToB和ToC用户的需求,并实现可观的经济效益。澜舟科技正好匹配这一期待。公司已经建立了一横N纵的大模型层次体系,并具备了从技术到商业化的相关条件。今年,澜舟科技将致力于推动大模型技术的商业化落地。虽然这个过程中可能会遇到各种挑战,如客户理解不充分、交付成本高昂、竞争优势不足和技术体系仍需打磨等,但大趋势是从技术向落地转变,并在此基础上形成技术和落地的再迭代。未来三年,澜舟科技将把重点放在大模型技术的商业化上。周明将今年称作商业化元年。今年,将重点放在试验、迭代、改善和完善大模型技术的商业应用上。目标是,在接下来的三年,更深入地了解大模型商业化,同时完善交付和技术体系。期望三年后,能够实现技术和应用双轮驱动的发展模式,并在技术应用的综合优势,在国内外处于领先地位。这三年对于澜舟科技来说,将是极具期待的,同时也充满挑战。“我希望再有三年可以心满意足地说,当年的设想肯定是ok了。虽然以后还会遇到波折,但在波折中可以看到曙光。期待三年后,澜舟科技能够稳固发展,成为一个在业界受到尊重的企业。公司规模不必很大,但在大模型ToB领域具有技术应用的综合优势,且被同行认可和赞誉。此外,还期望公司能够成为一个员工热爱和自豪的地方,为社会作出新贡献。”
(实习记者张佳扬对本文亦有贡献。)
任何企业在发展过程中都不是一帆风顺的,越是迷茫的时候,越是困难的时候,创始人越要习得看清变化的能力,越要苦练基本功,努力存活和发展下去。
3月23日-25日深圳,来【第71期黑马大课】,看经济走势、消费趋势、出海机会,通过品牌定位、数字化提效、供应链构建核心壁垒,看看依旧活跃的投资人愿意投什么,看看仍然活得好、持续增长的企业是怎么做大做强的。