16家头部大模型公司上海神秘碰头，现场人挤人人人

国际科技财经移民娱乐民生时事体育

Bendi新闻

7月前

金磊明敏发自上海
量子位 | 公众号 QbitAI

挤爆了，简直要被大模型公司们给挤爆了。

来感受一下这个feel：

毫不夸张地说，国内外叫得上来的大模型公司基本上都来了——

Anthropic、Meta、Mistral.AI、Stability.ai、月之暗面、智谱AI、百川、MiniMax……

到底是什么样的事情能让它们纷纷聚集到了一起？

不卖关子，这正是“云计算一哥”亚马逊云科技所举办的中国峰会，整场活动的关键词就是大热的生成式AI。

不过有一说一，自打AIGC大战开局以来，全球科技巨头如谷歌、微软、OpenAI等一直呈现出你追我赶的态势。

而亚马逊云科技的“出镜率”似乎并没有它们那么高，但这场活动又为何会引来如此多的厂商和围观群众？

其实在深入了解和体验一番之后，我们不难发现，亚马逊云科技在AIGC这件事上已然是“全栈+全能”的状态了。

已经可以上岗的AIGC应用

之所以说是全栈，是因为亚马逊云科技的能力已经覆盖到了生成式AI最为关键的三大层面，即：

算力层：用于基础模型训练和推理的基础设施
模型层：使用基础模型加速生成式AI应用构建
应用层：开箱即用的生成式AI应用

至于能力如何，我们直接来看下最为直观的效果。

在生成式AI应用方面，亚马逊云科技面向企业和开发人员所推出的是生成式AI助手——Amazon Q。

它相当于给企业配备了一个量身定制的AI专家，可以根据企业既有的人员、角色和权限对每个用户交互进行个性化的定制。

例如用上Amazon Q Developer(开发者版)，编程这件事就只需简单的“点点点”和“提要求”。

以功能开发和代码转换为例，开发者只需要向Amazon Q描述想要的新功能即可，然后它就能自己进行规划、执行和迭代：

而且Amazon Q还会根据任务的内容，动态地分配最合适的大模型，让性能做到Pro Max。

再如Amazon Q Business(企业版)，同样也是只需要简单的语言输入，就能帮助员工简化任务、加速决策。

例如员工可以根据公司已有但分散的数据信息，让Amazon Q来做整理和分析的工作，从而给员工答疑解惑、增加工作效率：

诸如整合分析、撰写报告和制作PPT文稿等工作也是不在话下：

除此之外，亚马逊云科技为了让提高效率这事更上一层楼，还推出了Amazon Q Apps，它是Amazon Q Business中的一项功能，可以让员工能够迅速且安全的基于企业信息创建、分享应用程序。

而且Amazon Q Apps是无需任何编程经验、可以基于历史对话、自动化的那种。

例如一个HR如果要创建一个新人的入职30天计划，就只需要向Amazon Q Apps“喂”员工姓名和工号即可。

而整个过程，也只需要短短几秒钟的时间！

在数据分析处理方面，亚马逊云科技则是将Amazon Q集成到了QuickSight中。

以往生成一个商业智能仪表盘可能需要数个小时的时间，但现在，几分钟就可以搞定了。

而且所有员工都可以根据这样可视化的数据内容，向Amazon Q提出自己的问题，让复杂的数据分析任务变得简单且高效。

总而言之，纵观Amazon Q的效果和能力，亚马逊云科技主打的就是用生成式AI的力量把繁琐复杂的工作任务变得简单，简单，再简单。

但Amazon Q之所以能在企业场景做到如此方方面面且丝滑，离不开背后大模型的能力。

不会有一个大模型一统天下

亚马逊云科技的大模型能力对外输出，主要依靠处于模型层的Amazon Bedrock。

它是亚马逊云科技正式加入大模型浪潮竞争的标志，也是亚马逊云科技和微软OpenAI正面硬刚的关键。

基于Bedrock打造的生成式AI应用，已经多达数十种，让人看得眼花缭乱。

简单理解，Bedrock是一个集成了多种先进AI大模型的平台，只需单个API，就可以提供包括Claude、Mistral、Llama、Stable Diffusion、自研Titan系列在内30个模型的能力。通过提供预训练、微调、知识库、RAG、模型评估等功能，能够灵活定制大模型或应用。

亚马逊全球副总裁、亚马逊云科技大中华区总裁储瑞松在峰会上表示，亚马逊云科技一直认为“不会有一个模型一统天下”，企业有从多个大模型中做选择的权力。

因此，在Bedrock上被放置了数十个业界领先的大模型供企业选择。包括和GPT-4并驾齐驱的Claude 3、主打开源的Llama系列和Mistral AI、以及图像生成方面的Stable Diffusion。

同时还包括亚马逊云科技自研的Titan系列，目前已陆续推出7个模型，能力范围包括文本摘要检索生成、图像生成、RAG、思维链、问答、搜索、个性化、推荐等。

具体能力上，Bedrock重点关注4个方面：

丰富灵活的模型选择
轻松定制模型
简化AI应用集成
保障隐私安全

最首要的，构建生成式AI应用关键的一步是找到合适的模型。

Bedrock提供了业内最广泛的模型选择，并推出Model Evaluation功能，支持企业快速分析和比较不同模型。

一般需要企业先给出评估标准，比如对准确性、鲁棒性的要求，并上传自有数据集/提示词库，或者从Bedrock内置的、公开可用的资源中选择。一些主观或需要细致判断的的评判内容，平台会引入人工审核，根据特定应用场景的指标进行评估。

完成设置后，Bedrock便可开始评估并生成报告，最短仅需几个小时，企业就能找到适合自己的模型。

在选择好模型后，企业可利用专有数据，通过RAG、提示词工程或微调来定制对应大模型功能，以创建私有模型。

比如针对Command R、Llama 3、Titan Text Lite等模型，只需简单几步即可进行微调。如果选择了Titan Text模型，还能对未标记的数据持续预训练，以更适应对应行业和领域。

Bedrock知识库可自动执行完整的RAG工作流程，包括摄取、检索、提示词增强和引用。

同时，Bedrock还推出了自定义模型导入（Custom Model Import）功能。企业现在能将自己定制模型导入到Bedrock中，以完全托管的API形式进行访问。由此，自定义模型可以方便地被集成到现有应用程序和工作流中，并同样得到隐私安全保护。

目前Bedrock专有模型导入功能已推出预览版并支持Flan-T5、Llama和Mistral三种开放模型架构。

模型推理方面，Bedrock Batch支持有效执行大量数据的模型推理任务，可在大规模推理任务中避免限流问题，无需编写代码即可处理故障并重启，适用于基础模型及用户自定义模型。

AI应用层面，Bedrock Agents功能支持构建基于企业系统和数据来执行任务的Agent。使生成式AI应用能够使用自然语言来执行多步骤的业务任务。

包括利用LLM使用自然语言进行交互和相应；任务拆分和编排；通过动态调用API完成任务执行；追踪基础大模型思维链流程并优化底层Agent的提示工程。

比如使用Bedrock构建一个AI造型师，效果大概会是酱婶儿的。

最后在安全隐私保障方面。Bedrock的Guardrails功能在基础模型的原生能力之上提供了安全保护，可阻挡85%有害内容。

企业只需通过自然语言来定义不予显示的内容，就能快速创建一个Guardrail。同时还可设置阈值以过滤带有仇恨羞辱、暴力、攻击性等内容，并移除任何个人信息和敏感信息。

这一功能可用于Bedrock上的所有大模型，并且能与微调、Agent功能结合使用。

总结来看，Bedrock以企业定制大模型为出发点，提供模型选择、定制、应用开发、安全保障等一系列功能，使各行各业能更加简单方便用上大模型。

在正式推出1年之后，Bedrock为亚马逊云科技带来的增长和影响已经在具体数据直观体现：

亚马逊2024年第一季度财报显示，亚马逊云科技收入连续两季度加速增长，运营利润率创下历史新高，达到37.6%。

为啥能增长如此迅速？亚马逊云科技的最强基本盘——算力基础设施，为其提供了最关键的保障。

还有“云计算一哥”的看家本领

基础设施一直都是亚马逊云科技的强项。

2023年第四季度数据显示，亚马逊云科技依旧是“云市场一哥”，拥有全球31%市场份额。

全球1000家独角兽中，超过80%都使用亚马逊云。目前亚马逊云科技的年化收入已经超过1000亿美元，并且还在以17%的增长率增长。

在前大模型时代，亚马逊云科技构建了服务全球245个国家和地区的基础设施建设、超过200大类的云服务，过去十余年中已服务全球数百万客户。

其底层算力构成主要由两部分构成，可以为企业提供高性能、高性价比、低功耗的算力选择：

和英伟达密切合作
持续投入自研芯片

一方面，亚马逊云科技和英伟达的合作已经长达13年，二者保持长期的战略合作关系，曾共同推出了世界上第一个GPU Cloud实例。

在披露的最新进展中，亚马逊云科技将推出基于英伟达最新一代Blackwell架构GPU的Amazon EC2(Amazon Elastic Compute Cloud)，以加速构建及运行数万亿参数大模型的性能。

同时将提供首款搭载英伟达Grace Hopper超级芯片的云AI超级计算机，以及首款采用英伟达GH200 NVL32的NVIDIA DGX Cloud。

另一方面，在算力瓶颈愈加明显的环境下，亚马逊在很早期便开始自研芯片。

2019年亚马逊云科技推出了高性能机器学习推理芯片Inferentia，2020年底又推出了定制机器学习训练芯片Trainium。

目前最新一代用于AI训练的Trainium 2可支持千亿、万亿级参数大模型训练。与上一代相比，其训练性能提高4倍，能效功耗比提高2倍，内存增加3倍。

一个Amazon EC2可部署多达16个Trainium 2，相较于部署同类芯片的EC2，部署Trainium 2的可节省50%训练成本。

用于AI推理的Inferentia 2专门针对千亿参数大模型进行优化，与上一代相比，计算性能提高3倍，内存扩大4倍，吞吐量提高了4倍，延迟降低至1/10，并可支持大模型分布推理。

Inferentia 2是Amazon EC2中首个推理优化实例，可通过加速器之间的超高速链接支持横向扩展分布式推理。

搭配SageMaker Hyperpod和SageMaker Jumpstart, 可进一步加速基础模型推理与训练。

前者可简化大模型基础训练的过程，后者则提供了一个机器学习中心，通过提供一系列基础模型，让用户无需自己从头构建和训练模型，进行快速训练和部署。

现在亚马逊云科技还在不断拓展中国区域SageMaker Jumpstart中的基础模型种类，引入领先的中文基础模型。亚马逊云科技在中国峰会2024上宣布，由百川智能提供的基础模型Baichuan2-7B即将登陆中国区域SageMaker JumpStart，由零一万物提供的基础模型Yi-1.5 6B/9B/34B正式登陆中国区域SageMaker JumpStart，在为中国企业提供丰富模型选择的同时满足了企业对安全合规、快速扩展、免运维的需求。

作为首批登陆中国区域SageMaker JumpStart的中文基础模型，Baichuan2和Yi-1.5与亚马逊云科技托管服务深度集成，助力中国企业应用一流的生成式AI技术实现本土创新与业务转型。

如上多个方面，共同构成了亚马逊云科技的底层算力建设，更为其生成式AI全栈架构提供扎实底座。

在生成式AI大潮下，亚马逊云科技提出，未来真正能创造最大价值的将是生成式 AI 的行业应用。如金山办公、沐瞳科技、涂鸦智能、礼来科技等拥抱大模型的厂商都选择与亚马逊云科技合作。

其中，礼来制药是一家全球跨国药企。去年开始，他们重点布局打造以生成式AI为核心的AI基础能力。基于亚马逊云科技提供的生成式AI云服务，他们快速打造了员工聊天问答机器人、医学文献引用验证、竞品及市场推广分析、基于医学内容的FAQ生成。

实际上，这也是亚马逊云科技一直以来强调的路线与理念。

他们提出，企业应用是行业应用未被泛化的一个个实例。

而亚马逊云科技当下要做的，就是成为企业构建和应用生成式AI的首选，以推动各个行业真正意义上拥抱生成式AI大潮。

从宏大远景到具体行动，亚马逊云科技的生成式AI战略已然全盘托出。

那么当下，也就到了重新审视亚马逊云科技的时刻。

AIGC时代，如何评价亚马逊云科技？

首先，不论是大模型时代的当下还是此前的传统AI时代，一切的一切都绕不开算力这个核心关键点。

而亚马逊云科技早早发力于云计算领域，已然在全球范围内处于公认的“云计算一哥”的位置。

加之与英伟达的密切合作，亚马逊云科技无疑是在Scaling Law为主旋律的当下妥妥的算力大玩家。

其次，在模型层面上的战略，亚马逊云科技走的是一条“集大成者”的路线——当下每个大模型都各自擅长的能力，将它们集成到一起，方便客户选用。

也正如储瑞松在这次Keynote中所述：

大模型已不再是企业生成式AI创新的唯一要素；企业在确定生成式AI场景之后，需要根据自身的要求选择合适的大模型。
不同的模型在应用过程中所擅长的领域是不同的，要最大发挥生成式AI的能力，需要将它们结合起来产生复合效应，从而提高系统整体的智力水平。

正是基于这样的一个思路，在更上层的应用方面，诸如Amazon Q这样的应用才能做到“多、快、好、省”地上岗诸多领域。

而这也是符合当下“应用为王”的大趋势。

总而言之，有算力、有模型、有应用、有市场，亚马逊云科技绝对是AIGC时代不容小觑的巨头之一。

— 完 —

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

微信扫码关注该文公众号作者

来源：量子位

16家头部大模型公司上海神秘碰头，现场人挤人人人

金磊 明敏 发自 上海量子位 | 公众号 QbitAI

已经可以上岗的AIGC应用

不会有一个大模型一统天下

还有“云计算一哥”的看家本领

AIGC时代，如何评价亚马逊云科技？

相关新闻

金磊明敏发自上海
量子位 | 公众号 QbitAI