OpenAI 一停服,国内大模型厂商抢生意“抢疯”了
北京时间周二凌晨,陆续有包括中国大陆在内的各国和相关地区 API 开发者在社交媒体上表示,他们收到了来自 OpenAI 的邮件,表示将采取额外措施停止其不支持的地区的 API 使用。
根据网上流传的邮件截图,OpenAI 表示:“根据数据显示,你的组织有来自 OpenAl 目前不支持的地区的 API 流量。从 7 月 9 日起,我们将采取额外措施,停止来自不在 OpenAI 支持的国家、地区名单上的 API 使用。”
在 OpenAI 给出的“支持访问国家和地区”名单上(https://platform.openai.com/docs/supported-countries),中国大陆、中国香港、俄罗斯、朝鲜、叙利亚、伊朗等地均未在列。
实际上,OpenAI 早先就对中国大陆地区的用户实行了注册门槛,限制了其对 ChatGPT 服务的访问权限。中国大陆的开发者群体在构建基于 OpenAI API 的衍生服务时,往往需要通过代理服务器或在海外部署反向代理机制。这不仅增加了运维成本,也无法保证服务的稳定性。
OpenAI 的这一决策立刻引发了国内大模型厂商的回应,各厂商纷纷表示可以支持企业“无痛”迁移。
首先作出反映的的是智谱 AI。当天下午一点半左右,智谱 bigmodel.cn 推出了 OpenAl AP1 用户特别搬家计划, 帮助用户切换至国产大模型,具体包括为开发者提供 1.5 亿 Token(5000 万 GLM-4 +1 亿 GLM-4-Air) 以及从 OpenAl 到 GLM 的系列迁移培训。对于高用量客户,智谱提供与 OpenAl 使用规模对等的 Token 赠送计划 (不设上限),以及与 OpenAl 对等的并发规模等。
下午四点半左右,百度智能云千帆推出了大模型普惠计划,即日起为新注册企业用户提供:
0 元调用:
文心旗舰模型首次免费,赠送 ERNIE3.5 旗舰模型 5000 万 Tokens 包,主力模型 ERNIE Speed/ERNIE Lite 和轻量模型 ERNIE Tiny 持续免费;
针对 OpenAI 迁移用户额外赠送与 OpenAI 使用规模对等的 ERNIE3.5 旗舰模型 Tokens 包。
0 元训练:免费模型精调训练服务
0 元迁移:零成本 SDK 迁移工具
0 元服务:专家服务(迁移 & 使用指导)
不过,百度智能云表示,以上优惠活动均在 2024 年 7 月 25 日 24 点前适用。
随后在六点 20 分左右,零一万物宣布发起了“Yi API 二折平替计划”,面向 OpenAI 用户推出了平滑迁移至 Yi 系列大模型的服务。针对接入 OpenAI 的不同模型的用户,零一万物一一对应地提供了高模型性能且极具性价比的替换方案。
零一万物介绍,目前注册使用 Yi API 的新客户,零一万物立即赠送 100 元额度,帮助用户完成平稳过渡;平台充值还将赠送 50% 到账额度,上不封顶,为用户提供更长线的优惠;任意充值即可享受 RPM/TPM 限速直升 Tier3,直达高级别的服务质量和超快响应速度。此外,零一万物 API 还将提供 Prompt 兼容调优服务支持,陪伴用户又好又快地适配 Yi 系列大模型。
零一万物表示,从模型评测成绩、API 价格等公开数据来看,对于原先接入 GPT-4o 的用户来说,无论是在模型性能、还是在使用成本方面,接入零一万物千亿参数旗舰模型 Yi-Large 都会是 “物美价廉” 的国产大模型平替方案。
另外,在模型性能相近的同时,Yi-Large 的定价远低于顶配模型 GPT-4o。以 GPT-4o 的定价计算(取 Input 和 Output 均值为 Open API 价格),接入 Yi-Large 后使用成本可下降 72%。
对于原先使用 GPT-4 Turbo 的用户,零一万物也给出了平滑迁移至 Yi-Large-Turbo 的方案。零一万物表示,对比 GPT-4 Turbo 的价格,用户接入 Yi-Large-Turbo 后使用成本可下降九成以上。对于业务产品已经验证成立,需要降低成本的客户, Yi-Large-Turbo 会非常适用。此外,零一万物还可提供支持实时搜索的 Yi-Large-RAG,适用于需要结合实时信息进行推理的场景,以便用户基于自身需求选择更匹配的模型。
在 OpenAI API 中,GPT-3.5-Turbo-1106 聚焦于处理简单任务,主打快速、廉价。而零一万物提供了更高性价比的方案——中等尺寸模型 Yi-Medium 来完美承接用户需求,使用成本较 GPT-3.5-Turbo-1106 下降 66%。虽然仅为中等尺寸模型,但是 Yi-Medium 深度优化了指令遵循能力,适用于日常聊天、翻译等通用场景,非常匹配大规模应用大模型的需求。
AI Infra 厂商硅基流动则宣布:SiliconCloud 平台的 Qwen2(7B)、GLM4(9B)、Yi1.5(9B)等顶尖开源大模型免费使用。换言之,开发者从此实现了“Token 自由”。
SiliconCloud 是集合主流开源大模型的一站式云服务平台,为开发者提供更快、更便宜、更全面、体验更丝滑的模型 API。目前,SiliconCloud 已上架包括 DeepSeek-Coder-V2、Stable Diffusion 3 Medium、Qwen2、GLM-4-9B-Chat、DeepSeek V2、SDXL、InstantID 在内的多种开源大语言模型、图片生成模型,支持用户自由切换符合不同应用场景的模型。同时,SiliconCloud 提供开箱即用的大模型推理加速服务,为生成式 AI 应用带来更高效的用户体验。
也是在晚 8 点左右,腾讯云宣布,即日起,新迁移企业用户可免费获得腾讯混元大模型 1 亿 Tokens。目前,腾讯云提供混元 Pro、Standard、Lite 等多个不同版本和尺寸的模型,用户可任意选择。
腾讯还将为新迁移企业用户提供免费专属迁移工具和服务,让好用、易用、实用的大模型惠及更多人。该专属福利截止 7 月 31 日 24 点前。
凌晨,百川智能也跟进宣布,免费赠送 1 千万 token、Assistants API 免费使用。另外,百川开设了专家技术群,表示专家随时答疑,五分钟即可完成 API 迁移。
国内其他厂商是否会跟进,我们将持续为大家跟踪报道。
点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!
德国再次拥抱Linux:数万系统从windows迁出,能否避开二十年前的“坑”?
联创用 ChatGPT 写的一行代码让公司损失上万美元!网友:老板自己写的,找不到人背锅了
OpenAI 突然收购实时分析数据公司,传统数据库厂商:快来,OpenAI 又带我们玩了
王炸!纯血鸿蒙重大升级;宁德时代要求员工896,外籍员工除外?苹果 Vision Pro 2 研发暂停 | Q资讯
微信扫码关注该文公众号作者