整理 | 傅宇琪
今年 Q1 “神仙打架”:Sora惊艳、马斯克“找茬”,微软谷歌接连翻车 |文末好礼
整理 | 傅宇琪
在这个快速发展的科技纪元,每个月都有着值得关注的里程碑。2024 年开年短短三个月,人工智能领域便风起云涌,一系列重大事件接踵而至。接下来,就让我们一起穿越时空,回顾那些激荡人心的瞬间。
1 月 11 日,OpenAI 上线了基于其大模型 GPT-4 等搭建的定制应用程序商店—— GPT Store。该应用商店主要针对 ChatGPT 付费版本开放,其中包括 ChatGPT Plus、企业版 Enterprise 和新推出的付费版本 Team,但目前并非所有用户都能进入 GPT Store 的页面。
网友辣评:“怎么访问和付费?急着赚钱。”网友辣评:“有多少厉害的 gpts 不知道,但是可以肯定‘教你用 gpts 月入过万’这类视频已经在路上了。”
网友辣评:“看起来 GPT 将无法兑现他们的承诺——就像插件失败一样。我们将拥有数量巨大的 GPT,但没有人会使用这些 GPT,尤其是在可以如此轻易复制其他 GPT 的情况下。”
延伸阅读:GPT Store 上线了!无门槛挣钱,无门槛抄袭
1月初,谷歌公司宣布,在其多个部门裁掉约上千员工,此举旨在减少开支,同时公司将重心转移到人工智能领域。据悉,此次裁员涉及开发语音操作虚拟助手 Google Assistant 的团队,以及负责制造 Pixel 手机、Fitbit 手表和 Nest 硬件部门。
报道称,裁员来得非常突然,这些员工突然无法访问谷歌的系统,随后就通过邮件收到了职位被取消的通知。《纽约时报》获取的文件显示,谷歌对部分员工表示:“我们不得不就继续雇用一些谷歌员工做出一些艰难的决定,我们很遗憾地通知您,您的职位即将被取消。”
网友辣评:“没毛病,all in ai ,有人工智能不用,用‘人工’智能?”
网友辣评:“裁员人数变少→岗位减少速度的导数减少→行情好转,这个逻辑链简直完美。”
延伸阅读:谷歌裁员上千人:新年第一剑、先斩程序员,说好的 All in AI 呢?
1 月 16 日,微软重磅推出了针对个人用户的订阅服务 Copilot Pro,每月 20 美元,Microsoft 365 个人版 / 家庭版用户就能在 Word、Excel、PPT 等 Office 全家桶中直接用上 GPT-4。
在发布一周多后,Copilot Pro 也迎来了用户的第一波反馈。结果显示,Copilot Pro 性能似乎配不上这么高的价格。“目前为止,就非常平庸。我还没有真正找到它的良好需求。虽然它总结当天电子邮件 / 团队聊天的能力很酷,不过我在生产中用不到。”网友“ Bowlen000 ”说道。当然也有人表示已经接受了它,“作为我的助手,它大大加快了我的工作流程。”还有网友表示,“我正在等待它将 Excel 转换为 PPT,这样我就不必...... 为什么高管如此喜欢 PPT?”
网友辣评:“OpenAI 赚钱的最大阻碍,来自自己的投资人……”
网友辣评:“与 ChatGPT Plus 相比,Copilot Pro 简直就是垃圾。两者差远了。”
延伸阅读:微软战略 AI 产品发布一周就翻车!网友:跟 ChatGPT Plus 比,简直就是垃圾
2 月 15 日,谷歌宣布推出了其人工智能模型系列的最新更新——Gemini 1.5。这一更新带来了前所未有的上下文长度能力,能够处理高达 1 百万个标记。Gemini 1.5 采用了全新的混合专家(MoE)架构,不仅提高了训练和部署的效率,还显著降低了计算资源的需求。
然而,不少网友陆续发现,当请求 Gemini 生成图像时,它似乎故意避免生成白人形象。相反,它倾向于将图中的人物替换为黑人、女性和其他边缘群体的形象。这让谷歌颇为头疼。对此,谷歌连夜下架整顿文生图功能。谷歌首席执行官桑达尔·皮查伊针对争议回应称,AI 应用程序在种族问题上的问题回应是不可接受的,并承诺进行结构性改变以解决问题。
网友辣评:“劈柴同志还是去劈柴吧。”
网友辣评:“黑皮肤之间的下一代是黑皮肤,黑白配黑黄配也是黑皮肤,世界最终是黑的……”
延伸阅读:Gemini 翻车,谷歌决策十字路口:该解雇 CEO 还是该进行“结构化变革”?
2 月 16 日,OpenAI 在其官网发布文生视频模型 Sora。据介绍,该模型可以生成长达一分钟的视频,同时保持视觉品质并遵循用户提示。
根据论文,Sora 能够执行各种图像和视频编辑任务,比如创建循环视频、延长视频时长或更改现有视频的背景。它不仅仅是生成单个照片或视频,而是确定环境中每个对象的物理特性,并根据这些计算渲染照片或视频。对于 Sora 目前存在的弱点,OpenAI 也不避讳:模型在准确性方面可能会遇到困难,也可能无法理解具体的因果关系实例。
网友辣评:“AI 能根据文字生成图片的时候,我就在想离生成视频的日期不远了,没想到这么快!”
网友辣评:“感觉人类终究要完在自己手里了,数字生命或者体力劳动,将是唯一出路。”
延伸阅读:生成式 AI 最大飞跃!OpenAI 首个视频生成模型重磅发布,奥特曼被“跪求”:不要让我失业I
2 月 27 日,苹果在一次时长约 12 分钟的内部会议上决定叫停长达十年的电动汽车研发尝试,放弃公司有史以来最具野心的重大项目之一。这一消息令参与电车项目的近 2000 名员工颇感惊讶。由于内容尚未对外公开,这些人士要求保持匿名。据称这项决定由苹果首席运营官杰夫·威廉姆斯与负责具体开发工作的副总裁凯文·林奇共同做出。
这两位高管向员工们坦言,项目后续将被逐渐关停,汽车团队的部分员工将被转移至 AI 部门,未来参与对苹果愈发重要的生成式 AI 开发项目。也会有一部分遭遇裁员,但具体数字尚不明确。
网友辣评:“苹果汽车做不起来,是因为特斯拉只向中国开源而没向苹果开源吗?”
网友辣评:“新能源太卷了。放手是对的。”
延伸阅读:12分钟内部会结束了苹果十年造车梦,转攻 AIGC!数十亿美元打了水漂、2000 员工或转岗或被裁
3 月 1 日,埃隆·马斯克对美国人工智能公司 OpenAI 提起了法律诉讼,指控其背离了初衷,将人工智能用于盈利而非为人类福祉服务。3 月 4 日凌晨,一篇 53 页 google 文档开始热传,在网络上掀起轩然大波,文稿透露 OpenAI “计划在 2027 年发布 GPT-8 ,实现完全 AGI ”。3 月 6 日 OpenAI 发出创始人联名信并附上了 8 年来马斯克与 OpenAI 创始团队成员们的邮件往来。3 月 7 日,马斯克在自家社交媒体 X 上发文称,“OpenAI 一直活在谎言中”,算是对 OpenAI 邮件攻击的回应。3 月 11 日,OpenAI 向法庭递交一份法律文件,要求当地法庭按照加州法律将这起案件认定为“复杂案件”,从而避免马斯克利用法律程序规则而获取 OpenAI 的技术和商业机密。
网友辣评:“这恐怕是AI史上最重要的一场官司……”
网友辣评:OpenAI 建立时就是开源,初期马斯克投资了很多钱,后来封闭了变成私人的东西了,马斯克虽然是为自己争取利益,但我觉得他该争,争的对。”
网友辣评:“我感觉马斯克就是为了个人的利益而去状告 open AI。”
延伸阅读:马斯克最新回应:OpenAI 的“邮件攻击”在说谎!斯诺登力挺:OpenAI 这么做是反人类!
3 月 13 日上午 10 时,美国众议院以 352 票支持、65 票反对的结果通过了一项有关字节跳动旗下的社交软件 TikTok 的剥离法案。法案若想正式生效,接下来还需经过参议院的投票,以及美国总统拜登的签署。
3 月 14 日凌晨,TikTok 首席执行官周受资表示,“这项立法如果签署成为法律,将导致 TikTok 在美国被禁止,哪怕是该法案的提案者也承认,这 (封禁) 是他们的目标。”
网友辣评:“不卖就赔 8500 亿美元,抢劫还要走程序,太感人了。”
网友辣评:“收集用户的位置、购物习惯、联系人和敏感数据,这在欧美国家是严格限制的。所以问题出在字节的推荐算法,这是它的吃饭家伙,不可能放弃,就必然被对手抓住命根。”
3 月 13 日,一家名为 Cognition AI 的初创企业发布了他们的最新项目:全球首个 AI 软件工程师 Devin。Devin 能够将用户的提示词直接转化为网站或者电子游戏。它能自主下载代码、搭建环境、执行代码、修复 bug 并完成任务,而且完成这些端到端的任务只需一个指令。
网友辣评:“一群连使用软件都费劲的人,天真地认为以后自己可以跟 AI 一起做软件了。”
网友辣评:“AI 不是取代程序员,而是促进程序员们从 1.0 升级为程序员 2.0。”
延伸阅读:90 后华人团队真来砸程序员饭碗了!推出全球首个 AI 超级工程师:拥有全栈技能,一个指令就能完成整个开发过程
3 月 18 日,马斯克在他的社交媒体平台 X 上宣布 xAI 开源 Grok。Grok-1 是一个由 xAI 从头训练的 3140 亿参数的混合专家模型,其中 25% 的权重来处理给定的标记。xAI 这次发布的是大型语言模型 Grok-1 的基本模型权重和网络架构,使用了 Apache-2.0 许可证。
网友辣评:“不管出于什么目的,不管我用不用得上,只要你开源,我们就是好朋友。”
网友辣评:“一家营利性公司开源某些东西通常表明它不足以作为产品出售。到目前为止,从‘有趣模式’到营销噱头,与 Grok 相关的一切似乎都是表演性的。作为一个功能模型,它并不严肃。”
延伸阅读:刚刚!马斯克履约开源 Grok,超越 Llama 成全球最大开源模型,却被怀疑是作秀?!
3 月 19 日凌晨 4 点,英伟达备受期待的 GTC 大会在美国圣何塞会议中心正式开幕,首席执行官黄仁勋在会上宣布推出采用 Blackwell 架构的 B200 系列和 GB200 芯片。
Blackwell 专为万亿参数生成人工智能模型而设计,它在推理方面击败了 Hopper:输出提高了 30 倍。Blackwell 驱动的设备可以再次降低计算成本和能源需求。英伟达正认真考虑从根本上重新设计整个底层软件堆栈,希望借 AI 之力为人类生成更优质的代码。
网友辣评:“皮衣 STARK!”
网友辣评:“英伟达才是天网。”
延伸阅读:重磅!老黄带着他的最强 AI 芯片来了!性能提高 30 倍、可支持 10 万亿参数 AI 模型
OpenAI GPT Store 发布,被视为人工智能领域的“革命性时刻”,不少人预测它将颠覆 App Store 的模式,带来全新的应用生态系统。然而,从推出到 3 月,OpenAI 一直面临着吸引开发者入驻的挑战,并且平台上充满了垃圾内容。开发者们也正努力想办法吸引用户,他们认为 GPT Store 流量有限且上手体验不佳。
网友辣评:“感觉 GPT Store 被放弃了!”
网友辣评:“关键是人们不愿意让 OpenAI 这样收集数据。”
延伸阅读:“感觉 GPT Store 被放弃了!” 发布才 2 个月就被 OpenAI 搞成了烂尾项目?
3 月中旬消息,Stable Diffusion 核心研究团队已集体辞职,名单包括研究团队领导、论文一作 Robin Rombach (罗宾·隆巴赫),共同一作 Andreas Blattmann(安德烈亚斯·布拉特曼),以及另一位作者 Dominik Lorenz(多米尼克·洛伦茨)。尽管当事人尚未回应离职原因,但《福布斯》爆料:Stability AI 正因入不敷出且融不到新资金而陷入困境。而就在 3 月 23 日上午,Stability AI 发布一项公告,宣布 CEO 莫斯塔克辞职。第一时间,莫斯塔克在社媒平台 X 上宣布,自己离职后将致力于去中心化人工智能(DecentralizedAI)。
网友辣评:“OpenAI 不 open,Stability AI 也不 stable。很合理。”
网友辣评:“开源开的太实在了,结果自己赚不到钱了。”
延伸阅读:核心研发跑路、资金困难,估值 10 亿美元的 Stability AI 怎么了?
3 月 28 日,知名数据和 AI 平台 Databricks 在官网正式开源大模型——DBRX 。DBRX 是一个专家混合模型( MoE ),有 1320 亿参数,能生成文本 / 代码、数学推理等,有基础和微调两种模型。
根据 DBRX 在 MMLU、HumanEval 和 GSM8K 公布的测试数据显示,DBRX 不仅性能超过了 LLaMA2-70B 和马斯克最近开源的 Grok-1 ,推理效率比 LLaMA2-70B 快 2 倍,总参数却只有 Grok-1 的三分之一,是一款功能强算力消耗低的大模型。
网友辣评:“开源?文心一言又可以进化了。”
网友辣评:“ DBRX 模型无疑是一个顶级的开放域模型,但其庞大的规模可能会使得采用变得复杂。”
延伸阅读:3 个月砸 1000 万美元肝出“最强”大模型?黑马 Databricks:我们完虐 Grok、Llama,还更开放
3 月 29 日,马斯克发布了 Grok-1.5,这是一个具有前所未有的长上下文支持和高级推理能力的新型人工智能模型。Grok-1.5,作为该系列的最新版本,预计将在未来几天向早期测试者和 X 平台的现有用户开放。借助于两周前公开的 Grok-1 模型权重和网络架构,该团队展现了至去年 11 月为止的技术成就,并自那以后在推理及问题解决方面取得了显著进展。
网友评论:“期待下周官宣开源 Grok-1.5,再下周发布 Grok-2。”
随着 Q1 盘点的落幕,我们仿佛走过了一段精彩纷呈的时光隧道,见证了无数令人振奋、感慨的瞬间,回味了那些可能会改变世界、影响未来的大事件。
现在,我们诚挚地邀请每一位读者,分享你们的看法和感受。不论你是被某个事件深深触动,还是对全行业的发展有着独到见解,我们都热切期待听到你的声音!欢迎留下你的精彩评论,让我们一同交流、碰撞思想的火花。
我们将从评论区中精心挑选出 5 条最具洞见、最富感染力的经典评论,以及 5 条点赞数量最多的热门评论,送上可爱的恐龙毛绒公仔 1 份,作为对你们积极参与和精彩分享的感谢。截止时间为 4 月 3 日 12:00,千万不要错过这个与我们互动、展示自己观点的好机会哦!
2024 年第二季度的序幕即将拉开,「AI 前线」公众号再次扬帆起航,引领你穿越人工智能领域的波澜壮阔。我们将致力于为你提供最新鲜的热点动态和最深入的技术剖析。在这里,你将紧跟时代脉搏,感受 AI 的无限魅力,敬请关注「AI 前线」公众号。
大模型应用挑战赛已拉开帷幕。现阶段,多数语言模型已完成 3 轮更新,大模型赛道入场券所剩无几。同时,2023 年超 200 款大模型产品问世,典型场景又有哪些产品动向?对于现阶段的文生图产品而言,四大维度能力究竟如何?以上问题的回答尽在《2023 年第 4 季度中国大模型季度监测报告》,欢迎大家扫码关注「AI 前线」公众号,回复「季度报告」领取。
今日荐文
投资人烦死 Sam Altman 了
马斯克官宣Grok-1.5!超GPT-4 16倍上下文,推理能力超DBRX,网友:赢在敢说!
3个月砸1000万美元肝出“最强”大模型?黑马Databricks:我们完虐Grok、Llama,还更开放
关于 RAG、AI Agent、多模态,我们的理解与探索
人人都能当周杰伦!Suno作曲,ChatGPT写词,网友用Transformer造出神曲!
你也「在看」吗?👇
微信扫码关注该文公众号作者