Bendi新闻
>
机器人再度大幅进化!阿西莫夫三法则还有效吗?| 大模型一周大事

机器人再度大幅进化!阿西莫夫三法则还有效吗?| 大模型一周大事

3月前
大模型的快节奏发展,让了解最新技术动态、积极主动学习成为每一位从业者的必修课。InfoQ 研究中心期望通过每周更新大模型行业最新动态,为广大读者提供全面的行业回顾和要点分析。现在,让我们回顾过去一周的大模型重大事件吧。
一、重点发现

来自英国 Engineered Arts 的 Ameca、特斯拉的 Optimus 以及 Sanctuary AI 的 Phoenix 等先进机器人产品不断取得突破,机器人正引领科技潮流。它们之所以如此火爆,最大的原因在于这些最新的机器人产品向人们展示了前所未有的技术特点。Ameca 通过 AI 与 AB 技术的融合,实现了高响应性和交互性,与人类沟通更为自然;Optimus 则展示了在机器人速度方面的显著进步,其步速已提升至每秒 0.6 米,比去年提升了 30% 以上,这显示了机器人在动态性能上的突破;而 Phoenix 机器人则以其惊人的速度、精确性和力量展现了机器人在实际应用中的巨大潜力。这些新的技术特点不仅预示着机器人技术将深刻改变我们的生活方式,从提高生产效率到优化日常生活体验,还催生了新的产业机会,例如 Optimus 可在工厂中执行巡逻检查等任务、Phoenix 可凭借其智能性与灵活性完成一些零售相关的任务(挑选、包装、标记、贴标签、折叠等)为社会带来经济增长。

二、具体内容
大模型持续更新

1、26 日晚间,Mistral AI 正式发布了「旗舰级」大模型 Mistral Large。这次 Mistral AI 发布的版本性能更强,体量更大,直接对标 OpenAI 的 GPT-4。而新模型的出现,也伴随着公司大方向的一次转型。

多模态领域

1、阿里最新推出了一款基于音频驱动的肖像视频生成框架,EMO(Emote Portrait Alive)。输入单张参考图像,以及一段音频(说话、唱歌、rap 均可),就能生成表情生动的 AI 视频。

2、字节跳动发布文生图开放模型—— SDXL-Lightning。其通过一种创新技术(渐进式对抗蒸馏)实现了前所未有的生成速度,该模型能够在短短 2 步或 4 步内生成极高质量和分辨率的图像,并将计算成本和时间降低十倍。

3、Playground AI 公司推出最新的文本到图像生成模型——Playground v2.5。这一版本不仅在图像的美学质量上实现了飞跃,更在颜色和对比度的增强、多种比例图像生成能力以及人像细节处理方面做出了重大改进。

4、Ideogram 公司发布了他们最新、最先进的文本到图像模型——Ideogram 1.0,相比旧版本 Ideogram 1.0 提供了前所未有的文本渲染质量、超真实图像生成能力以及对复杂指令的高度遵从性。同时,Ideogram 1.0 还推出了一个名为 Magic Prompt 的新功能,协助用户创作详细的 prompt,生成富有创意的图像。

科研领域

1、西班牙巴塞罗那自治大学(Universitat Autònoma de Barcelona,UAB)的研究人员使用人工智能工具 AlphaFold,预测并模拟了细菌中必需(essential)蛋白质之间的 1402 种相互作用。

2、剑桥大学的研究人员推出了一种深度学习工具—— AbNatiV,用于评估抗体和纳米抗体的天然性,助力抗体药的研发。

应用探索
多语言对话助手

Mistral AI 推出名为 Le Chat 的聊天助手,这是一款先进的人工智能应用,旨在为用户提供自然、流畅的对话体验。作为 Mistral AI 的一项重要产品,Le Chat 集成了公司先进的语言模型技术,如 Mistral Large 等,从而具备了强大的文本生成和推理能力。

多模态生成产品功能更新

1、Pika 推出 Lip Sync 功能,以支持视频人物嘴部动画和音频同步

2、Domo AI 推出了全新的 fusion style 功能,让用户只需通过简单的提示词就能改变视频的风格。这项功能还可以给视频中的人物增加或替换小物品,甚至换上新衣服。

3、Stability AI 宣布与 Morph AI 达成合作,双方基于各自的模型优势,共同推出了一款一体式 AI 视频创作的制作工具——Morph Studio。

智能体

1、英伟达成立最壕 AI 实验室,由 Jim Fan 领衔,专攻具身智能领域。

2、一家来自英国机器人公司 (Engeneered Arts)的机器人产品 Ameca 再进化。因其融合了 AI 与 AB(Artificial Body)技术,这使得 Ameca 成为一个响应性和交互性极强的机器人。

3、特斯拉的人形机器人 Optimus 再次进化,步速已达每秒 0.6 米,虽然只是健康成年人步速的一半,但和去年 12 月的视频相比,速度已经提升了 30% 以上。

4、Sanctuary AI 公司最近发布了一款全新的人形通用机器人——Phoenix,其发布的演示视频令人震惊。在视频中,Phoenix 机器人展示了其在速度、精确性和力量方面的卓越能力,而且这些展示并没有任何加速处理。

终端 AI

1、2 月 26 日,在世界移动通信大会(MWC)上联想集团发布全新 ThinkPad 和 ThinkBook 商务 AI PC,展现了在全球 AI PC 领域的领导力

2、2 月 26 日,在世界移动通信大会(MWC)上,荣耀发布了荣耀 Magic6 Pro,AI PC 荣耀 MagicBook Pro 16 等一系列智能设备

3、清华交叉信息研究院与理想提出了一种利用视觉语言模型(VLM)增强场景理解和规划能力的自动驾驶系统(DriveVLM)来提升汽车的自动驾驶能力

基础设施 / 工具

1、为了解决大模型与人类在价值观上的对齐挑战,上海交通大学和上海人工智能实验室的科研团队提出了一个原创的自我对齐策略 —— 社会场景模拟,并发表在《Self-Alignment of Large Language Models via Monopolylogue-based Social Scene Simulation》中。

2、为了增强 Transformer 的复杂推理能力,Meta FAIR 的田渊栋团队提出了 Searchformer,这是一种 Transformer 模型,但面对迷宫导航和推箱子等多步规划任务时却能计算出最优规划。

3、微软和中国科学院大学提出一种名为 BitNet b1.58 方法将传统以 16 位浮点数形式的存储变为三进制。可让大模型在保持一定精度的同时,显著减少所需的存储空间和计算资源,而且当模型的规模越大时,速度上的提升和内存上的节省会更加显著。

4、最新发表于《IEEE Transactions on Mobile Computing》的一篇论文提出了一种超越主流架构的新架构——FedCache(一种缓存驱动的联邦学习架构)。与主流的个性化联邦学习方法相比,FedCache 的通信效率提高了两个数量级,同时在模型性能中也能达到相当的水平。

5、新加坡国立大学尤洋教授团队联合 UCB、Meta AI 实验室等机构最新开源的研究成果提出了一种用于生成神经网络参数的扩散模型 p(arameter)-diff 。用它来生成网络参数,速度比直接训练最多提高 44 倍,而且表现毫不逊色。

6、谷歌与 Reddit 达成人工智能训练数据协议,每年 年支付 6000 万美元。

7、Tumblr 与 OpenAI 和 Midjourney 就训练数据达成协议,以提供从用户帖子中抓取的训练数据

除了每周的动态更新,InfoQ 研究中心也将以季度为周期,发布《大模型季度监测报告》,跟踪大模型行业的最新动态和相关产品测试。

第一期《大模型季度监测报告 23Q4》预计将于 2024 年 3 月底正式发布,届时还将发布文生图产品大测评。本次文生图产品测评将基于实体对象、风格能力、细节难点、价值观和中文特色五大维度展开。如您期望 InfoQ 对旗下产品进行测试,或想要参与报告内容共建,欢迎联系微信:Bettycbj1996(添加好友请注明来意)

每周动态更新和季度报告后续均会在 AI 前线上发布,欢迎持续关注 AI 前线公众号,共同见证大模型行业的发展与突破!

活动推荐

为了提供更丰富多元的交流平台,QCon 全球软件开发大会将不再局限于传统的分享与研讨模式,而是全面整合为集技术分享、深度研讨和前沿展览于一体的综合性会展活动,并正式更名为【QCon 全球软件开发大会暨智能软件开发生态展】。

同时,会议正式改期为:2024 年 4 月 11-13 日,地点:北京·国测国际会议会展中心。

本次 QCon 围绕大模型应用场景探索、大模型应用产品设计和 AI Agent 智能体落地等热议主题策划了一系列专场演讲,邀请了金山办公、百度、快手、数势科技、钉钉、实在智能等头部企业来与大家分享他们的最新实践经验,更多议题陆续更新中~

QCon 日程上线!讲师进度已超 70%,点击 「阅读原文」 即可查看详情更多详情。目前会议已进入 8 折早鸟购票阶段,联系票务经理 17310043226 ,期待与各位开发者现场交流。

今日荐文


OpenAI硬怼马斯克:没到AGI,就不开源;求职人潮“挤崩”智联招聘;周鸿祎、李志飞开AI 课,被网友质疑 | AI周报


试了下 Stable Video,我的建议是不如不用|AI 测评室

阿里最新图生视频模型效果好得可比肩Sora,但0代码“假”开源让国内外网友骂翻了天?


Gemini翻车,谷歌决策十字路口:该解雇CEO还是该进行“结构化变革”?


文生视频模型“卷”出新天际;多家手机厂商AlI in Al,终端AI时代来临?| 大模型一周大事

你也「在看」吗? 👇

微信扫码关注该文公众号作者

来源:AI前线

相关新闻

Stability、Mistral、Databricks、通义、A21 Labs开源五连招,其中三个是MoE!|大模型一周大事发布屡次截胡?OpenAI与谷歌携新版大模型再度交锋 | 大模型一周大事OpenAI否认加入的AI搜索已是一片红海!Stack Overflow 数据用于 AI 训练再次引发争议!| 大模型一周大事两万字实录:该怎么让机器人吃下大模型?丨GAIR live国产大模型卷翻机器人!这些火遍全网的机器人,都装上了星火「大脑」RoboUniview :视觉语言大模型控制机器人新SOTA!突破机器人相机限制!波音,出大事了!它的飞机还能坐吗?国产版Sora到来!视频大模型更上一层楼 | 大模型一周大事AI视觉的“大一统”:从CV到多模态,从行业大模型到机器人,旷视如何布局?上帝视角下的蓝天白云?大模型改变气象预测格局 | 大模型一周大事鲶鱼效应显著!Sora 发布满月,多模态领域成果丰硕 | 大模型一周大事炸裂更新!这个最像人类的机器人又进化了,还能模仿马斯克赋予机器人思考能力!北大提出自纠正多模态大模型,赋能端到端机器人操作仅售5万!娶个机器人回家当老婆?陪聊天,还陪XX?OpenAI将重新启动之前被放弃的机器人团队;腾讯:现在大模型能力远达不到高频用户需求,渗透率还不足丨AIGC日报ICLR 2024 | 机器人领域首个开源视觉-语言操作大模型!RoboFlamingo框架激发开源VLMs更大潜能一周快讯丨国家大基金三期成立;扬州市新一代信息技术(集成电路)产业母基金发布;100亿,苏州吴中区机器人产业基金发布传微软OpenAI领投人形机器人;OpenAI一键调用GPTs功能上线;年度大模型评测榜单公布丨AIGC大事日报办公、代码赛道应用竞争白热化,音乐生成新贵 Suno 和 Udio 深陷侵权诉讼 | 大模型一周大事AI视频技术突破静默,让每一帧画面实现声色同步 | 大模型一周大事让智能设备更懂你,主动式AI正在崛起 | 大模型一周大事大模型的“瘦身”革命:巨头逐鹿轻量化大模型 | 大模型一周大事对话王田苗:万亿市场之下,大模型+机器人还有四大问题未解决|36氪专访Meta、微软、Mistral AI、Hugging Face、通义、港中文六路进发开源大模型 | 大模型一周大事
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。