背靠百度,极越就敢说自己是智能化标杆了?
前两天,极越搞了个 AI DAY 发布会。
开头两句话就把我给吸住了。
极越 CEO 夏一平说 “ 极越 01 的上市拉开了智能汽车的序幕,极越 01 成为整个行业的智能化标杆,没有之一。 ”
不儿,现在大家都这么猛的吗?
以前都是小鹏说自己智驾标杆,现在华为靠着一手全国无图智驾,也成了标杆。这极越作为一家入场并不算早的新势力,咋也成汽车智能化的标杆?
越往后听越发现,你别说这极越的 AI DAY 还真有点东西。
极越背靠百度,把文心一言大模型给搞车里了。作为国产语言大模型的小标杆,文心一言先是被三星 S24 作为国内 AI 助手的候选人。最近听说又被苹果瞄上了,果子准备在下一代 iPhone 16 加入文心一言。
而极越作为一辆车,把文心一言搞进去又是做啥用的?
首先是让语音助手更聪明,以前只能开个窗关个空调,现在是行走的百科全书,堵车的聊天神器。
跟文心一言谈笑风生或是在线答疑,主打就是一个陪伴。
而且按极越的统计,极越车主日均调用文心一言服务可以达到 7.1 次,说明车主用上基本就离不开了。
好好好,中年男人不回家,坐在车里合着不是玩王者荣耀,而是跟极越车机讲相声?
当然,除了要聪明,车机语音助手最关键的功能,是让智能座舱变得实用。
先来说智能座舱这个点,极越提到了一个 “ 全域全端侧 ” 的交互概念。
说起来也简单。
像咱们平常用语音交互的时候,主要头疼也就这么几个事,一是没信号,二是有卡顿,三是听不懂,四是没隐私,那么这个 “ 全域全端侧 ” ,其实就是为了解决这些问题。
先说没信号,目前汽车的语音助手其实都要依靠 “ 云 ” 技术来实现。
说白了就是需要联网,没网就用不了了。有的地下车库信号不好,有的山区根本没网,语音助手就交互不了一点。
所以,极越把整套语音交互相关的模块,都塞在了车载芯片的 NPU 里,相当于车自己就有个脑子,就没网其实也能聊。
其次,极越把语音助手的逻辑运算和深度学习模型都放在 NPU 里,不仅是联网的问题,还可以减少中间流程,减少卡顿,最终可以使交互速度提升到 700 ms 以内。
隐私就更好保护了,毕竟离线语音,你的聊天记录不会发送到车企总部,就不怕你和 AI 助手的聊骚被车企员工标注了( 狗头 )。
然后还有一个识别率的问题,有时候还真不能怪 AI “ 人工智障 ” ,其实在嘈杂环境下, AI 收到的音频和咱们考六级听力测试没啥区别,换人来听也未必准确,说实话遇到普通话不好的,我是真的耳背。
所以,极越把本来用在智驾上的多模态策略用到座舱上了。说白了,不仅听你语音,还对你口型,这样一套 “ 多传感器融合 ” 方案,据说可以达到 90% 的正确率。
你别说,背靠老大哥的 AI 技术,座舱这块搞得真可以。那智驾这块你靠谁?
哎!还真让它找着靠山了!靠谁呢,先买个关子,咱们接着看。
和大多数车企走纯视觉路线不同,极越是纯视觉 + 一点有图的 “ 非主流路线 ” 。。。
先说纯视觉,在上一次 OTA 之后,极越就用上了 OCC 占用网络技术,这个技术简单说就是将多个摄像头观测到的二维图形进行算法处理,形成三维建模,最后整出一个类似《 我的世界 》的 “ 体素 ” 世界。
而且,用户可以通过车机实时查看,更好地感知汽车机器人的世界。
它们把这个 OCC + BEV + Transformer 称为 B.O.T 三向箔,不过,这套东西倒不是极越首创,在本质上它和特斯拉是同一个逻辑,但是在国内这么做的,极越还真是第一个。
想当年,特斯拉之所以不做多传感器融合,主要还是激光雷达的价格太贵,现在国产化的激光雷达早不是曾经这个价位了,极越就不能拿它当理由了吧?
所以,极越的解释是,纯视觉具备更快的迭代速度和更高的技术上限。
有一说一,激光雷达确实可以精确地判断物体体积,但纯视觉可以通过色彩等信息,对物体进行识别,不过这要更强大的算法才能实现,按百度王亮的说法, “ 激光雷达初速度高,纯视觉加速度更快 ” 。
这就不得不说,百度的 AI 在智驾训练上的优势。比如说,通过文心一言可以快速找到相关属性的智驾训练素材,好比一个考试题库,随时挑重点难题对 AI 进行特别培训。
据说,在智驾训练用上文心大模型之后,成本会大幅降低,效率会大幅提升。
所以,从上市到现在,极越 5 个月 5 次 OTA ,每个月都搞了个新版本,好好好,月月开新车是吧。。。
而且在下个大版本更新后,极越 PPA 也可以 “ 全国都能开 ” 了。但准确的说是 “ 有百度地图的地方,极越 PPA 都能开 ” ,毕竟它还是有图的嘛。
所以主流车企都在无图化,为啥极越偏要做有图呢?
其实,咱们得纠正一个观点,目前大家谈的有图和无图,其实没有那么明确的非黑即白,而是处于一个灰色中间态。
首先无图不是真没地图做参考,导航用的 SD 地图还是要看的,不然都不知道往哪里开了。
而且大多数车企会选择 “ 有图用图,无图再说 ” 的方案,这倒不是说无图不行,而是需要大量的算法作为基础,依然是一个门槛很高的操作,一般车企还真做不好,有现成的图用着,那就先用着。
而有图最大的问题是费钱,比如做完一个城市的高精地图,可能得上亿的成本,而且这还不是最关键的,还有修路、市容市貌修正等一些原因,高精地图还要不停维护更新,基本是个无底洞。
巧了,我极越智驾的靠山来了,百度地图。
百度作为地图行业的老大哥,也有它的理解,它的答案就是做一套 LD 地图,在成本和效用上做了权衡,说有图那确实是有图,但其实也是做了妥协,精度没有高精地图那么高,成本则会低得多。
有一个好处是,因为不用大规模制图,即便是地图更新的问题,也可以通过视觉实时建图,降低成本。
所以说,极越这套纯视觉 + 有图的方案,决不是谁一拍脑袋做出的决策,而是背靠百度的存量资源,极越智能座舱有文心一言大模型做靠山,极越智驾有百度地图和 L4 级别的萝卜快跑做靠山。
所以这么看下来,极越老板做标杆这句话还真不是吹牛口嗨,有点东西。看来我是时候向差评君申请,搞一辆极越来给大伙测测了。
最后,送上一个彩蛋!还记得前文提到的 “ 体素 ” 世界吗,极越这次 OTA V1.4.0 版本后更新了一个 OCC 彩蛋,实在是太有意思了,直接上视频,让大家也感受一下。
微信扫码关注该文公众号作者