Bendi新闻
>
背靠百度,极越就敢说自己是智能化标杆了?

背靠百度,极越就敢说自己是智能化标杆了?

7月前


前两天,极越搞了个 AI DAY 发布会。


开头两句话就把我给吸住了。


极越 CEO 夏一平说 “ 极越 01 的上市拉开了智能汽车的序幕,极越 01 成为整个行业的智能化标杆,没有之一。 ” 


不儿,现在大家都这么猛的吗?


以前都是小鹏说自己智驾标杆,现在华为靠着一手全国无图智驾,也成了标杆。这极越作为一家入场并不算早的新势力,咋也成汽车智能化的标杆?


越往后听越发现,你别说这极越的 AI DAY 还真有点东西。


极越背靠百度,把文心一言大模型给搞车里了。作为国产语言大模型的小标杆,文心一言先是被三星 S24 作为国内 AI 助手的候选人。最近听说又被苹果瞄上了,果子准备在下一代 iPhone 16 加入文心一言。


而极越作为一辆车,把文心一言搞进去又是做啥用的?


首先是让语音助手更聪明,以前只能开个窗关个空调,现在是行走的百科全书,堵车的聊天神器。


跟文心一言谈笑风生或是在线答疑,主打就是一个陪伴。


而且按极越的统计,极越车主日均调用文心一言服务可以达到 7.1 次,说明车主用上基本就离不开了。


好好好,中年男人不回家,坐在车里合着不是玩王者荣耀,而是跟极越车机讲相声?


当然,除了要聪明,车机语音助手最关键的功能,是让智能座舱变得实用。


先来说智能座舱这个点,极越提到了一个 “ 全域全端侧 ” 的交互概念。


说起来也简单。


像咱们平常用语音交互的时候,主要头疼也就这么几个事,一是没信号,二是有卡顿,三是听不懂,四是没隐私,那么这个 “ 全域全端侧 ” ,其实就是为了解决这些问题。


先说没信号,目前汽车的语音助手其实都要依靠 “ 云 ” 技术来实现


说白了就是需要联网,没网就用不了了。有的地下车库信号不好,有的山区根本没网,语音助手就交互不了一点。


所以,极越把整套语音交互相关的模块,都塞在了车载芯片的 NPU 里,相当于车自己就有个脑子,就没网其实也能聊。


其次,极越把语音助手的逻辑运算和深度学习模型都放在 NPU 里,不仅是联网的问题,还可以减少中间流程,减少卡顿,最终可以使交互速度提升到 700 ms 以内。


隐私就更好保护了,毕竟离线语音,你的聊天记录不会发送到车企总部,就不怕你和 AI 助手的聊骚被车企员工标注了( 狗头 )。


然后还有一个识别率的问题,有时候还真不能怪 AI “ 人工智障 ” ,其实在嘈杂环境下, AI 收到的音频和咱们考六级听力测试没啥区别,换人来听也未必准确,说实话遇到普通话不好的,我是真的耳背。


所以,极越把本来用在智驾上的多模态策略用到座舱上了。说白了,不仅听你语音,还对你口型,这样一套 “ 多传感器融合 ” 方案,据说可以达到 90% 的正确率。


你别说,背靠老大哥的 AI 技术,座舱这块搞得真可以。那智驾这块你靠谁?


哎!还真让它找着靠山了!靠谁呢,先买个关子,咱们接着看。


和大多数车企走纯视觉路线不同,极越是纯视觉 + 一点有图的 “ 非主流路线 ” 。。。


先说纯视觉,在上一次 OTA 之后,极越就用上了 OCC 占用网络技术,这个技术简单说就是将多个摄像头观测到的二维图形进行算法处理,形成三维建模,最后整出一个类似《 我的世界 》的 “ 体素 ” 世界。


而且,用户可以通过车机实时查看,更好地感知汽车机器人的世界。


它们把这个 OCC + BEV + Transformer 称为 B.O.T 三向箔,不过,这套东西倒不是极越首创,在本质上它和特斯拉是同一个逻辑,但是在国内这么做的,极越还真是第一个。


想当年,特斯拉之所以不做多传感器融合,主要还是激光雷达的价格太贵,现在国产化的激光雷达早不是曾经这个价位了,极越就不能拿它当理由了吧?


所以,极越的解释是,纯视觉具备更快的迭代速度和更高的技术上限。


有一说一,激光雷达确实可以精确地判断物体体积,但纯视觉可以通过色彩等信息,对物体进行识别,不过这要更强大的算法才能实现,按百度王亮的说法, “ 激光雷达初速度高,纯视觉加速度更快 ” 


这就不得不说,百度的 AI 在智驾训练上的优势。比如说,通过文心一言可以快速找到相关属性的智驾训练素材,好比一个考试题库,随时挑重点难题对 AI 进行特别培训。


据说,在智驾训练用上文心大模型之后,成本会大幅降低,效率会大幅提升。


所以,从上市到现在,极越 5 个月 5 次 OTA ,每个月都搞了个新版本,好好好,月月开新车是吧。。。


而且在下个大版本更新后,极越 PPA 也可以 “ 全国都能开 ” 了。但准确的说是 “ 有百度地图的地方,极越 PPA 都能开 ” ,毕竟它还是有图的嘛。


所以主流车企都在无图化,为啥极越偏要做有图呢?


其实,咱们得纠正一个观点,目前大家谈的有图和无图,其实没有那么明确的非黑即白,而是处于一个灰色中间态。


首先无图不是真没地图做参考,导航用的 SD 地图还是要看的,不然都不知道往哪里开了。


而且大多数车企会选择 “ 有图用图,无图再说 ” 的方案,这倒不是说无图不行,而是需要大量的算法作为基础,依然是一个门槛很高的操作,一般车企还真做不好,有现成的图用着,那就先用着


而有图最大的问题是费钱,比如做完一个城市的高精地图,可能得上亿的成本,而且这还不是最关键的,还有修路、市容市貌修正等一些原因,高精地图还要不停维护更新,基本是个无底洞。


巧了,我极越智驾的靠山来了,百度地图


百度作为地图行业的老大哥,也有它的理解,它的答案就是做一套 LD 地图,在成本和效用上做了权衡,说有图那确实是有图,但其实也是做了妥协,精度没有高精地图那么高,成本则会低得多。


有一个好处是,因为不用大规模制图,即便是地图更新的问题,也可以通过视觉实时建图,降低成本


所以说,极越这套纯视觉 + 有图的方案,决不是谁一拍脑袋做出的决策,而是背靠百度的存量资源,极越智能座舱有文心一言大模型做靠山,极越智驾有百度地图和 L4 级别的萝卜快跑做靠山。


所以这么看下来,极越老板做标杆这句话还真不是吹牛口嗨,有点东西。看来我是时候向差评君申请,搞一辆极越来给大伙测测了。


最后,送上一个彩蛋!还记得前文提到的 “ 体素 ” 世界吗,极越这次 OTA V1.4.0 版本后更新了一个 OCC 彩蛋,实在是太有意思了,直接上视频,让大家也感受一下。


撰文:TC   编辑:脖子右拧   封面:萱萱

图片资料来源:
极越AI DAY



微信扫码关注该文公众号作者

来源:差评

相关新闻

这巴黎的天气还就说不准了?问诊案例 | 宝宝喝完奶就拉肚子是怎么了?考上大学就轻松了?其实不过是牛马人生的开始罢了![干货] “给某人换班”,英语咋说?一个单词就够了打不过就加入?说说人工智能中翻译的从业危机《繁花》背后讲的是什么?王家卫说了八个字腾讯研发了快一年的混元文生图模型,说开源就开源了?零售企业的数字化,怎么越做越迷茫了?美国断了座桥第三次世界大战就来了?这届网友是什么都敢想啊“申请的时候找个文书老师修改下文书就可以了”,是真的吗?协助女子自杀被判过失杀人,他却说自己是天使,在帮助人类,啊?什么!特朗普说留学生毕业就送绿卡?这是真的吗?毛豆还在读书吗?是的,而且越读越多了美高各个学校放榜时间不一样吗?为什么有的要3月10号,有的却是面试完就知道录取结果了?|FS问答精选拜登又嘴瓢!把死人当活人说出去... 这是症状又严重了?用“说话按钮”交流的狗子们,是真的学会说人话了吗?39亿存款说没就没了?内蒙古首富栽了……ECCV 2024|是真看到了,还是以为自己看到了?多模态大模型对文本预训练知识的过度依赖该解决了秦岚、徐璐“无内衣”走红毯是真的?这些女明星也太敢了吧……“跟老婆离婚后,再和小三过夫妻生活是什么感受?”2个男人说了大实话更健康、更懂你的家庭智能照明终极形态应该是什么样子?求助:我发现自己长了两个子宫是什么情况?智能化办公时代,你还在自己做PPT?为什么说“是时候停止玩3A游戏了”?
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。