华为ADS和小鹏的VLA,到底谁是未来?
作者:128汽车网 发布时间:2025-11-22 20:54:01 阅读量:0

最近智驾圈可太热闹了!

理想、小鹏们高调押注VLA技术,恨不得把"语音控车"写在脸上。结果华为直接站出来开炮:"我们不走VLA路线!"蔚来也跟着表态,选择了世界模型。

VLA到底是个啥?为啥这么火

说起VLA,你肯定在各种评测视频里见过——车主对着车说"左转""靠边停车",车就乖乖照做,科技感拉满。

华为ADS和小鹏的VLA,到底谁是未来?-1

理想把这个功能包装成"专属司机",屏幕上还能实时显示车辆的思考过程,看起来确实挺酷的。

华为ADS和小鹏的VLA,到底谁是未来?-2

但是!语音控车≠VLA的核心能力。

早在2021年,小鹏就能通过语音指挥辅助驾驶变道超车了,那会儿VLA这个词都还没火起来呢。

那VLA的真正本事在哪儿?

简单说,VLA就是V(视觉感知)+L(语言模型)+A(动作执行)。车辆先"看"环境,然后用语言模型把看到的东西"翻译"成人话,最后再决策执行。

元戎启行的周光说得更直白:"语音控车只是VLA的基础能力,最难的是思维链和长时序推理,这才是核心竞争力。"

理想的郎咸朋博士还举了个很形象的例子:人的视力比不过鹰,速度比不过豹子,但为啥人类能称霸地球?靠的就是强大的认知和语言能力!

听起来是不是很有道理?

华为为啥不买账?

但是!华为可不这么看。

华为智能驾驶负责人李文广直接开炮了:"VLA对空间的感知能力不行,车是要在空间里运动的,这条路挺危险。"

他说的是啥意思?

你想啊,语言模型要把看到的东西转成文字描述,再根据描述做决策。这就像你看着菜谱学做菜,上面写"放盐少许"——这"少许"到底是多少克?

语言表述天然就是模糊的,但开车需要精确到厘米级的空间定位。前面有个障碍物,"稍微"偏左一点,这个"稍微"是10厘米还是50厘米?

华为车BU CEO靳玉志也表态:"我们更看重WA(World Action),省掉language环节,直接从信息输入到控车,不需要先转成语言再控制。"

说白了,华为觉得VLA多此一举——为什么要绕个弯子把视觉信息变成文字,再变回控制指令?直接VA(视觉到动作)不就完了?

华为和蔚来站在了一起

有意思的是,蔚来跟华为的想法不谋而合。

蔚来今年推出的NOP+用的是世界模型,华为的WEWA架构强调的是World Model Action。两家巨头,在智驾路线上居然统一战线了。

那世界模型又是啥?

简单理解,就是让车"像人一样思考"——看到现在的情况,能预测未来可能发生什么。

蔚来的NWM能在100毫秒内推演216种可能的行驶轨迹,还能根据3秒钟的视频输入,脑补出120秒的未来场景。

华为的WE(世界引擎)则是在云端搭了个"虚拟驾校",用AI生成各种危险场景——鬼探头、急刹车这些现实中难遇到的情况,密度是真实世界的1000倍!

这就好比让学员在模拟器里经历一万次车祸,上路就成老司机了。

• VLA派认为:语言模型带来的强大推理能力,能让车"像人一样思考",可解释性强• 世界模型派认为:直接建模物理世界更高效,不需要语言这个"中间商"

说了这么多技术术语,普通消费者其实只关心一个问题:哪个更好用?

小鹏P7最低售价:21.98万起图片参数配置询底价懂车分3.94懂车实测空间·性能等车友圈17万车友热议二手车7.89万起 | 470辆

坦白讲,现在不管是蔚来的NOP+还是理想的AD Max,体验上都还有槽点。技术再先进,开起来不顺手也白搭。

就像当年智能手机刚出来时,大家争论是塞班系统好还是安卓好,最后市场用脚投票——谁体验好用谁。

自动驾驶也一样。不管是VLA、世界模型还是啥WEWA,能安全、舒适地把人送到目的地,那就是好技术。