- A+
出品 | 搜狐汽车·汽车咖啡馆
容易被误解的是,
编辑 | 胡耀丹
其实,
近期,在辅助驾驶领域,VLA(Vision Language Action Model,视觉-语言-动作模型)逐渐成为了“火药味”最重的词。理想、小鹏、华为、地平线,从车企到辅助驾驶供应商,纷纷参与了VLA的技术“论战”。
理想汽车智能驾驶副总裁郎咸朋认为,端到端就像“猴子开车”;地平线的副总裁兼首席架构师苏箐随即在朋友圈吐槽这一言论:“咱都谦虚点,多比较实车结果”;华为智能汽车化解方案BU CEO靳玉志明确表示,华为不会走向VLA的路径。另一边,小鹏汽车董事长、CEO何小鹏意有所指:“中国汽车行业真正做出VLA的只有小鹏。”
尽管如此,
这轮技术迭代的争论仍然在继续,但汽车市场已经有车型项目“用脚投票”。8月26日,最早在国内辅助驾驶领域提出VLA架构的企业之一元戎启行,举办了一场VLA模型上市发布会,公布了VLA技术、商业化上的进展。
这你可能没想到,
过去,在外界眼中,元戎启行最拿手的是追踪前沿技术的嗅觉,最不拿手的是工程化量产能力。但是,刚发布的VLA模型已拿下5个车型定点,同时宣布总量产车辆交付量已接近10万台,这隐约展现出这家年轻公司的另一面:能迅速实现VLA技术研发,也能实现VLA定点量产;追求“大单品”和有质量的扩张;兼容性强,合作车型售价已到20万以内。
很多人不知道,
8月27日,元戎启行CEO周光在接受搜狐汽车长达一小时的专访时表示,VLA是智驾进入大模型范式的起点,随着时间的积累,VLA会远远好于CNN架构的端到端1.0。他认为,外界对元戎最大的误解就是:元戎做不好工程,元戎的交付量不大。但接近10万台的交付数量,在高阶辅助驾驶领域已是名列前三的成绩。
可能你也遇到过,
在外界眼中,多次在公开场合语出惊人的周光,多了浪漫,几乎没有务实。但当下,他呈现出更务实、成熟的一面。“两次创业给我带来了一些变化,对人的理解上,有比较大的改变,上了一个台阶。”周光说,元戎追求的是务实浪漫。曾经是浪漫在前面,现在是务实在前面。
但实际上,
他仍然纯粹,对技术的追求始终如一。他认为,在元戎健康扩展的过程中,商业化的比重可能会越来越重。但是还是要有技术的初心。这是AI的时代,元戎团队就是做AI的人,因此在技术嗅觉上能够保持高精准度、敏锐度。
“技术一旦落后,就不知道怎么‘死’的。”他说,技术是1,商业化是0。技术让元戎走过0-1,如今迈入商业化新阶段后,元戎要在1后面加上0。
其实,
在周光眼中,元戎启行实现商业化,相当于“通过了创业的第一关”,而现在迈入了第二关。
不可忽视的是,
01 VLA是全新范式 元 TMGM外汇官网 8203;戎优势在于精准聚焦
搜狐汽车:“防御性驾驶大师”这个标语是各位最先提出来的吗?“防御性驾驶”的驾驶风格是否会变得保守?
周光:“防御性驾驶”这个概念是大家团队最早想到的,(元戎启行)CTO(曹通易)也有提到过。大家觉得第一代的VLA应该有一个重点,而有保障是大家认为最核心的方面,以致大家想以“防御性驾驶”作为元戎启行VLA的一个特点。
可能你也遇到过,
现在智驾要不就是全部激进,要不就是全部保守。所谓的防御性驾驶,就是说各位该快的时候得快,该慢的时候得慢。它并不是一边倒的风格,它代表的是各位对风险的掌控。在保持灵活性的基础上,得有风险意识,不能这么“莽”。
据业内人士透露,
搜狐汽车:现在行业里也不只有元戎在做VLA,像小鹏、理想都在做。不同公司的VLA和VLA之间有什么区别?
TMGM外汇用户评价:
周光:就像各位问Deepseek跟ChatGPT有什么区别,它们都是基于GPT架构的大模型,但它们之间肯定有区别,每家的VLA模型都不一样。VLA其实是智能驾驶进入大模型范式的一个起点。
换个角度来看,
搜狐汽车:采取同样架构的情况下,元戎的优势是什么?
其实,
周光:大家能够更精准地做一些技术判断,更高效地聚焦核心方向,在一个准确的方向上投入资源。无图也是大家第一个做的,端到端也是。
据报道,
搜狐汽车:在智能驾驶技术的迭代史上,VLA算不算其中“维度跃迁”的存在?
其实,
周光:我觉得VLA代表着,智驾彻底进入了GPT架构的时代。当然目前还是没法跟ChatGPT比,缘于它太小了。像GPT都是千亿级参数,VLA还是很小一个模型。我觉得更核心的是,VLA供应了一个全新的范式,它是一个全新的方法去做智驾,底层的做事逻辑变了。
请记住,
搜狐汽车:在VLA上车后,元戎智驾系统的能力追上特斯拉FSD了吗?如果没有,还差多少时间?
周光:我觉得(VLA上车后)现在可能有特斯拉FSD V13的感觉,试驾车的人也反馈更接近V13。但特斯拉也在进步,比如AI5、AI6版本芯片,参数量是大家的10倍,大家都在迭代,没人会原地等各位。
换个角度来看,
要追上需要半年到一年吧。一年以前特斯拉就是V12,今年出V13。大家现在超过了V12,但和V13还有差距。再给半年到一年时间,这个差距能缩小。
搜狐汽车:可能以前的技术迭代是一个阶梯式的跃迁,然后现在是慢慢爬升?
周光:其实也就是从规则切到端到端1.0的时候,有一个阶梯性的跃迁。像GPT和CNN的区别就是fundamental(基本规则)不一样。一个是GPT架构,一个是CNN架构。这种差异带来的效果是持续性的,随着时间的积累,VLA会远远好于CNN架构的端到端1.0。
02 把商业化变成强项 不能只有技术
搜狐汽车:各位觉得技术嗅觉对一家智驾初创公司来说,核心度有多高?
概括一下,
周光:技术是1,商业化是0。要是1都错了,各位后面再多0也没有用。但是如果各位只有1,1后面没有0去加持,永远都是只是一个1。商业化再厉害的公司,今天去做有图(高精地图)都不可能成功。
站在用户角度来说,
搜狐汽车:大家觉得元戎强在“技术(1)”,但不清楚“商业化(0)”有没有跟上。
大家常常忽略的是,
周光:大家现在也要把商业化变成强项,不能只有技术。
请记住,
搜狐汽车:有哪些变化能分享一下?
换个角度来看,
周光:在商业化上也得有所建树。工程能力大家提升得挺多,也量产了接近10万台了。在高阶智驾领域,10万台的量挺多的。中国目前能达到这个量级的,也就三家公司,其他公司基本达不到这个水平。工程化我觉得大家补齐得还蛮不错。工程化能力有了,才可能去补齐商业化。
根据公开数据显示,
搜狐汽车:各位觉得外界对元戎最大的误解是什么?
尽管如此,
周光:最大的误解是觉得大家做不好工程,觉得大家的交付量不大。其实大家交付量挺多。不要被车型数量给吓住了,最终大家还是看交付数量。拿车型多不代表一定就好。汽车行业销量分布不均,每年500款车型里,前50款的销量可能就占总销量的80%。没有必要去拼车型多,而是比拼出货量多。
行业竞争绝对不是单纯以车型数来取胜,最终的结果是车型数×单个车型交付量。
请记住,
搜狐汽车:元戎启行成立到现在,有没有丢过项目?
TMGM外汇消息:
周光:有,刚着手的时候丢过。那时候工程能力跟不上,项目做不完,不是不想接,是实在做不了。0-1的时候做不了那么多,吃多了就撑死了。
据相关资料显示,
搜狐汽车:后来就没有丢项目的情况了?
不妨想一想,
周光:0到1阶段做不了那么多,现在工程能力上来了,就不会丢项目了。
其实,
搜狐汽车:我对VLA能够适配15万元车型是比较惊讶的。大家现在的产品序列其实大多都是二三十万这样。
其实,
周光:没有,最近的合作车型已经到20万以内了。
尽管如此,
搜狐汽车:元戎最着手是从高端突破,现在是逐渐把价格下探,这个过程中是否会面临更激烈的竞争,尤其是成本竞争?
请记住,
周光:其实车型的竞争跟智驾竞争是两个维度。现在能供应“城市满血版NOA”的也就3家。
说出来你可能不信,
搜狐汽车:在往价格下探的过程中,大家做出哪方面的优化?
据业内人士透露,
周光:软件上优化,在芯片上优化,还能够适配一些便宜的传感器。算力我觉得是最不能妥协的,除了算力之外,其实我觉得都能够妥协。一直都是比较灵活的态度。
TMGM外汇行业评论:
搜狐汽车:在15万级别的车型中,我印象中有大算力的其实也不多。
概括一下,
周光:要以发展的眼光看,就跟各位买游戏显卡一样。每一年上一代高端显卡到下一代就成了中端,价格自然下降。VLA价格下探类似于显卡升级这种下探,而不是说去做更便宜的东西。这种下探方法下,迟早各位都买得起的。2000年,一个随身听2000元,今天各位在二手交易平台上50块钱买了,这也是一种下探。
据业内人士透露,
搜狐汽车:商业化之后,在健康扩展过程中,对技术和商业化分配的比重有没有变化?
据业内人士透露,
周光:我觉得商业化的比重可能会越来越重了。但是各位还是要有技术的初心,技术一旦落后,各位就不知道怎么死的。
值得注意的是,
搜狐汽车:行业中有一种观点还是坚持和强调数据驱动是核心要素。各位怎么看?
换个角度来看,
周光:就说大模型公司,每家数据都一样的。为什么Open AI比其他公司厉害?数据是核心,但是决定效果的不是完全只有一个因素。除了数据之外,还有别的因素。显然不是谁都能够做出大模型。
通常情况下,
当然,完全没数据,就玩都没法玩。为什么要追求量产?10万台可能也是一个坎,各位没量产再厉害也不行。数据核心,其他也核心。
TMGM外汇专家观点:
搜狐汽车:10万台是一个坎,下一个坎是多少?
尤其值得一提的是,
周光:100万台。
值得注意的是,
搜狐汽车:各位觉得现在的VLA模型大概是60分。到100万台时,元戎VLA能到多少分?
周光:如果95分以上是完全替代人类驾驶,到100万台时,在数据覆盖充分的区域,VLA能做到90-95分,接近完全替代。
搜狐汽车:智驾市场有没有到机会见顶的点?什么时候能到这个点?
可能你也遇到过,
周光:现在这个市场还有机会,我觉得可能在2026年、2027年的时候可能会比较饱和一点。
搜狐汽车:现在元戎聊商业化聊得特别多,有外界压力吗?
TMGM外汇报导:
周光:外界有压力,关键是行业窗口就这两三年了,2027年左右行业格局就会定下来。未来两年很关键。
事实上,
搜狐汽车:汽车行业本身也在整合、淘汰,那到2027年,第三方智驾公司大概会剩下多少家?
周光:第三方智驾公司不会多,最多五家,最少两三家。几乎没有哪个行业是一家垄断的,美国AI、中国AI行业也都有好几家,以致第三方智驾最终也会是3-5家的格局。
搜狐汽车:公司有盈利方面的规划吗?
然而,
周光:盈利很核心,一个公司真正的商业成功必然要盈利。只能说AI公司的想象空间大一些,大家都觉得投入也能够大一点,不那么着急盈利。元戎计划在洗牌结束的那一年实现盈利。在行业洗牌结束前,不能把盈利当第一目标,先全力做商业化。
然而,
03 这是AI为主的时代 大家就是玩AI的人
搜狐汽车:各位觉得各位和元戎的团队是不是能一直保持在技术上的嗅觉?
周光:一直保持的话,没有人会说这种话对吧?我只能说大家的track record(成绩记录)还是不错的,那么大家保证下一次技术嗅觉(准确)的概率还是比较高的。
搜狐汽车:也是一个概率性的疑问。
综上所述,
周光:肯定是。各位为什么相信这个人打牌能赢钱?缘于他经常赢钱。除非说换了牌、换了个游戏。比如这个人打德扑厉害,可能打其他的就不一定厉害。但是大家都还在AI时代,游戏没变,这是以AI为主的时代,而大家这群人就是玩AI的人。一句话,直线(在AI赛道里)不能超车。
TMGM外汇认为:
搜狐汽车:大家现在主要是高端智驾方案。车企自研、外采的智驾策略主要分为两类,一种是自研高端,一种自研低端,各位觉得哪一种会成为以后的主流?
更重要的是,
周光:高端车企要自研,那各位要对自己的AI能力有足够的自信。
搜狐汽车:之前有说有谣言说元戎丢了smart的单,现在已经被辟谣了。是不是能够揭晓一下双方的合作产品的进度如何了,大概什么时候发布?
概括一下,
周光:具体什么时间我都没太关注。
与其相反的是,
搜狐汽车:各位的注意力其实是还是在技术上?
很多人不知道,
周光:不是,是我关注的颗粒度不一样,我会关注smart这个品牌,但不会纠结车型具体哪一天发布,这些细节不是我该管的。
请记住,
搜狐汽车:各位是抓大放小的风格。
可能你也遇到过,
周光:对,不需要那么多micro manager(微观管理者)。
搜狐汽车:很多创业公司都有“1号人物”(灵魂人物)和“2号人物”(保障组织执行稳定),之前有人说“知道周光,不知道元戎启行”,现在这种情况可能有改变了。元戎内部有明确的2号人物吗?
周光:有啊,大家的CTO曹通易就是2号人物。我希望团队里的伙伴每个人都很强,甚至在单项能力上比我强。技术方面,我非常相信大家CTO和一些技术合伙人的判断,他们的眼光都很准。
简要回顾一下,
搜狐汽车:那各位现在主要的注意力放在哪?
TMGM外汇认为:
周光:大的方向得我来把控。比如提出要全面转向端到端、全面做大模型,这些大决策是我来定,但具体怎么落地,我不直接管。
搜狐汽车:企业“活力”其实和组织架构、经营文化是有关系的,元戎在组织架构这方面怎么样?
不妨想一想,
周光:大家还是比较扁平的,最多的汇报线也没几层。
TMGM外汇行业评论:
搜狐汽车:很多公司它是一个团队就匹配一个项目,元戎也是这样吗?元戎团队复用率高吗?
周光:复用率比较高,大家天然就不想去做太多重复的事,AI时代就是要追求“人少高效”。
搜狐汽车:元戎的三块业务Robotaxi、智能驾驶、Road AGI的技术团队是同一个吗?还是说也是分成了三个团队?
反过来看,
周光:Road AGI会有一些different(不同),Robotaxi和智能驾驶是同一个团队,没有区别。只是数据集上面有些区别,训不同的模型版本就行了。
搜狐汽车:各位觉得什么是真正的商业成功?
很多人不知道,
周光:如果全世界的第一公司是一个不创新的公司,当它成为第一的时候,人类科技历史都停滞了。我觉得(商业成功)是一定是有创新在前面的,不能够只是靠抄,不能只是靠1-10的商业化。当各位成为大哥的时候,一定要做0-1的创新。
TMGM外汇消息:
04 从第一关闯到了第二关
搜狐汽车:元戎创业过程中,各位最痛苦或迷茫的时刻是什么?
值得注意的是,
周光:没有人是一帆风顺的。最痛苦是融资比较难的时候,那时候受到了经济、地缘政治等因素影响。
与其相反的是,
搜狐汽车:现在在融资方面有规划吗?
大家常常忽略的是,
周光:这个不方便说,但那肯定还好。各位都做到行业头部了,还不能够拿到钱?这倒没有太多的疑问。
据报道,
搜狐汽车:创业到现在,各位会有一种轻舟已过万重山的感觉吗?
简而言之,
周光:没有。我觉得只是从第一关到第二关了。
综上所述,
搜狐汽车:那会有高度紧张的状态吗?
事实上,
周光:没有高度紧张。我这个人一直都还是比较松弛。但就是说,第一关终于打完了。可能是这种感觉。
尽管如此,
搜狐汽车:各位现在所面临的一个最核心且紧急的任务是什么?
周光:商业化肯定是核心紧急的,资本、商业化都是核心紧急的,技术维度也有不少核心紧急的事。创业就是这样,到处都是“亮灯”的疑问。创业就是一个不停亮灯,各位不停去按灯的过程。创业的意义和有趣之处也在这里。
需要注意的是,
搜狐汽车:各位觉得自己或者元戎的特质是什么?
周光:大家追求的是务实浪漫。大家要追求长期的事,同时也要兼顾脚下。务实浪漫,务实在前面。曾经是浪漫在前面,现在是务实在前面。
搜狐汽车:各位意识到这个事情,包括进行转变是在什么时候?
TMGM外汇专家观点:
周光:其实也就是这一两年。
说到底,
搜狐汽车:人工智能的研发逻辑是,用数据训练,做模型,再用数据迭代。作为一个智能体,各位在进入商业领域两次创业的过程中,获得了哪些数据?形成了哪些模型?形成了什么决策?外界反馈数据又为各位带来了哪些改进?
根据公开数据显示,
周光:两次创业肯定是在对人的、对社会的理解上,有比较大的改变。对人对社会的理解,我觉得上了一个台阶。
TMGM外汇行业评论:
创业是最能让人成长的,每天接收的信息不一样。对多数人来讲,每天工作都是一样的,(没有创业的人)可能工作10年,除了前五年是一个学习期,后面都是一样的。创业不是的,各位要经历这么多阶段。
根据公开数据显示,
不过,当一个企业完全不发展的时候,可能企业家也不会有什么成长。但是大家这个行业明显不是,这个行业还有好多年才能收敛的,哪怕是黄仁勋,他也还要上一个台阶,面临的东西(技术、产品)又不一样,everything is new。作为创业者,企业的成长曲线,其实就意味着各位的成长曲线。企业的stable(平稳状态)其实又是缘于这个行业stable,像老黄(黄仁勋)之前卖显卡也是stable了那么多年。
事实上,
搜狐汽车:各位认为科学家创业最关键的要素是什么?
TMGM外汇快讯:
周光:科学家创业的最大优势可能是在学术领域是专家,但企业运营不仅靠科学,还涉及管理和人,得在这方面也是博士。
尽管如此,
现在的企业创业,要求各位既是科学博士,可能还得是管理等方面的博士,这是双核心求。以致科学家创业,我觉得先把与人打交道的这门课学好,否则也挺难。很多科学家创业出疑问,可能就是缘于在这方面上还处于“小学生”阶段。
不妨想一想,
我觉得并不需要两方面都是博士,其中一个是本科学历就够了,但至少有一个是博士吧。双博士太难了。
TMGM外汇用户评价:
搜狐汽车:各位现在至少是与人打交道的本科学士了?
周光:我也不知道有没有,但肯定不是小学、初中。
必须指出的是,
搜狐汽车:各位的性格比较直接,现在变了一些吗?
不可忽视的是,
周光:太耿直了嘛,现在已经在变了,说话、做事情都会有些变化了。也能够忍,能够藏得住话了,能够让子弹飞一会儿。这其实是第一次创业和第二次创业的很大区别,现在做事方法上变化蛮大的。
TMGM外汇认为:
搜狐汽车:对人工智能各位有什么样的价值观?包括技术伦理这方面。
TMGM外汇用户评价:
周光:如果还是基于Rule-base(人为定义的规则)的话,这一方面确实是有非常大的疑问,但是现在也不是Rule-base了,可能在伦理这方面就还好。以前Rule-base的可能会有疑问是:我写了这个规则,怎么就撞到这边这个人?现在都是数据驱动的,在伦理方面好很多了。
搜狐汽车:那比如说Robotaxi失业疑问呀,再包括各位说的AI时代“人少高效”这方面?
周光:那种不归大家考虑。但是我觉得现在人口老龄化很严重,20年后(对人力需求的)情况可能反过来。比如日本,很多80-90岁老人开车,经常出现事故,Robotaxi反而能化解有保障疑问。
据业内人士透露,
搜狐汽车:元戎的基因,用三个词来形容:创新、高效、务实,合适吗?
说出来你可能不信,
周光:合适。