一百二十。小鹏新上任的刘先明首次访谈:语言是毒药、拆掉L、简单即美、换帅、小鹏的AI转型

一百二十。小鹏新上任的刘先明首次访谈:语言是毒药、拆掉L、简单即美、换帅、小鹏的AI转型

From 🇨🇳 张小珺Jùn|商业访谈录, published at 2025-11-18 09:06

小鹏汽车的秘密武器:为什么要拆掉自动驾驶里的“规则”?

  1. 核心思想一句话总结 小鹏汽车现在玩了一个超酷的大动作!他们不再用老一套的死板规则去教车怎么开,而是想变成一个纯纯的AI公司。他们玩了个“做减法”的骚操作,把激光雷达都拆了,甚至连中间那个管“翻译”的语言处理层也给拿掉了。这样就能造出一个“超级AI大脑”,它能自己学,吃进去一大堆数据就越来越聪明,最后让车开起来,就像老司机一样,凭感觉和经验走,而不是死板地按规则来。

  2. 关键要点

    • 从“自动驾驶”到“AI公司”的转型: 小鹏不再只是把AI当成一个工具来用,而是要把整个公司变成一个真正的AI公司!这可厉害了,意思就是他们不光要造车,还要造出那种能在现实世界里像人一样思考的“AI大脑”。以后,这些超棒的技术甚至还能用在机器人身上呢!
    • “端到端”大模型是核心: 以前的自动驾驶啊,就像工厂的生产线,得一步一步来:先是“看路”,然后“做决定”,最后“控制方向盘”。现在的“端到端”就厉害了,它就像我们人的大脑一样!眼睛一看到路(这是“输入”),大脑就立刻知道手脚该怎么动(这是“输出”),中间根本不需要人提前写好的那些死板规则了。
    • 拆掉“语言”这个中间商: 这可是一个超大的技术突破!以前那些自动驾驶模型,老是喜欢先把看到的画面在脑子里“翻译”成文字(就是“语言”),然后再决定怎么开车。但小鹏发现,这样又慢又笨!所以他们干脆把中间这个“语言翻译”的环节给拆掉了,让AI直接从画面理解到动作,反应起来就更“丝滑”啦!
    • 数据的力量(Scaling Law): 只要给AI喂进去足够多、足够好的驾驶数据,它的能力就会像滚雪球一样,越来越厉害!甚至能学会人类根本没教过它的各种高难度操作呢。
    • [数据趣实]: 小鹏为了训练这个超级聪明的AI,可是下了血本!他们收集到的真实驾驶数据量,正以每季度 30%到40% 的吓人速度在疯涨!
  3. 金句解析

    • 金句: "> 世界上好的东西都一定是简单的。……当前大家现在犯很多一个错误,就是我为了让这个模型变得好用,其实我在上面去加了很多复杂的东西……但是往往其实解决问题的方式就是让它变得更简单。"

      • 意思: 这句话是想说,很多时候我们觉得一个问题很难搞定,就喜欢往上面堆一大堆复杂的补丁和规则。但其实呢,真正厉害的技术,反而是结构最简单、最直接的。
      • 为什么重要: 这就解释了小鹏为什么敢“拆东西”!他们相信,只要AI模型足够聪明,根本就不需要那些复杂的传感器(比如激光雷达)和人定的死板规则了。简单,就意味着效率更高,也意味着能让更多人轻松用上这项技术。
    • 金句: "> 它是像一个毒药一样,就是你会越来越重的去依赖于它。"

      • 意思: 这里说的“它”,是指在自动驾驶模型里,如果太依赖那些现成的“说话模型”(语言模型)或者别人家已经做好的“开源模型”。虽然一开始用它们能很快看到效果(就像走了个捷径),但时间久了,你就会发现自己被它套牢了,而且它还会变成系统变得更强、更快的一个大障碍。
      • 为什么重要: 这就说明了小鹏团队的思考能力有多独立!他们没有盲目跟风去用现成的技术,而是为了追求最极致的性能,选择了一条更难走但更正确的路——自己研发,并且把那些没必要的依赖都给拆掉了。
  4. 主要论据(为什么要这么做?)

    1. 首先,语言处理太低效: 作者觉得,语言啊,它是“离散”的,就像你说话时,一个词一个词地往外蹦。但开车呢,是个“连续”的动作,方向盘转动是那么丝滑。用语言来指挥开车,就好比用打字机去指挥别人跳舞,反应太慢了,根本不符合现实世界的规律。
    2. 其次,规则有上限: 以前我们靠写一条条代码规则来开车(比如“红灯停,绿灯行”),但是路上总有你写不完的突然冒出来的情况(比如突然飞过一只鸟)。只有靠AI像人一样学习海量数据,才能产生那种神奇的“涌现”能力,处理那些它从没见过的复杂路况。
    3. 最后,为了全球通用: 传统的规则啊,通常只适合特定的城市(比如旧金山或者广州)。但小鹏这个新的AI模型,它的“举一反三”能力超级强!因为它学的是开车的“最核心逻辑”,所以不光能在中国开,就算开到国外,或者完全陌生的小路上,它也能开得溜溜的!
  5. 引发思考的问题

    • Q: 小鹏把中间那个“语言处理”的部分给拆了,那车子还能听懂我们说的话吗(比如“带我去机场”)?
    • A: 能听懂!文章里说了,他们虽然拆掉了中间那个负责“说话”的语言输出层(因为它是个“瓶颈”),但依然保留了语言作为输入。也就是说,车子能理解你说的话(它能“看”也能“听”——视觉+语言输入),但它在自己思考和做动作的时候,不再需要先把看到的画面翻译成文字在脑子里给自己听了,而是直接行动!
    • Q: 既然AI是自己学的,又没有规则限制,那怎么保证它不会乱开、保证安全呢?
    • A: 文章里承认,这确实是个大挑战!他们目前的做法是设定一个“安全下限”,虽然没有了以前一大堆繁琐的驾驶规则,但会有最底层的安全机制来兜底。同时,小鹏计划明年在广州推进L4(也就是全无人驾驶)测试,还会用云端安全员(就像远程的“替补司机”)来远程协助,一步步地验证和保障安全。
    • Q: 这种“端到端”的大模型技术,除了造车还能干什么呢?
    • A: 还能造机器人!文章里说了,小鹏本质上就是一家“物理AI”公司。这套从视觉到动作的AI架构(VLA),不光能控制汽车的方向盘和车轮,也能控制机器人的手和脚。未来啊,同一个AI大脑,既能开车载你回家,也能驱动机器人帮你做家务!是不是很酷?
  6. 为什么这很重要 & 延伸阅读

    • 为什么要关心: 这可不只是关于汽车哦,它讲的是人工智能怎么通过现实世界来改变我们的生活!我们正在亲眼见证AI从“陪你聊天”(就像ChatGPT那样)升级到“能帮你干活”(比如开车、做家务)。小鹏的这个尝试告诉我们,未来的机器不再是冷冰冰的程序,而是那种有直觉、能自己变聪明的智能伙伴。理解了这一点,你就能更好地适应未来这个被科技驱动的世界啦!
    • 去哪里学更多: 如果你对“端到端自动驾驶”超感兴趣,我强烈推荐你去B站或者YouTube上搜搜 "Tesla FSD v12 演示"。虽然是不同牌子的车,但特斯拉和小鹏现在走的技术路线非常像!你会亲眼看到,一个没有任何规则代码的AI,是怎么像老司机一样丝滑地处理各种复杂路况的。

Summaries in other languages: