小鹏汽车的秘密武器:为什么要拆掉自动驾驶里的“规则”?
核心思想一句话总结 小鹏汽车正在进行一场大胆的变革,他们不再依赖传统的代码规则来教车怎么开,而是致力于成为一家纯粹的AI公司,通过“做减法”(拆掉激光雷达、拆掉中间的语言处理层),打造一个能通过海量数据自我学习的“超级AI大脑”,让车像人一样凭直觉和经验驾驶。
关键要点
- 从“自动驾驶”到“AI公司”的转型: 小鹏不再只把AI当作一个工具,而是把整个公司变成一家AI企业。这意味着他们不仅造车,还要造像人一样思考的“物理世界的AI”,未来这些技术还能用在机器人上。
- “端到端”大模型是核心: 以前的自动驾驶像是一个流水线,分很多步骤(看路、做决定、控制方向盘)。现在的“端到端”就像人的大脑,眼睛看到路(输入),大脑直接反应手脚怎么动(输出),中间不再需要人为写死的规则。
- 拆掉“语言”这个中间商: 这是一个很大的技术突破。以前的模型喜欢先把看到的画面翻译成文字(语言),再决定怎么开。但小鹏发现这样太慢太笨,所以他们把中间的语言层拆掉了,让AI直接从画面理解到动作,反应更丝滑。
- 数据的力量(Scaling Law): 只要给AI喂足够多、足够好的驾驶数据,它的能力就会像滚雪球一样越来越强,甚至能学会人类没教过它的复杂操作。
- [数据趣实]: 小鹏为了训练这个聪明的AI,投入了巨大的资源,他们收集的真实驾驶数据量正在以每季度 30%到40% 的惊人速度疯狂增长。
金句解析
金句: "> 世界上好的东西都一定是简单的。……当前大家现在犯很多一个错误,就是我为了让这个模型变得好用,其实我在上面去加了很多复杂的东西……但是往往其实解决问题的方式就是让它变得更简单。"
- 意思: 这句话是说,很多时候我们觉得问题难解决,就会往上面堆砌各种复杂的补丁和规则。但真正高明的技术,往往是结构最简单的。
- 为什么重要: 这解释了小鹏为什么敢于“拆东西”。他们相信,只要AI模型足够强大,就不需要那些复杂的传感器(如激光雷达)和人为规则。简单意味着更高效,也意味着更容易大规模推广。
金句: "> 它是像一个毒药一样,就是你会越来越重的去依赖于它。"
- 意思: 这里指的是在自动驾驶模型中过度依赖现成的“语言模型”或“开源模型”。虽然一开始用它们能很快出效果(像走捷径),但时间久了,你会发现离不开它,而且它会成为系统变强、变快的瓶颈。
- 为什么重要: 这展示了小鹏团队的独立思考能力。他们没有盲目跟风使用现成的技术,而是为了追求极致的性能,选择了一条更难但更正确的路——自研并拆除不必要的依赖。
主要论据(为什么要这么做?)
- 首先,语言处理太低效: 作者认为,语言是“离散”的(一个个词蹦出来),而开车是“连续”的动作(方向盘转动是丝滑的)。用语言去指导开车,就像是用打字机指挥跳舞,反应太慢,不符合物理世界的规律。
- 其次,规则有上限: 以前靠写代码规则(比如“红灯停绿灯行”),但路上总有规则写不完的突发情况(比如一只鸟突然飞过)。只有靠AI像人一样学习海量数据,才能产生“涌现”能力,处理从未见过的复杂路况。
- 最后,为了全球通用: 传统的规则往往只适应特定的城市(比如旧金山或广州)。但这个新的AI模型泛化能力很强,因为它学的是驾驶的本质逻辑,所以不仅能在中国开,去到国外或者完全陌生的各种小路也能开得很好。
引发思考的问题
- Q: 小鹏把中间的“语言处理”拆掉了,那车子还能听懂人的指令(比如“带我去机场”)吗?
- A: 能听懂。文中提到,他们虽然拆掉了中间作为“瓶颈”的语言输出层,但依然保留了语言作为输入。也就是说,车子能理解你的话(Vision + Language 输入),但它内部思考和做动作时,不再需要先把画面翻译成文字给自己听,而是直接行动。
- Q: 既然AI是自己学的,没有规则限制,怎么保证它不乱开、保证安全呢?
- A: 文中承认这是一个挑战。目前的做法是设定“安全下限”,虽然没有了繁琐的驾驶规则,但会有底层的安全机制。同时,通过明年在广州推进L4(全无人驾驶)测试,以及云端安全员(Tele Ops)的远程协助,来逐步验证和保障安全。
- Q: 这种“端到端”的大模型技术,除了造车还能干什么?
- A: 还能造机器人。文中提到,小鹏本质是“物理AI”企业。这套从视觉到动作的AI架构(VLA),不仅能控制车轮,也能控制机器人的手脚。未来,同样的AI大脑既能开车载你回家,也能驱动机器人帮你做家务。
为什么这很重要 & 延伸阅读
- 为什么要关心: 这不仅仅关于汽车,而是关于人工智能如何通过物理世界改变我们的生活。我们正在见证AI从“陪你聊天”(像ChatGPT)进化到“帮你干活”(开车、做家务)。小鹏的尝试告诉我们,未来的机器将不再是冷冰冰的程序,而是拥有直觉、能自我进化的智能伙伴。理解这一点,能帮你更好地适应未来科技驱动的世界。
- 去哪里学更多: 如果你对“端到端自动驾驶”感兴趣,推荐去B站或YouTube搜索 "Tesla FSD v12 演示"。虽然品牌不同,但特斯拉和小鹏目前走的是非常相似的技术路线,你会直观地看到没有任何规则代码的AI是如何像老司机一样丝滑地处理复杂路况的。