众所周知,特斯拉智驾的特点是纯视觉算法,这个方案虽然上限很高,但下限也很低,关键就看算法的能力,而因为端到端架构,你要迭代算法,靠的就只有没日没夜的训练。 要知道,过去给智驾做训练的 GPU ,并不是为深度学习训练而设计的,而这个 Dojo 通过分布式 2D 架构,解决了高带宽和低延迟的问题,并且通过存算一体的设计,让训练的能效也更高。 这么一来,相比市场上主流的英伟达 A100 , Dojo 在相同成本下的性能可以达到它的 4 倍。这对特斯拉来说,不仅能更好的训练智驾,还能打破英伟达在芯片上的垄断,让特斯拉成为真正的人工智能公司。 而在这背后的销量数据就更是雪崩, 7 月份,特斯拉全球齐跌,在英国同比暴跌 60% ,德国则下滑 55.1% ,甚至在基本盘的中国也达不到过去的热度。 但是吧,特斯拉还远远没到山穷水尽的地步。前几天,它还花了 43 亿美元买 LG 的磷酸铁锂电池,甚至还用 165 亿美元定了三星的芯片单子。 没错,目前特斯拉确实是有两条芯片研发路线。一条是它的 HW 系列(Hardware,真不是华为),用在特斯拉的汽车上,另一条就是这个 Dojo ,是用在智驾训练上。 过去这是完全不同的两条平行线,但这次的 AI6(HW 6.0)明显有点超预期了,显著提升了算力和带宽,不仅能做 FSD 的终端芯片,也可以用于智驾训练,Dojo 存在的必要性就被打上了问号。 但问题是,当时的 Mobileye 只是一个黑盒,不允许特斯拉参与修改算法,也不能共享数据,甚至功能也偏向保守,和特斯拉的理念实在合不来。 之后的 HW4.0、HW5.0 ,也就是现在说的 AI4、AI5,其实也都是特斯拉做的框架设计、神经网络优化和系统集成,只是利用了三星和台积电的工艺进行生产。 于是在 2019 年,马斯克在特斯拉自动驾驶日上,提出用 Dojo 来训练自动驾驶。随后,在 2021 年的 AI DAY 上,特斯拉就实现了 Dojo 超算的核心——7nm 的 D1 芯片(还是这个老哥)。 一块 D1 芯片,其实是由 354 个核心(CPU)组成,而 25 个 D1 芯片,则组成一个瓦片,6 个瓦片就是一个模组,2 个模组是 1 个机柜, 10 个机柜是 1 个 ExaPOD 训练集群,最终算力能达到 1.1 EFLOP 。 说白了,Dojo 2 还远不够成熟,想要打败英伟达,还有很多的细节需要打磨。但时间不等人,如今的 AI6 彻底击穿了 Dojo 的未来,难道还要指望 Dojo 3 ? 虽然特斯拉给了三星 165 亿美元的巨款,但三星依然是赔钱在给特斯拉供货,所以这块饼究竟能做成生么样,现在咱们也只能看看罢了。


