XC SPORTS

行业动态

杏彩体育汽车设计流程汽车设计汽车模型3d图特斯拉引领自动驾驶大模型时代

2024-04-26 23:38

  杏彩体育FSD 用户推送 FSD Beta V12.3 版本高阶辅助驾驶系统,这一举措标志着自动驾驶技术的重要里程碑。此前,更有消息爆料 FSD 能熟练地将患者送至医院。

  FSD,Full Self-Drive即完全自动驾驶,它基于先进的技术架构,包括 BEV/占用网络+Transformer的端到端神经网络 AI 系统。这一大模型融合了感知、预测和决策规划等多个关键环节,算法由规则驱动转向数据驱动,将人类的驾驶习惯通过训练学习融入神经网络的参数之中,达成类似人类驾驶决策和响应水平,相较于基于规则的模型,具备更强大的泛化能力。规则判断取决于规则数量的多寡与合理性,存在诸多 corner case。

  同时数据驱动使算法得以大幅简化,据说 V12 仅有约 3000 行代码,而 V11 则多达 30 多万行杏彩体育。

  目前特斯拉已在中国设立数据中心,FSD 或将在 2025 年落地中国,加快中国电动汽车智能化进程。

  BEV,全称Birds eye view,即鸟瞰视角。它将三维环境信息投射到二维,以俯视角展现环境和目标物。这种视角提供了全局视野,消除了数据遮挡,大大提高了感知能力。不仅如此,纯视觉方案中也存在 BEV,因为有多个摄像头的支持。

  占用网络,作为 3D 化的 BEV,通过算法进行空间占用的检测。它不需要明确障碍物的具体身份,只需知道其占用了前行空间,就能规划出合适的行驶路径。

  Transformer,也就是当下大家所熟知的主流“大模型”。它具有多头注意力机制,在处理长序列数据和复杂的上下文关系时具有独特优势。它能够挖掘序列中不同元素的联系,实现全局理解,提高感知能力和泛化能力。

  然而,传统的 2D+CNN/RNN模型在处理长序列数据时存在着较大的局限性,感知能力差,参数少、层级少,泛化能力差,无法满足高阶自动驾驶海量数据处理的需求。

  当然,Transformer 大模型计算层级多杏彩体育,参数量大,算力需求也更大。 目前,新势力、BYD及华为、地平线等车企与零部件公司纷纷布局大模型,BEV/占用网络+Transformer 已成为主流。

  算法的迭代将降低对地图甚至激光雷达的依赖,同时算法的开发与训练成本也将上升。端到端的占用网络+transformer 大模型计算量巨大,对芯片的算力提出了更高要求,将推动芯片技术的不断进步。

  个别老牌从业公司硬件配置与算法落后,感知能力低下,基于规则的决策规划造就了众多的 corner case。

  好在目前自动驾驶仍处于 L2+级别,凭借友商“激进”的高阶策略,和自身产品成熟、成本控制相对较好的优势,这些公司仍占有不小的市场份额。然而,留给他们的时间已然不多。