端到端模型正在影响智能驾驶行业。
近日,元戎启行宣布已与NVIDIA达成合作,将于2025年采用NVIDIA的DRIVE Thor芯片适配公司的端到端智能驾驶模型。
据元戎启行CEO周光介绍,目前元戎启行已经率先把端到端模型应用于量产车上,该批量产车将于今年量产落地。
这也意味着,元戎启行将是业内首批能用 DRIVE Thor芯片适配端到端模型的企业,也是国内首家能将端到端模型成功上车的人工智能企业。
当前智驾系统采用的是模块化模型,把感知、预测、规划分为三个独立的模型,每个模型的技术栈差异性较大,处于下游的规划模型需要依赖工程师编写大量代码去制定行驶规则。在这种分裂的模块化架构下,信息的传递会出现减损,系统程序复杂,维护难度大,无法从容应对复杂的路况。
这类基于规则的传统模型,需要基于对无数驾驶场景的观察、归纳、提炼。但有个非常现实的问题在于,实际的道路状况千变万化,场景是不能够穷举的。依靠人工规则对数据的总结提炼,不仅效率低而且泛化性差,这就导致了最后1%的长尾场景问题始终无法解决。
相比之下,端到端模型在智驾方案中具有明显优势。它将感知、预测和规划整合到单一模型中,简化了方案结构,提高了计算效率。模型由神经网络构建,以数据和算力为主导,显著提升了模型的训练效率和性能上限。相比传统模型依赖规则驱动,端到端模型更容易实现规模化,实现性能突破。
而端到端模型将感知、预测、规划三个模型一体化。可以理解为原本三个独立模块直接通过脑机接口直连,看到不同的路况都能做出相应的驾驶反应,“所见即所得”。
并且端到端模型的核心在于需用海量数据去训练系统,锻炼的是系统的主学习、思考和分析的能力,以及类人的变通能力。
因此,基于端到端模型训练的智驾系统会变得更“灵活聪明”拟人化,也就是目前行业中所期待的真正“好”用。
例如,在停车的状态下,“看到”后车打转向灯,主动礼让后车右转。或者在面对特殊路况,突发情况下,会灵活机动的处理,而非死守“规则”。
再比如,压实线的规则在不同城市的执行方式是不一样的,有一些城市或是一些路段会非常严格,必须严格遵守。但有一些城市的路边会有很多违停车辆,或者道路施工,所以车辆不得不压点实线,借个道才能通过。如果单纯的基于规则,每种场景都需要单独的规则,不然无法变通,这样的智能驾驶系统肯定不好用。
而随着大模型对智驾系统训练迭代,未来智驾系统还将持续”进化”,“它也将成为一位绅士,在雨天,它会顾及路边行人的感受,遇到水坑时减速前行,避免把水溅到行人身上。” 周光表示。
目前行业普遍认为,端到端自动驾驶也将是下阶段最重要的技术方向。头部玩家已经领先部署,车企方面继特斯拉之后,蔚小理也在积极推动端到端自动驾驶方案。
早在2023年8月,元戎启行就运用端到端模型完成了道路测试。在道路测试中,端到端模型表现惊艳,能够赋予智能驾驶汽车“人类智慧”。例如,该车会顾虑后车需求,在停车的状态下,“看到”后车打转向灯,主动礼让后车右转。在路况复杂的城中村狭窄路段,搭载端到端模型的车辆行驶流畅,无顿挫感。
如果遇到前方有多辆车违停,该车不会呆板地停在前车后方等待前车行驶,而是能够判断前车的行驶意图,绕开前车行驶。此外,在视线受阻的路况下,搭载端到端模型的车辆也能根据以往的训练经验,快速“脑补”完整的行车场景,做到“脑”中有路,“心”中有数。
而在硬件端,DRIVE Thor这类高性能芯片,算力高达1000TOPS满足端到端模型的需求,而作为首批能将端到端模型部署到DRIV Thor芯片公司,元戎启行也领先一步抢占了先机。本次元戎与NVIDIA达成合作,将能进一步促进其将端到端模型的快速迭代。
不过,当前端到端模型的应用依旧存在较大挑战。例如需要依赖大量真实驾驶场景的高质量数据用于模型训等等。据介绍,元戎启行的数据来源于合作车企。通过车企收集的数据都是真实的脱敏行车数据,而且涵盖的场景全面,已经足够其训练模型。
未来伴随端到端模型的上车,也意味着未来自动驾驶竞争的底层逻辑将发生改变。
在当前各大车企/智驾tier 1抢跑高阶智驾赛道的关键时期,以城市NOA功能已经在车企/Tier 1阵营中画出来一道分水岭。未来两年,端到端模型还处于快速的进化过程中,算法迭代速度可能也会决定其竞争力的高低,而伴随着端到端模型的落地,各家的差距还会快速放大。
继续阅读
阅读原文