加入高工智能汽车行业群(自动驾驶5群,车联网智能座舱3群,智能商用车群),加微信:17157613659,并出示名片,仅限汽车零部件及OEM厂商。

实时处理,一直是自动驾驶系统从感知、决策到控制的终极目标。
汽车工程学总是在权衡利弊,但自动驾驶汽车正将这一点推向极限。大量的感知数据、持续的通行连接(车内以太网、车外5G)、复杂极端的环境、极高的性能要求,当然还要保持在合理的成本范围内。
世界著名的科学研究所——欧洲核子研究组织(Cern)正致力于开发“快速机器学习”,用于自动驾驶。
在周四的一份声明中,沃尔沃和瑞典Veoneer公司的合资企业Zenuity宣布,正在与欧洲核子研究中心合作,加快自动驾驶汽车的决策速度,从而提高自动驾驶安全级别。
Zenuity表示,不断增加的车载传感器产生的大量数据(此前英特尔曾预测一辆自动驾驶汽车每天将产生4TB的数据),使得自动驾驶技术的开发面临“根本性挑战”,从数据传输时延,核心处理时延以及决策时延。
位于瑞士的欧洲核子研究中心以其大型强子对撞机而闻名,这是地球上最大、最强大的粒子加速器。科学家蒂姆·伯纳斯·李(Tim Berners-Lee)在欧洲核子研究中心工作时发明了万维网。
欧洲核子研究中心的工作产生了大量的数据,这需要惊人的快速决策。为此,该中心使用了FPGA,它能够“在微秒内执行复杂的决策算法”。
Zenuity表示,它与欧洲核子研究中心的合作将着眼于使用FPGA进行快速机器学习应用,并有助于消除自动驾驶安全方面的担忧。
目前,FPGA除了用于边缘计算,还大量开始用于高性能数据中心。
例如,微软Azure在其所有数据中心中都使用FPGA进行加密和压缩,Zenuity希望将FPGA作为更好地处理大数据的选择之一,同时降低内存消耗和深度学习算法的运行时间。
那么,微秒意味着什么?
1微秒等于百万分之一秒(10的负6次方秒),1毫秒等于千分之一秒(10的负3次方秒)。
比如,未来5G网络能够在提供99.999%稳定性的同时做到小于1毫秒的通讯时延。而传统的车端决策也大多只能达到数十毫秒的级别。
在60公里/小时(约40英里/小时)的速度下,10毫秒规划和100毫秒规划之间的差异大约是一米半,这很容易成功地避开行人。而按照一般决策系统处理的速度有22%几率会撞到行人。
此前,某研究机构基于FPGA开发出了一种可快速进行机器人运动规划的定制处理器,速度提升了三个数量级,而使用的电量仅为之前的二十分之一。
该方案通过利用网格规划器,在不到1毫秒的时间内执行障碍物检测和最低成本路径计算。由于FPGA可以在硬件中编码数据,硬件并行性的方式使得运动规划步骤非常快。
ADAS及自动驾驶正在经历一个蜕变,驱动复杂的计算和传感能力的要求。汽车系统设计工程师需要设计正确的计算架构。
在不考虑其他因素的情况下,FPGA的确提供了一个独特的优势,比如性能和效率、实时处理以及安全性。
以英特尔为例,考虑到更高等级自动驾驶需要采用分辨率、像素深度和帧率更高的图像传感器,将需要多个通信接口和高数据带宽。
Intel®FPGA为此提供了理想的解决方案,满足这些系统灵活的IO和高数据速率的要求。通过聚合来自多个传感器的数据(具有不同类型的接口、数据速率等等),并将它们转换成统一的格式(例如MIPI CSI-2)。
此外,FPGA可以为系统管理安全的数据处理策略,可以对其进行重新配置以适应不断变化的需求。这包括安全引导、安全密钥存储、加密加速、安全锁、惟一的设备ID、安全调试和物理篡改检测和保护。
一直以来,关于FPGA、ASIC的争论不断。
FPGA的优点是它们运行在非常低的功耗下,并且允许设计人员更改底层硬件来支持正在运行的软件算法。但是也有一个巨大的缺点,那就是需要一个经验丰富的工程师来设计更改。
英伟达CEO黄仁勋一直不看好,“FPGA不是正确答案,实际上是用于原型设计的。如果你想让自动驾驶汽车变得完美,我会给自己建一个ASIC。”
ASIC被设计用来执行固定的操作并优化效率,这就像直接在硬件中实现软件算法一样。尤其是,如果ASIC能够大规模部署,综合成本会远低于FPGA。
以谷歌TPU为例,很好地利用了高度并行性来处理神经网络的工作负载。而今年来,不少AI芯片公司也都把目标瞄准ADAS及自动驾驶市场,推出了基于深度学习的专用芯片。
不过,对于关键任务应用程序需要低延迟,而FPGA支持细粒度、位级操作,因此非常适合,此外还提供了可定制的I/O,允许它们与这类应用程序集成。
在响应时间非常关键的自动驾驶中,FPGA的上述优点就是允许为专用功能定制逻辑。这意味着FPGA逻辑成为自定义电路,但高度可重构,产生非常低的计算时间和延迟。
另一个关键因素可能是功耗——对于量产来说,每瓦特性能的成本可能是需要考虑的。由于FPGA中的逻辑是为特定的应用程序/工作负载定制的,因此逻辑在执行该应用程序时可以有效降低功耗或提高了每瓦的性能。
相比之下,其他处理器架构可能需要执行1000条指令才能执行FPGA可能在几个周期内就能实现的功能。这也可以理解为什么Zenuity要寻找科研机构来提升自动驾驶的决策速度。
在整个计算架构中,Veoneer的“宙斯”超级计算机基于运行英伟达DRIVE操作系统的英伟达DRIVE AGX Xavier 计算平台,来满足配备Zenuity公司自动驾驶软件堆栈的4级自动驾驶要求。
而英伟达推出的深度学习加速器(NVDLA)则是一个自由开放的架构,通过其模块化架构,NVDLA是可扩展、高度可配置。经过验证的硬件架构是基于Xavier自动驾驶处理器,并支持完整的验证套件。
在去年一季度,英伟达推出了第三个版本的NVDLA可扩展解决方案,并增加了对FPGA的支持,以支持高可靠性所需的严格测试。
这样的类似案例出现在了奥迪首款L3的Zfas域控制架构上,四颗处理器,分别是英伟达k1、英飞凌Aurix、Mobileye EyeQ3和英特尔的Altera FPGA提供传感器融合。
在zFAS中,Altera的FPGA提供了传感器融合的性能关键功能,将来自车辆内多个传感器的数据结合起来,实现高度可靠的目标检测,并使用以太网传输车辆内的高带宽数据。
同时,TTTech的TTEthernet®IP,软件集成和安全平台集成在FPGA中,为系统提供高效、可伸缩和高性能的解决方案。
延迟极低,功能更强大,比其他解决方案更容易扩展,或许会成为未来自动驾驶计算架构中的需要重点考量的因素。

继续阅读
阅读原文