加入高工智能汽车行业群(自动驾驶5群,车联网智能座舱3群,智能商用车群),加微信:17157613659,并出示名片,仅限汽车零部件及OEM厂商。

“Waymo Open Dataset是有史以来为研究发布的最大、最丰富和最多样化的自动驾驶数据集之一。
Waymo终于开放了。这对于一家一直以来将大部分数据保密的自动驾驶领头羊来说,是一个罕见的举动。
Waymo近日宣布,现在可访问官方网站获得用于研究目的的自动驾驶开放数据库,但不能用于商业用途,该公司对“研究”的定义相当宽泛,包括其他公司和学术界的研究人员。
Waymo首席科学家兼研究负责人德拉戈·安圭洛夫(Drago Anguelov)表示,该数据集是“为研究发布的最大、最丰富、最多样化的自动驾驶数据集之一”。
安圭洛夫去年加入Waymo之前,曾在Zoox和谷歌工作。他之所以开始推动提供这些数据,是因为Waymo和其他几家在该领域工作的公司“目前因缺乏合适的数据集而受阻”。
这将帮助这个领域的每一个人,这绝不是承认我们在解决这些问题上有任何问题。但是,在效率、可扩展性和标签数量方面总是有改进的空间。
这是一个正在发展的领域。大多数情况下,我们是想让别人思考我们的问题,和我们一起工作,而不是做那些在当前情况下可能没有多大影响力的工作。
Waymo推出数据集,试图为他们的研究同行填补其中的一些空白,它提供了自己的无人驾驶汽车在道路上行驶的1000段数据,每段数据连续行驶20秒(含200,000帧图像),并覆盖不同的场景路况,包括晚上、下雨、黄昏等等。
数据采集来自Waymo车身上的5台自主研发的激光雷达(包括1个车顶的中距离lidar和4个环视短距离lidar)、5个面向前方和两侧的标准相机,以及激光雷达和成像的融合数据。
数据标注包括车辆、行人、骑行人和指示牌在内的物体,第一批开放的有1200万个3D标签和120万个2D标签。
Waymo是在今年早些时候的CVPR大会上宣布开放数据集的,当时安圭洛夫表示,像KITTI这样的传统开源数据集太小了,这迫使研究人员和工程师在数据扩充和防止过度匹配上花费太多时间。此外,在KITTI上的算法结果不能推广到大型数据集。
按照计划,整个Waymo的开放数据集包含约3000个驾驶场景,总共16.7小时的视频数据,60万帧,约2500万个3D边界框和2200万个2D边界框。
和此前大多数数据集的差别还在于,Waymo在摄像头和激光雷达的同步融合方面做得更好,这为多传感器融合研究提供更多实践经验。此外,还改进了数据多样性,考虑了天气、行人、照明条件、自行车和建筑等变量。
不过考虑到Waymo一直以来的封闭开发模式,有些人可能会怀疑这种数据的使用方式到底有多“开放”。
对此,Waymo产品负责人维贾赛•帕特奈克(Vijaysai Patnaik)解释说,“研究”使用实际上涵盖了很多领域。数据集有一个特定的许可协议,并大致划定了他们期望谁会使用数据,以及使用数据的目的是什么。
这可能包括对这一领域感兴趣的大学院校、独立的研究机构或实验室。Patnaik表示,前提是遵守我们的许可协议。可以看得出,Waymo在开放数据集上还是保持了一贯的谨慎态度。
其他从事自动驾驶的公司也采取了类似的开源数据集做法,比如Lyft、Aptiv、福特汽车旗下的Argo AI等。
去年,百度和加州大学伯克利分校分别发布了大规模的自动驾驶数据集Apollo Scape和BDD100K。前者是是KITTI 和CityScapes数据集规模的10倍,而后者则包含超过100,000个以30帧/秒的速度运行40秒的视频。
当然,上述公布的各个数据集都有一些差别。比如Aptiv的NuScenes数据集来自于三大传感器(摄像头、毫米波、激光雷达),Argo AI则提供了高精地图数据。
然而,在实际行驶时间和行驶里程方面,Waymo确实领先于该领域的其他竞争对手,很多人(包括竞争对手)也很想看看他们做的怎么样。
不过,Waymo强调,开放数据集是为了帮助研究人员在2D和3D感知方面取得进展,以及在领域适应、场景理解和行为预测等领域取得进展。
该公司在一份声明中表示:“我们希望研究团队能利用我们的数据产生更令人兴奋的方向,这不仅有助于提高自动驾驶汽车的能力,还会影响其他相关领域和应用,比如计算机视觉和机器人。”
“我们将着眼于进一步扩大基于社区反馈的数据集。”安圭洛夫表示,尽管共享数据可能暴露Waymo技术中的问题,但自动驾驶开发需要正确的方向来“提出正确的问题”。
目前,Waymo的自动驾驶测试车队已经在25个城市的公共道路上行驶了1000万英里,而在过去10年收集的数据中,此次公开的只是很小一部分。

继续阅读
阅读原文