Scale AI发布免费的激光雷达数据集将支持自动驾驶汽车开发

  • 2020-05-26
  • 26

Scale AI的创立源自于市场对高质量数据的需求,该公司使用软件和人员来处理和标记图像,激光雷达和地图数据,以建立机器学习算法的公司。自成立以来,Scale 靠为科技公司的自动驾驶业务服务打造出了名声,它们使用Scale提供的数据标记来训练机器学习模型来开发和部署自动驾驶汽车,从而降低系统的风险。

目前,Airbnb,Pinterest和OpenAI等公司也使用Scale的平台,但从事自动驾驶技术的公司在Scale的客户群中占很大比例。例如Alphabet 的Waymo、通用汽车的Cruise 和Uber 等都是Scale 的主要客户。

在这个特殊时期,COVID-19大流行已经减缓甚至阻止了数据流,而Scale希望免费提供数据并重新打开水龙头。这家公司与激光雷达制造商Hesai合作,于本周启动了一个名为PandaSet的开源数据集,可用于训练自动驾驶的机器学习模型。该数据集是免费的,并已获许可用于学术和商业用途,包括使用Hesai的前向式PandarGT激光雷达(具有类似图像的分辨率)以及其机械旋转激光雷达Pandar64收集的数据。

Scale首席执行官兼联合创始人Alexander Wang表示,机器学习是一种垃圾回收,而公司确实需要高质量的数据来支持这些算法从而建立垃圾回收的框架。Wang表示,这是在复杂的城市环境中使用两种激光雷达实现的,这些环境中充满了汽车,自行车,交通信号灯和行人。而这种激光雷达数据集的目标是免费访问密集且内容丰富的数据集。

去年,Aptiv和Scale发布了nuScenes,这是来自自动驾驶汽车传感器套件的大规模数据集,而本次的免费数据也有部分来自其中。Argo AI发布了策展数据以及高清地图,而Cruise共享了它创建的名为Webviz的数据可视化工具,该工具可以从机器人上所有传感器收集的原始数据转化为可视化图像。

Wang表示,持续高质量的标签数据是构建自动驾驶系统时要克服的最大障碍之一。而Scale希望通过对这些数据的访问民主化,特别是在许多自动驾驶公司无法收集数据的时候。这也是Scale希望通过他们的数据来推动这个行业发展的原因。当然,这并不意味着Scale会完全放弃数据,他们依然会保留帮助公司发展的营利项目。

 

 

作者:Suki