Momenta 陈凯：Momenta 自动驾驶背后的底层技术及人才需求 | 职播间第 4 期（附 Momenta 招聘解读）

link管理

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

Momenta 团队介绍：打造自动驾驶大脑

Momenta 的公司定位是打造自动驾驶大脑，简单来说，大脑就是跑在无人驾驶系统中的软件。下图是公司的核心团队：

Momenta 陈凯：Momenta 自动驾驶背后的底层技术及人才需求 | 职播间第 4 期（附 Momenta 招聘解读）

CEO 曹旭东，清华大学毕业，在人工智能行业积攒了近 10 年的研发和管理经验。他曾在 CVPR/ICCV/ECCV 等计算机视觉顶级会议发表论文数十篇，并曾在美国 National Data Science Bowl 比赛拿下全球亚军。在创办 Momenta 之前，曹旭东曾任商汤科技执行研发总监，率领百人研发团队，具有丰富的管理经验及产品落地经验。在加入商汤科技之前，曹旭东任职微软亚研研究员，其研发技术广泛用于 Xbox、Bing、How-old 等知名产品，其中现象级产品 How-Old 有着数亿用户。

研发总监任少卿，中国科技大学和微软亚洲研究院联合培养博士。任少卿先生是当前最流行的物体检测框架 Faster-RCNN 的第一作者、当前最有影响力的深度学习网络结构 ResNet 的第三作者，同时也曾获得 ImageNet 2015 物体检测、图像分类、物体定位冠军，MS COCO 2015 多项比赛冠军，及 CVPR 2016 最佳论文等众多荣誉。

研发总监夏炎，中国科技大学和微软亚洲研究院联合培养博士，深度学习和大数据领域专家。在 Bing 等知名产品中，都有应用夏博士的研发成果。

研发总监孙刚，中国科学院计算机视觉博士，高性能并行计算系统专家，大规模图像识别专家。孙刚先生曾获 ImageNet 2016 场景分类亚军、ImageNet 2017 图像分类冠军，并曾参与设计世界上首个针对深度学习的 GPU 训练集群。

此外，Momenta 的团队成员主要来源于 MIT、CMU、清华大学、北京大学、中国科学技术大学等国内外高校及研究机构，以及 Google、Amazon、Facebook、微软亚洲研究院、腾讯等知名高科技公司，拥有深厚的技术积累、极强的技术原创力和丰富的行业经验。

Momenta 是一家拥有世界级研发能力的公司。下面是深度学习领域中比较有名的三项成果，都出自于 Momenta 的核心团队成员。

Momenta 陈凯：Momenta 自动驾驶背后的底层技术及人才需求 | 职播间第 4 期（附 Momenta 招聘解读）

第一个是 SENet，它是业界性能最好的深度学习网络单元，Momenta 也凭借 SENet 获得 2017 年 ImageNet 图像分类世界冠军。

第二个是 Faster R-CNN，任少卿是其作者，它是引用频率最高的物体检测框架，Momenta 在此基础上做了很多改进。

第三个是 ResNet，它是当前最有影响力的深度学习网络结构，这篇论文也获得了 2016 年 CVPR 的 Best Paper。

这 3 项研究成果相关的论文引用数已经超过 17000 次；同时，团队还拿下 ImageNet 2015 物体检测、图像分类、物体定位冠军，MS COCO Challenge 2015 冠军，ImageNet 2017 图像分类冠军等一系列国际顶级赛事的奖项。

Momenta 的定位是打造自动驾驶大脑，始终专注于在人工智能方面的软件和算法的实现上。

Momenta 的技术包括三大模块：

基于深度学习的环境感知。 它主要解决的问题就是，无人驾驶车辆可以感知它身边的一些物体，包括静态的路面、路牌以及动态的车辆、行人、自行车等等。

Momenta 陈凯：Momenta 自动驾驶背后的底层技术及人才需求 | 职播间第 4 期（附 Momenta 招聘解读）

高精度地图。 不同于人类司机，无人驾驶汽车在道路上运行时非常依赖于高精度地图，这样它才能知道其正处于什么样的位置、要到达的位置与当前位置有什么样的关系，并根据定位和信息去做较为精准的导航，最终自动前往目的地。

Momenta 陈凯：Momenta 自动驾驶背后的底层技术及人才需求 | 职播间第 4 期（附 Momenta 招聘解读）

驾驶决策算法。 驾驶决策由数据推动，类似于建立一个拥有 1000 亿公里驾驶经验的智能司机。通过众包路测，Momenta 获得了高精度语义地图中海量的驾驶轨迹。通过对海量驾驶轨迹的学习，Momenta 的算法可以根据当前环境感知和高精度地图信息，做出驾驶决策规划。

Momenta 陈凯：Momenta 自动驾驶背后的底层技术及人才需求 | 职播间第 4 期（附 Momenta 招聘解读）

基于这些技术，Momenta 开发了不同级别的自动驾驶方案，而底层技术之前是有很强的通用性的，后面我再具体介绍。

底层平台实现大数据与 AI 算法的反馈闭环

接下来介绍一下如何运用大数据和大计算平台实现大数据与 AI 算法的反馈闭环。

1. 大计算平台，它是支撑 Momenta 去训练得到一个比较好的模型所需要的基础能力，主要是针对深度学习的 GPU 训练系统。在创立以来的两年多时间里，团队不断优化训练平台，在 2018 年上半年，Momenta 的自有平台已有数千块的 GPU，这个数量在创业公司以及大公司内部都是一个非常大的规模。不过仅拥有这么多数量的 GPU 是远远不够的，团队也设计了一种分布式深度学习训练系统 ROCS，它针对深度学习做了很多优化，包括跨服务器间高速信息传输、优秀的存储优化，其基于该系统和 SENet，助力了加速产品迭代过程。这一训练系统的几大特点是：稳定、高效、软硬件协同优化、易用。

2. 大数据平台，指的是百亿公里数据采集能力。Momenta 利用众包的思路积累驾驶相关的数据。不同车辆所面临的路况、天气和光照情况在不同的城市千差万别，积累下来的数据能更好地助力感知算法的研发。数据来源于产品，通过多渠道收集来的数据，能让技术得到更好的迭代，有助于提升产品的质量和性能，最后形成良性的闭环。

拿到这么多数据后，并不能直接接到大数据平台，中间会有一些步骤：

第一步是数据采集，通过产品采集数据；

第二步是数据筛选，数据回收后，其中有一些数据是没用的，所以需要将一些没用的、模糊的数据挑选出来去掉；

第三步是对有效数据的数据标注，数据系统实际已经使用了 Momenta 精准的算法去进行检测，而这些算法能大大提高标注效率，不需要从 0 开始进行标注；

第四步，数据接入到 Momenta 的大数据平台上，进行模型训练。

训练过程其实是非常需要消耗存储和计算资源的，因此内部也有一套在线远程众包数据标注系统，能利用训练结果模型帮助数据筛选，并用算法辅助数据半自动化标注。加入 Momenta 的同学也有机会接触到这些项目，自己的一些想法也有机会去实践并验证。

另外值得一提的是深度学习算法模型，Momenta 能将性能好的模型更好地集成到产品中。在模型精度几乎不受损的情况下，让模型计算速度提升 10-100 倍，同时将模型尺寸压缩 100 倍，让模型在时间和空间上都有两个数量级的提升，并让训练出来的模型更好地放入车载嵌入式平台等低计算、低功耗的平台上，从而更易于产品化。

此外，公司内部还有仿真平台，用到了非常专业的物理仿真引擎，可对车辆动力进行真实仿真，也可以对在道路上添加动态和静态障碍物进行仿真，能帮助高级别无人驾驶进行在线测试。

Momenta 核心技术的实现

具体介绍一下 Momenta 的环境感知能力，它对不同类型障碍物进行检测和识别。

道路上最常见的障碍物就是车辆，Momenta 现在可以识别多种车型，而且检测的不仅仅是外边框，还能通过一些方法去还原出车辆本身接近 3D 的姿态、轮胎位置等，有了这些信息，就能对障碍物的相对速度、离相机的位置进行一个比较好的估计，从而更好地判断车与周围其他车辆的相对关系。

除了车辆，人也是道路上非常常见的障碍物。环境感知能对人体的 17 个关节点进行追踪检测，识别每个路人的姿态和动作，例如识别人是在骑车还是走路，人如果走路的话，就要检测其是否走到车道等与车辆行驶相关的位置上了；人如果在骑车的话，就会检测其速度和 3D 姿态。

除了这些动态障碍物，静态障碍物对于车辆也非常重要，包括车道线、路口引导线、交通标识牌、红绿灯等。例如一些竖着的路灯杆，由于遮挡可能只被识别出一部分，但是环境感知算法会估计出它们的长度，并利用一些先验信息确定路灯杆的 3D 位置。另外，车道线也是非常有帮助的语义信息，在这些信息基础上，再加上交通牌等信息，它可以构建基于视觉的语义地图。

Momenta 也针对中国场景，对感知算法进行了优化，对有国内特色的车辆采集了一些数据，并对这些数据进行针对性的训练，以更好适应路况、道路上不同类型的障碍物等。

基于车道线、标识牌等信息，Momenta 可以构建一个高精度语义地图。为什么要构建一个高精度语义地图？相对于传统的地图而言，Momenta 高精度语义地图具有如下优势：

第一个是支持更快的更新。对于同类型道路，车辆只需要使用众包设备上的相机进行道路采集，就可以更新当前所面临的情况。另外，如果因为道路维修以及发生了一些变化情况，车辆也能通过摄像头采集相关信息，对其进行很好的维护；

第二个是高度压缩。高精度语义地图的空间存储占用非常小，此外，还具有更好的鲁棒性。一些比较底层的特征，势必由于受到光线、观测角度等因素，对 2D 特征的提取产生不利影响，而高精度语义地图就能减少这些因素的影响；

第三个是建图精度和定位精度，高精度语义地图从不同视角、不同时间、多摄像头采集到数据，能最大化地保证地图的精度，天时能实现定位精度误差小于 10 cm。

实现 L4 级别的自动驾驶需要怎样的技术与人才

目前 Momenta 累计完成融资超过 2 亿美金，估值超过 10 亿美金。Momenta 的技术领先性及产品落地能力除了为资本市场广泛认可外，也深受行业合作方的认可。

接下来针对想加入的小伙伴，介绍一下 Momenta 的成长空间。

Momenta 是一家非常开放、具有分享精神的公司，大家加入公司后都有机会参加国际顶级会议，聆听行业专家的分享。另外 Momenta 的培养机制也非常健全，包括：

Momenta 陈凯：Momenta 自动驾驶背后的底层技术及人才需求 | 职播间第 4 期（附 Momenta 招聘解读）

以下是 Momenta 的热招岗位，感兴趣的话可以直接扫描右下方二维码投递简历。

Momenta 陈凯：Momenta 自动驾驶背后的底层技术及人才需求 | 职播间第 4 期（附 Momenta 招聘解读）

首先，Momenta 非常通用的岗位就是无人驾驶软件开发工程师（C++）。不同于一般的软件开发，无人驾驶系统方向的算法和软件开发对数据结构、算法优化能力的要求非常高，需求量非常大但是要求也非常高。不过这个岗位有很多机会接触到系统架构、算法优化的实践，而在这些项目中，大家都需要去跟同事进行深入的沟通和交流，才能将相关工作做得非常出色。

Momenta 陈凯：Momenta 自动驾驶背后的底层技术及人才需求 | 职播间第 4 期（附 Momenta 招聘解读）

Planning 算法工程师也是需求量比较大的岗位，负责无人驾驶汽车的行为预测、路径的决策与规划，因此需要用到自动化和规划学习的一些方法。不同的优化和算法都有各自的优势和局限性，因此，这个岗位需要很好地去运用策略，使得驾驶系统对不同场景能进行更好地处理。

Momenta 陈凯：Momenta 自动驾驶背后的底层技术及人才需求 | 职播间第 4 期（附 Momenta 招聘解读）

传感器融合与环境建模算法工程师，需要利用感知来构建精确的车辆周围动态和环境信息。该岗位需要对多相机、毫米波雷达、超声和激光物体检测的数据进行融合，以提高静态、动态障碍物位置、速度的估计精度，从而构建环境感知模型。

Momenta 陈凯：Momenta 自动驾驶背后的底层技术及人才需求 | 职播间第 4 期（附 Momenta 招聘解读）

无人驾驶仿真系统工程师，这个岗位除了仿真器相关工作，还有很多数据方面的工作，另外还需要使无人驾驶系统在仿真器上更好地还原所看到的情景，对强化学习和机器学习方面的能力都有一些要求。这个岗位会与仿真开发的同事进行协作，一起去实现更真实的仿真系统开发。

Momenta 陈凯：Momenta 自动驾驶背后的底层技术及人才需求 | 职播间第 4 期（附 Momenta 招聘解读）

除了研发相关的岗位，Momenta 还有一些测试岗位——无人驾驶测试工程师，我希望任职这一岗位的人有相应的背景知识，从而更好地了解无人驾驶产品怎样更好地进行系统层面的测试，分析不同的测试结构，并定位模块，更好地推动开发团队去改善相关问题。

欢迎大家加入 Momenta，一同在最好的时间，跟一群对的人，做一件对的事。

以上就是本期嘉宾的全部分享内容。更多公开课视频请到雷锋网AI研习社社区（ https://club.leiphone.com/ ）观看。关注微信公众号：AI 研习社（okweiwu），可获取最新公开课直播时间预告。