毫末智行AI Day解读,长城敢说自动驾驶第一名?

行业 (20) 3周前

关注并标星 电动星球News

每天打卡阅读

更深刻理解汽车产业变革

————————

出品:电动星球 News

作者:毓肥

今天下午,长城汽车旗下自动驾驶公司毫末智行,举办了他们第 6 届 AI Day——也是今年毫末智行信息量最大、定调最激进的一次发布会。

有多激进?毫末 CEO 顾维灏直接在发布会上说 「目前已经是中国量产自动驾驶公司的第一名」 ;董事长张凯说 「稳稳占据中国量产自动驾驶第一名」

我们可以对比一下,4 个月前的第五届 AI Day,毫末的表态还是「夯实中国量产辅助驾驶第一名」,4 个月后,毫末的语气起码往上迈了一个大台阶。

从 2019 年 11 月 29 日毫末智行成立算起,今天也才 1020 天,不到三年。

作为长城系车型的智能驾驶支柱,同时涉猎商用物流的自动驾驶公司,今天一众高管的表态,是否也在强调, 毫末以不到三年的时间,已经帮助长城成为自动驾驶的头牌玩家?

带着好奇和疑惑,我们来看看毫末第六次 AI Day,报告了哪些自动驾驶的技术进展,其自动驾驶的量产走到了哪一步,又是怎么理解自动驾驶未来的。

一、MANA 数据闭环

顾维灏认为,自动驾驶最近十年来的技术发展,可以分为三个阶段:

1.0 时代:100 万公里规模,硬件驱动;

2.0 时代:百万-亿公里规模,软件驱动;

3.0 时代:1 亿公里以上规模,数据驱动。

而毫末智行的目标,则是 「冲刺进入自动驾驶3.0时代」 。而想要彻底达成这一目标,顾维灏认为所需的数据量、算力、模型优化等等,都将比 2.0 时代高出几个数量级。

也是在今天的发布会上,张凯宣布毫末智行人工智能数据体系 MANA,已经基本完成了数据闭环。MANA,似乎也成为了毫末智行喊出「中国第一」的底气。

那么,MANA 到底做到了什么?和前面几次亮相相比,它又有什么进化?

1. 更大的模型

Transformer,这是目前深度学习发展最强势的神经网络。而基于 Attention 自注意力机制的 Transformer,又成为了深度学习,以及如今自动驾驶的核心名词。

什么是 Attention 机制?它的本质是模拟人类的注意力(attention),因为我们通过聚焦物体的主要特征,从而高效识别出这是什么,我该怎么做。

换句话说, 简洁、焦点 ,就是 Attention 机制的核心。

Attention 机制可以无限堆叠基本单元,如今最大的 Attention 模型参数已经达到了 万亿级 ,训练效果非常惊人——同时对算力的要求也非常惊人,起码达到了传统 CNN 网络的 100 倍

顾维灏也表示,Attention 机制 Transformer 的应用实践,意味着自动驾驶数据规模要足够大,而且需要更充分地多样性—— 「起码要 1 亿公里」。

毫末智行和业界主流一样沿用了 Attention 机制,而其 MANA 闭环的独特优化,关键则在于数据规模扩大的前提下,不断提高训练效率。

2. 4 万年与 1700 万公里

4 万年,是目前 MANA 数据体系的仿真系统内,已经积累的「虚拟驾龄」,模型累计训练时长则超过了 31 万小时。另外毫末目前累积的真实道路数据,已经超过 1700 万公里。

不断滚雪球的训练数据和模型,需要持续优化的训练效率。其中一个方法,是通过 backbone 统一,直接利用大量无标注数据。

听起来很复杂,其实深度学习里面的 backbone 顾名思义,指的是神经网络的「脊梁骨」,学名主干网络,作用类似于 提取「最大公约数」 ,也就是找到不同数据之间的基本共同特征。

毫末智行的做法,则是将所有感知任务的 backbone 统一,然后利用无标注数据先训练好某个 backbone 并锁定,模型剩余部分再用已标注样本来训练。

顾维灏表示,这样操作可使 训练效率提升 3 倍以上,同时精度有显著提升。

统一 backbone 应对的是更大的模型,另一个挑战是更多的数据。怎么理解?比如积累到第 10 亿公里的时候,前面 100 万公里可能会被「遗忘」,大概相当于被后面的数据「冲掉」了某些特征。

顾维灏指出,最简单的方法是用所有数据再「提纯」一次,但这样「太贵太慢」。

毫末的方法是类似于 「面多加水,水多加面」 :抽取已有的数据,与新数据在同一个模型下输出。最终号称在 同样精度下可以节省 80% 以上的算力,收敛时间也可以提升 6 倍以上

3. 感知全世界

4 月份,我们在北京体验了毫末智行城市 NOH 的长城摩卡试验车。当时毫末对这套城市领航方案的定义是 「重感知、轻地图」 ,也就是高精地图的「浓度」相对更低。

为什么毫末将天平倾向感知?顾维灏的解释是 「高精地图的置信度有问题」。

他表示,城市道路环境的变化频率远高于高速场景——比如修路。「如果把地图看作传感器的话,它的置信度是有些问题的, 不知道什么时候、什么地方,它就会失效。

这样的逻辑下,毫末决定用 Transformer 建立强感知的时空理解能力。比如用综合长时间多帧信息来消除抖动、用时序的 transformer 模型在 BEV 空间上做虚拟实时建图等等。

我们直接来看疗效吧,顾维灏表示,目前毫末已经可以解决部分道路模糊、复杂路口、环岛等问题,而且在感知过程中只需要普通地图信息, 「就像我们自己开车一样」

有关「重感知」路线,一周前我们在采访毫末智行技术副总裁艾锐的时候,得到了这样的回答:

「在纯技术研发的角度,高精地图是好事,可以降低难度。但毫末作为竞争者的角度,一定要有特色路线。另外国内存在各种限制,高精地图不会开放得特别快。」

另外,在重感知赛道上,艾锐表示 没有必要放弃激光雷达

首先,他认为 2022 这个时间点,视觉并没有「碾压」激光雷达。而且激光雷达厂商也不会坐以待毙,CMOS 化、降成本等等都在做。 「如果价格合适,多配一个激光雷达有什么关系呢?」

当然,纯视觉感知走得最坚定的特斯拉,艾锐表示依然 「比我所知道的都领先一大截,属于独一档的,其他人都差不太多」

回到今天发布会,毫末提到的另一个关于感知的进步,在于利用人类世界进行交互。

说得简单点就是识别真实世界中的通用交通行为,比如车灯。目前毫末正在升级感知系统,目的是识别刹车灯、转向灯等信息。

艾锐当时则展开了更多:比如很多车外后视镜都有的黄色警报灯,也在考虑做进感知里面, 「让系统知道对方司机已经发现你了,可以有更多的博弈逻辑」

4. 超算中心

去年 12 月 23 日,毫末 MANA 数据体系正式亮相。当时 MANA 号称是 「中国第一个自动驾驶数据智能体系」 ,毫末同时还宣布了自研超算中心的计划。

今天下午,毫末的超算中心披露了更多信息。

首先是建设目标: 满足千亿参数的大模型、数据规模百万 clips(片段),同时整体训练成本可以降低 200 倍

降低成本,指的其实不是单纯「少花钱」,更关键的是 「少花时间」 ——目前同样一个千亿参数的模型,顾维灏表示需要「上千卡 GPU 训练几个月时间。」

提到训练,最近中美训练芯片禁运事件不得不提。艾锐的回应是「训练其实不一定全得用英伟达方案」。

5. 城市 NOH 的五大功能

最终,MANA 数据体系会在产品上,以高级智能驾驶的形态出现。今天的发布会上,毫末公布了城市 NOH 的 5 个主要领航功能:

智能识别交通灯 :可以识别包括红绿灯、黄闪灯、左右转箭头灯等,但与我们体验的版本不一样,量产版红转绿灯时需要轻点油门,官方表示这是出于「用户磨合」考虑。

智能左右转 :根据人类驾驶经验设定左右转向,转向过程中遇到行人和非机动车时会主动避让,遇到机动车才会触发博弈。

智能变道 :这是城市领航最主要的功能之一。毫末NOH的变道逻辑包括:保障行驶在正确的车道、为了通行效率主动变道、变道时判断后方交通参与者运动情况、会主动用加减速创造变道空间。

智能躲避障碍物(动/静态) :静态的典例是锥桶,躲避的逻辑是「能绕就绕,不能绕就减速」;动态的典例则是前车压线行驶,此时首选是减速,然后再判断是否可以绕行。

以上 5 个(动/静态分成了两个)功能都会在即将发布的正式版城市 NOH 上线。而随后毫末将 OTA 的新功能,是 「智慧交通流处理」 ,基础是加入了识别转向/刹车灯,然后去做相应的决策适配。

最后,顾维灏表示目前毫末的北京、保定、上海、深圳研发中心都在持续招聘。

二、1000 天之后,挑战第一?

前面一段很技术向,可以概括为「毫末在做什么」。

除了技术细节,这届 AI Day 还是毫末「喊话」最大声的一次,态度鲜明、表述高调。用毫末智行董事长张凯的原话概括,这次发布会,毫末在讲「中国自动驾驶的新故事、新标杆」。

一家成军不到三年的公司,说话这么狠?

我们总结了张凯今天的几个关键表态,以及更多核心数据。这里面有很多个「国内第一」,有些甚至号称是「业内第一」。

1.「国内智能驾驶技术落地经验最丰富的公司」

张凯表示,毫末智行用 2 年时间开发了三代智能驾驶系统,落地了 10 余款不同平台的车型。目前可以做到全新车型复用开发 4 个月达到量产状态、全新车型匹配标定 2 个月内完成,号称标定效率「全行业第一」。

另外,毫末目前可以 同时异步并行开发超过 30 个智能驾驶项目 (约等于 30 台车),同样号称「国内唯一」的开发能力。

2.「国内最早且唯一的进入产品快速迭代阶段的自动驾驶公司」

除了我们体验过的,首发 HPilot 3.0 的摩卡激光雷达版,今年搭载毫末智行智能驾驶的上市车型,还包括欧拉闪电/芭蕾/好猫、长城炮等等。

量产乘用车以外,今年毫末还发布了第二代自动驾驶末端物流车「小摩驼 2.0」,这款十万级的物流小车已经开始交付。

3.「中国首个大规模量产的城市 NOH 辅助驾驶系统」

上面这句话定语很长,但早在 4 月份的时候,我们得到的准确表态,是 「毫末智行城市领航的落地速度,会比更依赖高精地图的华为、小鹏等企业更快」

今天发布会上,张凯表示今年 HPilot 3.0 可以落地 10 个城市,明年计划是落地超过 100 个城市。最先落地的城市,会是北京/保定。

三、毫末会是长城的「长城」吗?

我们一直在观察毫末智行。

原因其实有好几个:毫末展示出来的体系化思考、长城「全村的希望」、民企做技术的「豁出去」,等等。

到了 2022 年 9 月,我们看到毫末用3年不到的时间,追上了华为、小鹏等等城市领航的先发者,已经要同台竞技了。

速度可嘉,但最后依然要看疗效。最快下个月,我们就能看到来自长城体系的量产版城市领航了,毫末今天立的 flag、喊的口号,今年真的会兑现吗?

你们怎么看?评论区见。

(完)

发表评论