中国最懂自动驾驶量产公司秀毫末智行肌肉

分享到: 微博; QQ; 微信; LinkedIn

这可能是中国进展最迅猛的自动驾驶公司。

刚刚结束的毫末智行Q3品牌日，这家被业内人视作“中国最懂量产自动驾驶”的公司晒出最新成绩单：

增收快，成立不到2年的毫末智行，今年已经实现亿级别营收。

这本身已不可思议。

产品落地方面，今年2季度一口气亮出10款量产产品，硬件软件都有落地，最新产品是和阿里达摩院合作的无人末端配送车“小蛮驴”。

更超出行业经验认知的，是技术迭代迅速。

从今年1月开始，已累计超过100万公里智能驾驶数据，而且不是仿真，是在中国真实道路上的实际里程。

如此惊人的进度，毫末智行到底有什么杀手锏？

毫末高管悉数亮相，罕见分享技术细节，看家法宝“和盘托出”。

100万公里数据到手，问题却没那么简单

先来解答一下，毫末智行的100万公里从哪来。

毫末智行孵化于长城汽车集团，诞生于这个传统汽车巨头的自我忧患中，也肩负着长城智能化转型的核心重任。

今年上市的魏品牌摩卡车型，就是毫末智能驾驶系统的首秀。

100万公里，从今年1月测试开始算起，也包括上市后普通用户贡献的数据，都从这款车上来。

但100万公里数据到手，毫末发现问题却没那么简单。

品牌日现场，出身百度无人车的团队的CEO顾维灏先从问题入手，揭秘毫末成绩单背后的努力和探索。

首先是海量的数据中，对辅助驾驶系统能力提升的关键数据，并不多。

比如，一段城市快速路上的视频图像中，可能有超过60%是没有突发情况发生的平直路段。

这样的数据再多，也不会对系统能力提升有决定性作用。

反倒是出现频率低、目标小的图像数据，才是补上系统短板的关键。

如何挑出这些有价值的数据，是第一个挑战

而在有价值图像中，模型能力的不足，也会导致关键小目标的漏检，降低数据利用率。

另外在模型能力上，也会存在“数据偏见问题”，比如能识别白色乘用车，却识别不了被植物遮挡的白色乘用车。

这两个问题，是在数据收集前期阶段出现的。

拿到处理好的有价值的数据之后，系统还要攻克其他挑战。

其一，是如何快速迭代，更通俗的说，调参之后如何加快新模型训练速度。

其二，是源源不断的数据涌进来，使得模型版本快速迭代，如何在短时间验证这些不同模型，挑战也不小。

自动驾驶公司没数据发愁，像毫末这样从不缺数据和场景的，却面临另一层面的难题。

刚刚在毫末智行第三个品牌日上，CEO顾维灏首次详细揭露的毫末应对之法。

数据、训练双管齐下，“最懂”自动驾驶量产公司如是说

开发过程中的问题找到了，如何解决这些问题就成了毫末智行品牌日的核心重点。

从应对这些挑战的技术方案，也能体会一番为何毫末这家公司，是最懂自动驾驶量产落地的。

“大带小”的数据诊断方法

先说找到有价值的场景数据，毫末把这个过程叫做诊断。

目前诊断的手段有两种。

第一种方法是通过明确的系统失效信号得到诊断结果，例如通过人工接管信号。

也就是说由用户在使用过程中发现系统能力的不足而接管，系统会抓取接管前后一段时间内的数据上传场景库分析学习。

第二种方法则是通过更强大的后方服务端模型去诊断车端模型的错误。

车端模型受制于算力、传输延迟、参数有限，初期能力自然不足有限，一般一个小模型负责一部分感知任务。

所以毫末在实测中发现了对于远距离小目标，之前的系统版本时常会出现漏检情况。

而部署在服务端的大模型叫做Fundamental Model，是一个基于Transformer的全任务感知大模型。

算力要求高，资源占用大，但能力却超强，能发现小模型漏检错检、或在恶劣天气下识别能力下降的错误。

△上为车端模型漏检，下为大模型的纠正

找出问题后，再把结果返回车端模型重新训练学习，这样就能最大程度捕捉有效数据。

“举一反三”解决数据偏见

找到有问题的场景之后，就需要针对这个场景补充足够的样本数据，也就是找到足量的和它同类型的其他相似数据。

以此进行样本调配，才能做出一个更好的AI模型

通过已经上市的长城魏摩卡车型，毫末已经积累了巨量的道路场景数据库。

面对海量场景，毫末的方法是首先以无监督学习方法将图像向量化，把图片数据转化为特征向量，然后通过谱聚类，将相似的图像聚类在一起。

得到聚类结果以后，对于需要的目标场景，就能找到大量和其同一类别的相关数据作为正样本，以及相似易混的其他类别数据作为负样本。

并且在类别当中，只挑选类中心和类边界附近的数据，以此提升标注效率。

这种方式还可以非常有效的将异源数据以合适的方式混用起来，提升最终模型的效果。

数据诊断依靠“大带小”，而“数据偏见”则通过举一反三的方法解决。

并行训练，炼丹时间缩短一半

现在，已经拿到了对于模型能力提升的关键数据，接下来就是“炼丹”了。

Transformer能力强，但是训练速度也慢。

Swin-Transformer网络即使在360GB RAM、4块V100 GPU的服务器上，标准数据并行DDP训练也需要超过100小时。

毫末的工程师如果稍微改一下网络结构、参数配置、或者是更换数据，迭代一次看到结果的周期是近百个小时。

但这些操作又是会频繁发生的，所以这样严重拖慢了技术迭代。

所以为了提升训练速度，除了常见的数据并行之外，还需要更精细的模型并行方法。

首先是数据并行，每块GPU上训练完整的网络，将数据切块以适应GPU。同时每层的梯度还会和其他GPU交互。这样可以进一步提高模型收敛速度，以更少的epoch达到同样的训练效果。

这种数据并行和模型并行的混合方式，叫做流水并行。

针对swin-transformer，就采用了流水并行的方案，整体可以提速50%-80%。

流水线生产测试场景

训练效率有了提升，新的问题随之而来：

模型迭代快、版本多，如何验证其有效性？

主流做法当然是把模型丢到仿真环境中测试，但是传统的仿真是一种非常低效的方式。

从场景设计，到设置道路模型、设置车辆模型、设置交通流模型、到最后进行仿真测试…每人每天只能做30个。

所以毫末开发了语义场景的自动化转化工具和参数泛化工具，可以将CSS中场景库的描述文本自动的转化为仿真测试场景，并且在合适的范围内离散采样得到巨量的仿真测试用例。

同时通过在云端并行，目前每天可以自动生成一万多个仿真测试用例。

简单理解，前面的数据诊断其实是一种数据标注自动化，而云端语义场景自动化转化，就是一种流水线生产测试场景的工具。

天下武功，无坚不摧，唯快不破。

自动驾驶也是如此，毫末智行参得最透。

数据大而多，处理快且准，一切以此为纲，才有了毫末不可思议的量产上车速度。

从技术看毫末智行

毫末智行内部把董事长张凯、CEO顾维灏称作测试狂，每周都要花大量时间亲自测试智能驾驶产品。

品牌日现场，董事长张凯也提到了长城汽车内部更是重视智能化，每周六都要求技术负责人、各公司高管必须参加智能化体验测试。

不光是自家产品，市场上每一款产品都要体验对比，有时魏建军还会亲自参加。

毫末的硬核技术底色尽显。

同时张凯还说，规模上量速度最重要，自动驾驶公司2022年前还找不到规模化落地路径的，无疑是致命的。

那么毫末到底是一家什么样的公司？

进展迅猛和打磨技术，在毫末这里其实一脉相承，丝毫不矛盾。

毫末智行为什么中意Transformer？

上个月的特斯拉AI Day，马斯克首次明确推出DOJO、并分享Transformer和大模型之于自动驾驶作用。

殊不知，类似思路在中国早有毫末智行团队在践行。

Q3品牌日上，我们看到Transformer已经成为了毫末重要的开发工具。

其实在毫末智行第一次公开亮相时，CEO顾维灏就表达了对Transformer的格外关注。

随后在公开场合也不断提及。

顾维灏认为，自动驾驶行业现状是传感器供应商、方案趋同，仅靠硬件堆料拉不开差距。

所以未来的决胜点一定在数据，数据多是前提，数据好是基础。

如果时常关注AI技术前沿的一定有所了解，Transformer最早是进行语言处理任务的，具有避免循环 (recurrent) 的模型结构，完全依赖于注意力机制对输入输出的全局依赖关系进行建模。

也就是说，只需要数据足够大，就能训练一个超大的模型。

近两年，Transformer的对图像识别的准确率、效率、鲁棒性不断刷新各种榜单，一骑绝尘。

这是真·大力出奇迹，因为这种方法要求庞大的数据集，恰好与毫末智行的数据采集、泛化的优势完美match。

为什么自动驾驶在云端决胜负？

谈到毫末智行自研的算力平台ICU 3.0时，顾维灏说现在有观点认为车端算力已经达到几个T，完全够用了。

但毫末却从实践中得出了完全不一样的结论。

单从摄像头来看，今天汽车主流的摄像头还是100万像素的，而即将搭载毫末智能驾驶系统的长城车型，即将开始使用200万像素和800万像素摄像头。

所以为长久计，长城汽车、毫末智行共同联合高通推出了目前全球算力最高的可量产自动驾驶计算平台ICU 3.0（即毫末智行“小魔盒3.0”）。

平台采用8450和9000芯片，算力高，缓存大，推理快，路数多，延迟低，覆盖广，好部署。大缓存这使得芯片可以同时支撑多个高分辨率的视频流进行实时感知推断。

毫末把多任务感知网络部署在高通芯片上，主干网是优化后resnet50，基于这个主干做了一层多特征融合层，视觉摄像头和激光雷达数据分别通过网络提前3D感知结果，在BEV空间里面再融合毫米波雷达以及多帧关联。

这样后续的车道线和障碍物识别等任务就可以基于共同的特征要素进行，大大加快了识别速度。

但即使强如高通，车端算力也不无法永远增加下去。

在未来，车端单个摄像头的数据量可能还会增加100倍，而车端用的摄像头数量也会增加十几倍。

以此来看，车载计算芯片的算力再增加几百倍都是不够。

所以，大数据量带来大计算量，非云端不能解决。

前面讲到的服务（云）端大模型训练车端小模型，核心逻辑就在于此。

整个Q3品牌日，毫末智行所分享的技术细节可以看出，企业核心就是大数据大模型、快速迭代。

具体方法，是打开一个迅速落地上量的场景，然后根据场景特征设计自己的高效数据方案，避免在有限场地内经年累月测试，迟迟不能落地。

有了场景后，毫末智行走的是渐进式的商业化落地路线，智能驾驶从加强人向取代人发展。

毫末的“快”，背后既有毫末董事长张凯代表的长城基因，另一方面还有顾维灏这样中国最早在科技公司展开智能车探索的先驱。

这种行业罕见的强力配置，共同决定了毫末“最懂量产的自动驾驶公司”的底色。

关键字：AI技术自动驾驶云端引用地址：中国最懂自动驾驶量产公司秀毫末智行肌肉

上一篇：清洁安全的汽车将由功能电子化和自动驾驶技术赋能
下一篇：没有激光雷达真值的数据集无法做好智能驾驶

推荐阅读

2018年09月30日 | 汽车电子市场将成为爆发点供应链集体布局

IDC报告数据显示，2018年全球智能手机市场将再次下滑0.2％而来到14.62亿部，中国市场更是会再次大跌7.1％。大环境遇冷，供应链也因此受到波及。订单总量减少导致整个市场份额萎缩，供应链急需维持销量从而保障产线的利用率，不得不变本加厉的展开价格厮杀，使得企业竞争环境愈发恶劣。这一现象也反映在股票市场，供应链多数上市公司股价都上半年结束后齐...

2019年09月30日 | 三星Galaxy A70s正式发布配6400万像素三摄拍照

如今人们对手机的拍照功能十分关注，唯有拍照表现出色的手机才能得到更多消费者的认可。近日，三星Galaxy A70s正式在海外上市，这部手机配备后置三摄，其中主摄像头采用三星自家的6400万像素GW1传感器，拍照表现值得期待。简单来看，三星Galaxy A70s的外观设计还是不错的。这部手机配备6.7英寸的AMOLED面板，采用水滴屏设计，前置镜头为3200万像素。同时...

2020年09月30日 | 三星W21 5G通过3C认证入网：配25W充电器

上周日，三星新一代心系天下系列 W21 5G 已经通过国家 3C 认证。通过认证信息可以发现，该机依然采用了 25W 的充电适配器。此外，该机型号毫无疑问地定为 SM-W2021，且支持 5G 网络。　　本月 14 日，三星 W21 5G 可折叠手机已通过无线电认证，支持两张实体 SIM 卡。IT之家了解到，之前的三星折叠屏手机仅支持一张实体 SIM ...

2021年09月30日 | 物位开关的输出方式应怎样选择

　　目前，国内市场上物位开关输出方式多种多样，常见的有以下几种：晶体管、继电器、晶闸管、二线制，面对这些五花八门吗的物位开关输出方式，简直让人眼花缭乱，不知如何选择！这里就为大家梳理一下，几种常见的物位开关输出方式的选择方法。　　首先给大家介绍下计为物位开关上使用较多的继电器。它是一种电子控制器件，实际上是用较小的电流去控制较大...

史海拾趣

CLARE公司的发展小趣事

为了进一步拓展市场，CLARE公司积极开拓国内市场，并与多家知名企业建立了战略合作关系。同时，公司还积极进军国际市场，通过参加国际展会、设立海外分支机构等方式，加强与国际客户的交流与合作。这些举措不仅为CLARE公司带来了更多的商业机会，也进一步提升了其在全球电子行业中的地位和影响力。

GAPTEC Electronic GmbH & Co. KG公司的发展小趣事

背景：随着市场需求的不断增长，Galaxy Microelectronics意识到需要不断迭代技术和扩大产能。

发展：2010年，公司成功研发出3D V-NAND技术，这一技术革命性地提高了存储密度和性能，降低了功耗。同时，公司开始在全球范围内建设新的生产基地，以满足日益增长的市场需求。通过技术迭代和产能扩张，Galaxy Microelectronics逐渐成为了全球闪存市场的领军企业之一。

DYMO公司的发展小趣事

DYMO公司成立于20世纪XX年代，由发明家XXX创立。XXX先生对标签打印技术的潜力有着深刻的洞察，他相信这项技术将极大地提高办公效率。他带领团队研发了第一款便携式标签打印机，这款产品以其易用性和便携性迅速赢得了市场的认可。DYMO公司的成功，从创始人XXX的远见和决心开始。

冠西电子(COSMO)公司的发展小趣事

冠西电子一直重视产品质量和客户服务，通过了国际标准化组织的ISO9001质量管理标准认证，以及各国的安规认证，如UL、TUV等。这些认证不仅证明了冠西电子产品的品质卓越，也为其赢得了更多国际客户的认可。此外，冠西电子还积极与国际知名企业开展合作，共同推动电子行业的发展。

Ametherm公司的发展小趣事

随着技术的不断进步，Ametherm公司始终保持着对技术创新的追求。他们不断研发新的材料、优化生产工艺，以提高产品的性能和稳定性。同时，公司还密切关注市场需求的变化，根据客户需求进行产品升级和改进。这些努力使得Ametherm的功率热敏电阻在行业中逐渐脱颖而出，赢得了客户的信赖和好评。

Advanced Pressure Technology公司的发展小趣事

APT公司的成功引起了业界的广泛关注。2007年5月，日本上市公司SMC对APT公司进行了战略收购。这一收购不仅为APT公司提供了更强大的资金和技术支持，也为其未来的发展注入了新的活力。虽然被收购，但APT公司仍然保持其独立运作的特色，继续专注于气体输送技术的研发和生产。在SMC的支持下，APT公司得以进一步扩大生产规模、提升技术水平，并持续推出更多创新产品。

问答坊 | AI 解惑

200W PC ATX POWER SUPPLY。。。 200W PC ATX POWER SUPPLY… 查看全部问答∨	avr 的书 AVR单片机C语言开发入门指导… 查看全部问答∨
驱动程序编译错误，帮我看看是什么错误？我的一个代码如下： ...... #include "s2440.h" ...... ...… 查看全部问答∨	攒分，请无视只为攒分… 查看全部问答∨
IC破解请问有那位高手可以把AT88SC153这个芯片的程序破解出来… 查看全部问答∨	WinCE5.0上如何编程设置任务栏"总在最前","自动隐藏","显示时间"的启用或停用? 如题,主要是想让任务栏不要总在最前,全屏程序. 并非想要直接ShowWindow(hTaskBarWnd, SW_HIDE)隐藏(这样打开"最大化"窗口时不能最大化,下面原来任务栏的地方是空白); 试过修改注册表并SendMessage(hTaskBarWnd, WM_COMMAND, 0x3EA, 0),实际并 ...… 查看全部问答∨
找人,找刘松华,,,,我是田工..... 见到后给我电话:13424522439… 查看全部问答∨	多个串口初始化的函数怎么写? 例如已经定义好了 #define U0IIR (((volatile unsigned char ) 0xE000C008)) 和 #define U1IIR (((volatile unsigned char ) 0xE00 ...… 查看全部问答∨
从EPCS加裁NIOS 公司最近有一个项目，用到EP3C55这个器件，希望能把FPGA配置文件SOF和NIOS的程序文件一并烧写的EPCS芯片上！在SOPC中添加了EPCS CONTROLLER，并在NIOS的RESET ADDRESS设定为EPCS CONTROLLER的地址！现在有两上问题没有想清楚： ...… 查看全部问答∨	请教汇编指令EALLOW和EDIS的含义 #define EALLOW asm(\\" EALLOW\\" #define EDIS asm(\\" EDIS\\" #define ESTOP0 asm(\\" ESTOP0\\" 在上面定义的指令中,不知道三个汇编指令的含义,还请高手赐教,谢谢!! ...… 查看全部问答∨

小广播

单片机多久才能入门入门单片机的时间因人而异，取决于个人的学习速度、学习方法以及之前的电子领域经验等因素。一般来说，如果你有一定的电子领域基础和编程经验，入门单片机可能会比较快一些。以下是一些影响学习时间的因素：背景知识：如果你已经具备了一定的电子领 ...… 查看全部问答∨	我想单片机外设入门，应该怎么做呢？要入门单片机外设，你可以按照以下步骤进行：了解常见外设类型：首先，了解单片机常见的外设类型，包括但不限于LED、按键、数码管、LCD、传感器（如温度传感器、光敏传感器等）、通信模块（如蓝牙模块、Wi-Fi模块等）、电机驱动器等。了解这些外设 ...… 查看全部问答∨
fpga初学者可以做什么作为FPGA初学者，你可以尝试以下几个方面来加深对FPGA的理解和掌握：学习FPGA基础知识：首先，你需要了解FPGA的基本原理、结构和工作方式。学习FPGA的基础知识可以帮助你更好地理解FPGA的应用和开发过程。掌握HDL编程：掌握硬件描述语言（HDL）如Ve ...… 查看全部问答∨	怎么从0开始学习机器学习作为电子领域资深人士，你可以按照以下步骤从零开始学习机器学习：建立数学和统计基础：机器学习涉及大量的数学和统计知识，包括线性代数、概率论、统计学等。建议从学习这些基础知识开始，例如通过网上的课程、教材或视频教程。学习编程技能：机器 ...… 查看全部问答∨
对于fpga黑金开发板入门，请给一个学习大纲以下是针对FPGA黑金开发板入门的学习大纲：第一阶段：基础知识和准备工作了解FPGA基础知识：学习FPGA的基本概念、结构和工作原理。了解FPGA与ASIC的区别以及FPGA的应用领域。熟悉FPGA开发环境和工具：下载安装FPGA厂商提供的开发工具，如Xilinx Viv ...… 查看全部问答∨	研究生fpga如何入门作为研究生，您对于FPGA的入门路径可能需要更加深入和系统化的学习。以下是一些建议：理论基础：确保您具备扎实的数字电路和计算机体系结构的理论基础，包括逻辑门、寄存器传输级描述(RTL)、组合逻辑、时序逻辑、状态机等概念。编程语言：掌握硬件 ...… 查看全部问答∨
机器学习入门需要什么基础作为电子领域资深人士，你已经具备了一些数学和编程的基础，这会对你学习机器学习起到很大的帮助。以下是你入门机器学习所需的基础知识：数学基础：机器学习涉及大量的数学知识，特别是线性代数、概率论和统计学。你需要熟悉矩阵运算、向量空间、概 ...… 查看全部问答∨	人工神经网络入门看什么书如果你想入门人工神经网络（ANN），以下是几本推荐的书籍。这些书籍覆盖了从基础概念到高级应用的广泛内容，非常适合入门学习和进一步深入研究。1. 《神经网络与深度学习》 - 迈克尔·尼尔森（Michael Nielsen）推荐理由：这本书从基础开始介绍神经 ...… 查看全部问答∨
我想c 神经网络入门，应该怎么做呢？学习 C 神经网络的入门可以分为以下几个步骤：理解基本概念：首先，了解神经网络的基本概念，包括神经元、权重、激活函数、前向传播和反向传播等。学习神经网络原理：深入了解神经网络的工作原理，包括如何通过权重和激活函数将输入映射到输出，以 ...… 查看全部问答∨	哪款fpga适合入门对于初学者入门 FPGA（可编程逻辑器件），建议选择一款易于学习和使用的 FPGA 开发板。以下是几款适合入门的 FPGA 开发板：Xilinx Spartan-6 系列开发板：Spartan-6 系列是 Xilinx 公司推出的一款经典 FPGA 系列，具有良好的性价比和广泛的应用领域 ...… 查看全部问答∨

2021年09月30日 | 中国最懂自动驾驶量产公司秀毫末智行肌肉