看完这篇文章，你就知道你特斯拉Autopilot V9强在哪里

分享到: 微博; QQ; 微信; LinkedIn

今年 10 月，跳票已久的 Autopilot V9 版本终于落地，Musk 吹过的牛也在一步步实现。媒体上关于 Autopilot V9 的溢美之词不绝于耳，但却没人能从技术角度说说这次的 V9 到底牛在哪里。好在民间有大神，在特斯拉论坛上，就有一位神经网络从业者对 V9 进行了深入剖析。看完他的分析，你对 Musk 的崇拜恐怕要再多几分。

记者对神经网络工程师 jimmy-d 的论坛发言进行了整理和编译，各位读者可千万别错过这份营养满满的技术大餐。

统一的摄像头网络让 8 颗摄像头火力全开

与前一个版本的 V8 类似，我认为 V9 的神经网络中也用到了“摄像头网络”，它能直接处理来自摄像头的输出。当然这还不够，特斯拉还准备了一套“后置处理网络”，它能将“摄像头网络”生成的数据变成更高级别的抽象，而且已经拥有了可操作性。与 V8 相比，V9 有了巨大的跃升。

这个“摄像头网络”到底强大到什么地步呢？

它能一次控制 8 颗摄像头。需要注意的是，V9 上所有摄像头采集的图片和视频权重都是一样的（V8 有所不同，不同摄像头采集的数据重要程度不同）。

具体来说特斯拉这 8 颗摄像头：

前置的 3 颗与后置的 1 颗处理分辨率均为 1280x960（释放了摄像头的最高分辨率）；

剩下的 4 颗摄像头则用了 640x480 的处理分辨率（其实这 4 颗摄像头与前后那 4 颗最高分辨率相同，但在这里只用到了其分辨率的四分之一）。

*注：特斯拉的 8 颗摄像头包括 3 颗前置摄像头，它们中有一颗是窄视角摄像头，覆盖范围可达 250 米，一颗是中程摄像头（主摄像头），能看 150 米远，另一颗则是广角摄像头，但覆盖范围仅 60 米。另外车尾还有 1 颗摄像头，剩下 4 颗则对称安装在车辆转向灯下放和 B 柱上。

除此之外，这 8 颗摄像头均升级到了 3 条色彩通道（红绿蓝 3 条色彩通道），且用上了双层架构设计。与其相比，V8 上的 2 条色彩通道（红绿 2 条色彩通道）+单层架构设计就寒酸多了。而且别忘了，V8 的摄像头分辨率只有 640x416，且只有主摄像头和窄视角摄像头有这“待遇”。

传闻称 V8 的多个版本也给那 4 颗比较“闲”的摄像头配备了神经网络，但它到底派没派上用场恐怕只有特斯拉内部人员才知道。

可以肯定的是，V8 时代 Autopilot 驾驶时只用到了主摄像头和窄视角摄像头，而那颗前置广角摄像头是用来感应雨水的。不过在 V9 上，这 8 颗摄像头确实是火力全开。

除了摆脱摄像头“闲置”的骂名，V9 的神经网络处理能力还大幅提升。拿主摄像头来说，1280x960 的分辨率与 3 条色彩通道和双层架构设计叠加，每帧文件大小就能达到 1280x960x3x2 字节，换算过来就是 7.3 M。反观 V8 的主摄像头，每帧输入只有 0.5 M，数据量是 V9 的1/13。

与谷歌的 Inception V1 神经网络相比（两者用了类似的底层架构概念），V9 的摄像头网络规模要大上 10 倍，算力更是提升了 200 倍。

虽然侧方的 4 颗摄像头分辨率只有主摄像头的1/4，但 8 颗摄像头火力全开，13 倍的数据输入量虽然加大了 ECU 的压力，但也能提供更为精细的物体细节。

更为有趣的是，摄像头接口发生了改变，V9 上每一帧都是成对处理。不过，这些成对处理得画面还是有时间偏差的，延迟大致在 10-100 毫秒，这样才能呈现出动作，而动作能提供深度信息并将物体从背景中分离出来，帮助车辆识别并预测物体轨迹（包括车辆自己的轨迹）。

对系统的基础感知来说，这个升级至关重要。

图像处理网络效率大跃升

在 V8 上，主摄像头和窄视角摄像头用了相同的架构，但权重有差异。

这点并无问题，毕竟两颗摄像头有完全不同的视场。分别训练两颗摄像头会大大降低物体识别的难度，同时神经网络的规模和训练量也会有所下降。不过这也意味着你必须打造两个不同的训练数据集并分别对它们进行评估，而且在运行时两个不同的神经网络还要交替上线。

在 V9 上，特斯拉则用上了独立的图像处理网络（Camera Agnostic，意为独立于摄像头），它能在相同权重下处理任何摄像头的输出数据。同时也能解决 V8 上神经网络的问题并提升其稳定性。

这种解决方案也意味着神经网络必须更了解物体到底长什么样，无论镜头畸变有何不同（畸变无法用物理方式修复）。此外，独立的图像处理网络很烧钱，因为它需要大量的训练、海量的数据库和一个规模庞大的神经网络。

当然，特斯拉选择这样一个解决方案也不是为了给自己找麻烦。这套独立的图像处理网络在计算效率上有了较大提升。当它只需要依照一个权重时，就不用频繁在 GPU 中写入各种数据。更重要的是，你可以在一个数据集的框架下大批量处理各种摄像头采集的图像了。这样一来，同等的硬件就能获得性能加成。

我从来没想过有厂商愿意搞这种独立的图像处理网络，特斯拉真给力！

怪物级别的神经网络

如果要用一个词形容 V9 的神经网络，恐怕你脑海里第一个蹦出来的词是怪物，但事实上它比怪物还要强悍。当你将神经网络里的一个权重乘以 5，就会发现你得到的不只是 5 倍的能力提升。

在表达能力上，神经网络的提升服务更是几何级的。打个比方，如果 V8 的表达能力是 10，那么 V9 就是 100000，绝对是爆炸性的性能飞跃。不过，想用好这个性能飞跃，就需要训练数据也配合着增加，你“喂给”神经网络的数据量可能是原来的数百万倍。

（*注：其实数据方面特斯拉并不担心，毕竟和 Waymo 相比，它们奔跑在路上的车辆要多得多。数据显示，2016 年年底特斯拉售出车型的行驶里程已经高达 35 亿英里，随着大量 Model 3 入役，想必 Musk 的数据库都快塞不下这些数据了，而时不时就实现一个里程碑的 Waymo 才累积了 1000 万英里的路测历程。）

简单来说，这套神经网络比我见过的任何视觉神经网络都要庞大，只是想想它需要的学习数据我都感觉不可思议。为了万无一失我甚至算了很多遍，但最终我惊奇的发现，限制我的并非计算方法，而是我的想象力。

V9 神经网络上的变化让车辆有能力识别任何方向上的每个物体，其探测距离甚至能达到数百米。同时，它还能抓住这些物体的瞬间动作。如果考虑到摄像头视场的重叠，每出现一个物体，至少会被两颗摄像头发现，这就大大提升了车辆安全性。

在 V9 上，特斯拉是不是用了半监督学习？特斯拉使用的数据肯定有一部分不带标签，毕竟谁能找来这么多人给天量的数据加标签？

在我看来，特斯拉的模拟测试设计师们肯定打造了一台专门生成数据标签的机器，不过即使这样恐怕加了标签的数据也不够用。而且，特斯拉去哪找这么狂暴的数据中心来训练神经网络呢？难道 Musk 是谷歌背后的神秘人，能从 Larry Page 那弄来一整个仓库的 TPU？

也许 Musk 又在酝酿什么神秘的杀手锏了。

总而言之，在 V9 上我看到了特斯拉的能力和野心。

特斯拉总是能实现业内专家都无法想象的进步，这种通过改进“放大”计算能力、训练数据和产业资源的能力是特斯拉的核心竞争力之一，同时也降低了未来研发路上的不确定性。

从这个角度来看，特斯拉的“视觉优先/全神经网络”模式确实前程远大。作为一名神经网络界的从业人员，我为特斯拉感到骄傲。

关键字：特斯拉摄像头神经网络引用地址：看完这篇文章，你就知道你特斯拉Autopilot V9强在哪里

上一篇：马斯克终于服软，“全自动驾驶”被撤回
下一篇：“全自动驾驶”字样从特斯拉官网消失，意味着什么

集微网消息（文/小如）10月21日，福州软件园闽侯分园举行揭牌暨招商项目签约仪式，该园区将聚焦于大数据、人工智能、区块链、信息安全、集成电路设计等七大领域。在仪式举行当天，29家企业成功签约入驻该园区，总投资约32亿元，其中包括北京比特大陆科技有限公司。（图片来源：“遇见闽侯”微信公共账号）比特大陆将投资13亿元，在上街...

2019年10月23日 | 还有2天，国际无人机大会将盛大开幕

2019年10月25日，由南京市浦口区人民政府主办、南京浦口高新技术产业开发区管理委员会和中国高科技行业门户OFweek维科网联合承办的“2019中国（南京）国际无人机系统产业大会”将在南京举办。届时，南京市浦口区人民政府将携手无人机行业的优秀名企和专家学者，为众多行业人士分享交流最新的前沿技术与产业资讯。图片来源：浦口区政府花落南京，加速无人机...

2020年10月23日 | 2020激光雷达前瞻技术展示交流会12月沪上起航

1、大会背景近年来，LiDAR作为自动驾驶汽车最关键的传感器之一，引起了广泛的关注。迄今为止，全球有超过百家公司正在不断突破技术瓶颈来开发车规级LiDAR，不少厂商与主机厂开展紧密合作，争取早日实现高线束激光雷达的批量搭载。根据Yole的报告，LiDAR在过去三年中出现了大幅降价，到2020年全球激光雷达市场规模将达到17亿美元，预计增长将达到19%，Yole...

2021年10月23日 | 鸿蒙HarmonyOS驱动，华为全屋智能战略又升级

华为开发者大会 2021（Together）如期在东莞松山湖举行，华为消费者 BG 首席战略官邵洋带来了华为全屋智能的重磅战略发布 —— 在 HarmonyOS 的驱动下，1+2+N 全屋智能解决方案再升级，重塑未来家空间；通过 2D、2B、2C 三大路径，协同各方伙伴共创未来家，不断提升全屋智能场景体验，加速数字化家庭进程，为行业发展注入新动能。　　...

史海拾趣

E-CMOS(飞虹高科)公司的发展小趣事

随着全球化趋势的加剧，飞虹高科公司意识到，要想在国际市场上取得更大的成功，必须与国际同行展开合作。因此，公司积极寻求与国际知名企业的合作机会，通过技术合作、合资建厂等方式，共同开发新产品、拓展新市场。这些合作不仅为公司带来了资金和技术支持，还帮助公司扩大了国际影响力，提高了产品的国际竞争力。

Eby Electro Inc公司的发展小趣事

Eby Electro Inc在发展壮大的同时，始终关注社会责任的履行。公司积极参与环保和公益活动，推广绿色电子产品，减少生产过程中的环境污染。此外，公司还设立了奖学金和助学金，支持教育事业的发展。这些举措不仅提升了公司的社会形象，也为公司赢得了更多的社会支持和认可。

Firadec公司的发展小趣事

背景：随着电子行业竞争的日益激烈，成本控制成为了企业生存发展的关键。Firadec公司意识到优化供应链的重要性。

发展：公司开始与上游供应商建立长期稳定的合作关系，通过集中采购、共享库存等方式降低采购成本。同时，Firadec还加强了对生产过程的精细化管理，提高了生产效率和产品质量。

影响：供应链的优化和成本的有效控制，使Firadec公司在激烈的市场竞争中保持了较强的盈利能力。这也为公司后续的研发和市场拓展提供了有力的支持。

Gauthier Connectique公司的发展小趣事

能够灵敏地接收来自遥控器的微弱红外线信号，确保用户指令的准确传输。

Display Engineering Services公司的发展小趣事

可能是电源波动、电磁干扰等原因导致的。解决方法包括检查电源稳定性、加强电磁屏蔽等。

GeneSiC Semiconductor公司的发展小趣事

可能是电源波动、电磁干扰等原因导致的。解决方法包括检查电源稳定性、加强电磁屏蔽等。

问答坊 | AI 解惑

基于SG3525电压调节芯片的PWM Buck三电平变换器基于SG3525电压调节芯片的PWM Buck三电平变换器摘要：阐述了用SG3525电压调节芯片实现PWM Buck三电平变换器的交错控制。相对于采用分立元件实现PWM Buck三电平变换器的交错控制而言，该控制方法电路简单，易于实现，可以较好地解决三电平波形的不 ...… 查看全部问答∨	《嵌入式Linux系统开发技术详解—基于ARM》《嵌入式Linux系统开发技术详解—基于ARM》 110楼有完整版本哦 https://bbs.eeworld.com.cn/thread-50757-11-1.html ------------------------------------------------------------------------------------- “scarlettsp”说：“第六章 ...… 查看全部问答∨
EVC编写的程序WiNCE6.0上不能运行问题请教？最近将wince5.0升级到wince6.0，发现以前在EVC下编写的mfc应用程序在wince6.0上不能运行，尝试将Program Files\\Microsoft Visual Studio 8\\VC\\ce\\Dll\\armv4I目录下几个跟MFC相关的DLL导入到系统windows目录（网上看帖子说是PB6.0对MFC不支持 ...… 查看全部问答∨	Verilog 修正miller码编码在做这个修正miller码的编码时，如何判定输入的序列是不是最后一位啊？我们讨论可能要用寄存器，不知道这样行不行，哪为大虾给点思路？如果能给写一小段VERILOG，更是感激不尽啊。。… 查看全部问答∨
在XP系统开发U盘上层过滤驱动时遇到的安装问题研究初步成果及疑问 {36FC9E60-C465-11CF-8056-444553540000}… 查看全部问答∨	多用途太阳能LED发光水壶看上去是个运动水壶，其实他是一个LED露营灯，如果你旅行时有重要的私人用品，还可以将他们都装进去，防水防潮。这款名叫LightCap 300 LED户外灯，LED灯藏在瓶盖里面，瓶盖的外面是贴有整块太阳能板，不管你在哪只要野外晴天就能充电，夜晚就能持 ...… 查看全部问答∨
如何提高FLASH的擦写次数如何提高FLASH的擦写次数在实际应用中，用户经常需要在程序运行过程中保存或读取一些数据，这些数据在工作中经常会变化，而且掉电后也不能丢失，所以需要及时地进行存储，存储这些数据常用的存储器是EEPROM。HXM6002虽然本身不带EEPROM，但是它 ...… 查看全部问答∨	【MSP430共享】加速度传感器在步态信号采集系统中的应用详细介绍了三轴加速度传感器 M MA 7 2 6 0的结构、工作原理及其功能，提出了一种采用MM A 7 2 6 0提取步态特征的设计方案。系统由MM A 7 2 6 0与微控制器 MS P 4 3 0 F 1 4 9组成，由M MA 7 2 6 0 捕获步态的加速度信号，由MS P 4 3 ...… 查看全部问答∨
88led 点阵 24引脚？？？我买了个88的点阵，是红色单色的，但是有24四个引脚，一般不是只有16个引脚吗，，跪求引脚定义。。。。… 查看全部问答∨	申请430开发板的资格以前从来没有用过430，因为接触的都是功耗不敏感的项目，最近做了一个手持设备，功耗这块搞惨了，所以想试试传说中的430，看是不是真正的有那么神奇。… 查看全部问答∨

小广播

基于SG3525电压调节芯片的PWM Buck三电平变换器基于SG3525电压调节芯片的PWM Buck三电平变换器摘要：阐述了用SG3525电压调节芯片实现PWM Buck三电平变换器的交错控制。相对于采用分立元件实现PWM Buck三电平变换器的交错控制而言，该控制方法电路简单，易于实现，可以较好地解决三电平波形的不 ...… 查看全部问答∨	《嵌入式Linux系统开发技术详解—基于ARM》《嵌入式Linux系统开发技术详解—基于ARM》 110楼有完整版本哦 https://bbs.eeworld.com.cn/thread-50757-11-1.html ------------------------------------------------------------------------------------- “scarlettsp”说：“第六章 ...… 查看全部问答∨
EVC编写的程序WiNCE6.0上不能运行问题请教？最近将wince5.0升级到wince6.0，发现以前在EVC下编写的mfc应用程序在wince6.0上不能运行，尝试将Program Files\\Microsoft Visual Studio 8\\VC\\ce\\Dll\\armv4I目录下几个跟MFC相关的DLL导入到系统windows目录（网上看帖子说是PB6.0对MFC不支持 ...… 查看全部问答∨	Verilog 修正miller码编码在做这个修正miller码的编码时，如何判定输入的序列是不是最后一位啊？我们讨论可能要用寄存器，不知道这样行不行，哪为大虾给点思路？如果能给写一小段VERILOG，更是感激不尽啊。。… 查看全部问答∨
在XP系统开发U盘上层过滤驱动时遇到的安装问题研究初步成果及疑问 {36FC9E60-C465-11CF-8056-444553540000}… 查看全部问答∨	多用途太阳能LED发光水壶看上去是个运动水壶，其实他是一个LED露营灯，如果你旅行时有重要的私人用品，还可以将他们都装进去，防水防潮。这款名叫LightCap 300 LED户外灯，LED灯藏在瓶盖里面，瓶盖的外面是贴有整块太阳能板，不管你在哪只要野外晴天就能充电，夜晚就能持 ...… 查看全部问答∨
如何提高FLASH的擦写次数如何提高FLASH的擦写次数在实际应用中，用户经常需要在程序运行过程中保存或读取一些数据，这些数据在工作中经常会变化，而且掉电后也不能丢失，所以需要及时地进行存储，存储这些数据常用的存储器是EEPROM。HXM6002虽然本身不带EEPROM，但是它 ...… 查看全部问答∨	【MSP430共享】加速度传感器在步态信号采集系统中的应用详细介绍了三轴加速度传感器 M MA 7 2 6 0的结构、工作原理及其功能，提出了一种采用MM A 7 2 6 0提取步态特征的设计方案。系统由MM A 7 2 6 0与微控制器 MS P 4 3 0 F 1 4 9组成，由M MA 7 2 6 0 捕获步态的加速度信号，由MS P 4 3 ...… 查看全部问答∨
88led 点阵 24引脚？？？我买了个88的点阵，是红色单色的，但是有24四个引脚，一般不是只有16个引脚吗，，跪求引脚定义。。。。… 查看全部问答∨	申请430开发板的资格以前从来没有用过430，因为接触的都是功耗不敏感的项目，最近做了一个手持设备，功耗这块搞惨了，所以想试试传说中的430，看是不是真正的有那么神奇。… 查看全部问答∨

我想epoch深度学习入门，应该怎么做呢？如果您想要学习Epoch深度学习框架，可以按照以下步骤进行入门：了解深度学习基础：在开始学习Epoch之前，建议您先对深度学习的基本概念有所了解，包括神经网络、反向传播算法、激活函数、损失函数等。可以通过在线课程、教科书或网络资源来学习。 ...… 查看全部问答∨	初学者用什么机器学习作为电子领域资深人士，你可能对一些特定领域有更深的了解，因此可以考虑选择与电子工程相关的机器学习技术。以下是一些适合初学者并与电子领域相关的机器学习技术：监督学习：在电子领域中，监督学习是最常见的应用之一。你可以学习使用监督学习技 ...… 查看全部问答∨
数据分析机器学习怎么入门入门数据分析和机器学习可以按照以下步骤进行：学习基本数学和统计知识：数据分析和机器学习都涉及大量的数学和统计知识，包括线性代数、微积分、概率论和统计学等。你可以通过自学或者参加相关课程来掌握这些基础知识。掌握编程技能：学习一门编程 ...… 查看全部问答∨	我想fpga芯片快速入门，应该怎么做呢？要快速入门 FPGA 芯片设计，你可以按照以下步骤进行：了解 FPGA 的基本概念：学习 FPGA 是什么以及它的工作原理。了解 FPGA 是一种可编程逻辑器件，能够根据用户的需求重新配置其内部电路结构，实现不同的功能。选择一款适合初学者的 FPGA 开发板 ...… 查看全部问答∨
对于神经网络开发入门，请给一个学习大纲作为电子工程师，你对神经网络开发感兴趣，以下是一个适合你的神经网络开发入门学习大纲：基础概念了解人工神经元的基本原理和神经网络的基本结构。理解前馈神经网络（Feedforward Neural Networks）和反向传播算法（Backpropagation）的基本原理。 ...… 查看全部问答∨	我想python 深度学习入门，应该怎么做呢？学习 Python 深度学习是一个很好的选择，因为 Python 在深度学习领域拥有丰富的库和工具，如 TensorFlow、PyTorch 和 Keras 等。以下是学习 Python 深度学习的一些建议步骤：学习 Python 编程基础：如果你还不熟悉 Python，建议先学习 Python 的基 ...… 查看全部问答∨
fpga怎么才算入门了作为电子工程师，要算入门了，你需要掌握一些基本的概念和技能，以及能够完成一些简单的项目。以下是入门FPGA所需的一些关键步骤：了解基本概念：理解FPGA的基本原理和架构。熟悉数字电路和逻辑设计的基本概念，例如布尔代数、逻辑门、时序和组合逻 ...… 查看全部问答∨	学单片机如何入门学习单片机作为电子工程师是一个很好的起点。以下是入门单片机的步骤：选择单片机: 首先，你需要选择一款单片机作为你的学习平台。常见的单片机包括8051系列、AVR系列、PIC系列和STM32系列等。每种单片机都有其特点和应用领域，你可以根据你的兴趣 ...… 查看全部问答∨
对于smt编程教程入门，请给一个学习大纲对于 SMT 编程的学习大纲如下：1. 编程基础学习编程语言的基本语法和逻辑结构，如 C、C++、Python 等。熟悉常用的数据类型、控制结构、函数和数组等基本概念。2. 硬件基础了解计算机组成原理和基本的电子电路知识。掌握数字电路和模拟电路的基本原 ...… 查看全部问答∨	我想单片机cf入门，应该怎么做呢？针对你提到的"单片机CF"，我不确定你指的是什么具体的东西，因为单片机通常不会与CF（CompactFlash）卡相关。如果你指的是单片机编程，可能是C语言的简称（Cf.）。如果你指的是与CF卡相关的内容，可以学习与嵌入式系统或单片机连接CF卡的方法，通常 ...… 查看全部问答∨

2018年10月23日 | 看完这篇文章，你就知道你特斯拉Autopilot V9强在哪里