特斯拉、高通、华为可用于智能驾驶领域AI处理器的深度分析

分享到: 微博; QQ; 微信; LinkedIn

很多人会问，为什么没有英伟达？目前所有主流深度学习运算主流框架后端都是英伟达的CUDA，包括TensorFlow、Caffe、Caffe2、PyTorch、mxnet、PaddlePaddle，CUDA包括微架构和指令集以及并行计算引擎。CUDA垄断了深度学习或者也可以说垄断了人工智能，这一点类似ARM的微架构和指令集。CUDA强大的生态系统，造就了英伟达牢不可破的霸主地位。深度学习的理论基础在上世纪五十年代就已经齐备，无法应用的关键就是缺乏像GPU这样的密集简单运算设备，是英伟达的GPU开创了人类的深度学习时代，或者说人工智能时代，CUDA强化了英伟达的地位。你可以不用英伟达的GPU，但必须转换格式来适应CUDA。

CUDA开启了并行计算或多核运算时代，今天人工智能用的所有加速器都是多核或众核处理器，几乎都离不开CUDA。CUDA程序构架分为两部分：Host和Device。一般而言，Host指的是CPU，Device指的是GPU或者叫AI加速器。在CUDA程序构架中，主程序还是由CPU 来执行，而当遇到数据并行处理的部分，CUDA 就会将程序编译成 GPU能执行的程序，并传送到GPU。而这个程序在CUDA里称做核（kernel）。CUDA允许程序员定义称为核的C语言函数，从而扩展了C语言，在调用此类函数时，它将由N个不同的CUDA线程并行执行N次，这与普通的C语言函数只执行一次的方式不同。执行核的每个线程都会被分配一个独特的线程ID，可通过内置的threadIdx变量在内核中访问此ID。在 CUDA 程序中，主程序在调用任何 GPU内核之前，必须对核进行执行配置，即确定线程块数和每个线程块中的线程数以及共享内存大小。你可以不用英伟达的GPU，但最终都离不开CUDA，也就是需要转换成CUDA格式，这就意味着效率的下降。所以英伟达是参考级的存在。

从CUDA的特性我们不难看出，单独的AI加速器是无法使用的。今天我们分析三款可用于智能驾驶领域的AI加速器，分别是高通的AI100，华为的昇腾，特斯拉的FSD。这其中高通AI100比较少见。

高通AI100最早于2019年4月在深圳的高通AI开放日露面，2020年9月量产。AI100是高通目前唯一的AI推理运算加速器，定位四个方面的应用：一是数据中心的边缘计算，二是5G行动边缘计算，三是智能驾驶与智能交通，四是5G基础设施。AI100有两个侧重点：一是5G游戏，AI100发布当天邀请了VIVO手机、腾讯王者荣耀开发团队利用AI100现场开了一场电玩竞赛，即把部分运算放到5G边缘服务器上，减轻手机端的负载。二是智能交通和智能驾驶，高通自动驾驶Ride平台的AI加速器很有可能就是AI100的车规翻版。

图片来源：互联网

高通特别展示了AI100在智能交通/智能驾驶领域的应用。

图片来源：互联网

同时支持24路200万像素帧率25Hz的图像识别，特斯拉的FSD不过是同时8路130万像素帧率30Hz的图像识别，性能至少是特斯拉FSD的3倍。

AI100可以像刀片服务器那样应用，用PCIe交换机最多16个级联。

图片来源：互联网

最高每瓦有12.37TOPs的算力，特斯拉FSD是36瓦的功耗，AI部分估计大约为24瓦，每瓦只有大约3TOPs每瓦的算力，英伟达的Orin大致为5.2TOPs每瓦的算力。

图片来源：互联网

上图为高通AI100内部框架图。设计很简洁，16个AI核，内核与内核之间是第四代PCIe连接，带宽有186GB/s，8通道的PCIe网络，然后再与各种片上网络（NoC），包括存储NoC、运算NoC和配置NoC通过PCIe总线连接。片上存储器容量高达144MB，带宽136GB/s。外围存储器为256Gb的LPDDR4。支持汽车行业的ISO26262安全标准，即ASIL，达到B级。

NoC是多核AI处理器的核心技术之一，特斯拉FSD只有两个NPU，很可能用不到NoC而用比较落后的总线技术，不过高通和华为都用到了。

图片来源：互联网

NoC的详细理论就不说了，可以理解为一个运行在PE与存储之间的通讯网络。NoC技术和网络通信中的OSI（Open System Interconnection）技术有很多相似之处，NoC技术的提出也是因为借鉴了并行计算机的互联网络和以太网络的分层思想，二者的相同点有：支持包交换、路由协议、任务调度、可扩展等。NoC更关注交换电路和缓存器的面积占用，在设计时主要考量的方面也是这些。NoC的基本组成为：IP核、路由器、网络适配器以及网络链路，IP核和路由器位于系统层，网络适配器位于网络适配层。针对NoC的这四个基本组成，也衍生出了许多的研究方向和优化途径。

图片来源：互联网

常见AI加速器的NoC如上表。需要指出高通和华为都用了Arteris，这家公司实际是高通的子公司，高通在2013年11月收购了这家仅有43人的法国小公司，今天中国几乎所有的大中型芯片公司都是其客户，包括瑞芯微、国民技术、华为、全志、炬力、展讯等，可以说都在给高通打工。英特尔在2019年收购了Netspeed，Facebook在2019年收购了Sonics，这两家的NoC使用面远不如高通的Arteris。

图片来源：互联网

每个AI核内部框架如上，主要分4个部分，分别是标量处理、向量处理、存储处理和张量处理。深度学习中经常出现4种量，标量、向量、矩阵和张量。神经网络最基本的数据结构就是向量和矩阵，神经网络的输入是向量，然后通过每个矩阵对向量进行线性变换，再经过激活函数的非线性变换，通过层层计算最终使得损失函数的最小化，完成模型的训练。

标量(scalar)：一个标量就是一个单独的数(整数或实数)，不同于线性代数中研究的其他大部分对象(通常是多个数的数组)。标量通常用斜体的小写字母来表示，标量就相当于Python中定义的x=1。

向量（Vector），一个向量表示一组有序排列的数，通过次序中的索引我们能够找到每个单独的数，向量通常用粗体的小写字母表示，向量中的每个元素就是一个标量，向量相当于Python中的一维数组。

矩阵（matrix），矩阵是一个二维数组，其中的每一个元素由两个索引来决定，矩阵通常用加粗斜体的大写字母表示，我们可以将矩阵看作是一个二维的数据表，矩阵的每一行表示一个对象，每一列表示一个特征。

张量（Tensor），超过二维的数组，一般来说，一个数组中的元素分布在若干维坐标的规则网格中，被称为张量。如果一个张量是三维数组，那么我们就需要三个索引来决定元素的位置，张量通常用加粗的大写字母表示。

不太严谨地说，标量是0维空间中的一个点，向量是一维空间中的一条线，矩阵是二维空间的一个面，三维张量是三维空间中的一个体。也就是说，向量是由标量组成的，矩阵是向量组成的，张量是矩阵组成的。

标量运算部分可以看作一个小CPU，控制整个AI Core的运行。标量计算单元可以对程序中的循环进行控制，可以实现分支判断，其结果可以通过在事件同步模块中插入同步符的方式来控制AI Core中其它功能性单元的执行流水。它还为矩阵计算单元或向量计算单元提供数据地址和相关参数的计算，并且能够实现基本的算术运算。复杂度较高的标量运算如数据流量控制则由专门的AI CPU通过算子完成，AI处理器是无法单独工作的，必须要外置的CPU给予配合。

华为昇腾系列内核架构。图片来源：互联网

华为的昇腾910即Davinci Max，和高通AI100一样，也是8192个Int8，4096个FP16。不过昇腾910是训练用的，高通AI100是推理用的，但910不计成本使用HBM2代存储，性能远超AI100。

图片来源：互联网

上图为特斯拉FSD信号内部流转，相干流量即深度学习的数据流量需要CPU控制，当然也不只是为深度学习服务。

图像识别深度学习中运算量最大的卷积部分实际就是矩阵的乘和累加。可以分解为1维的标量或者叫算子（即权重）与2维的向量即输入图像乘和累加。

图片来源：互联网

上图为特斯拉FSD神经网络架构，特斯拉把矩阵的乘和累加简单写成了MulAccArray。特斯拉做芯片刚刚入门，FSD上除了NPU是自己做的外，其余都是对外采购的IP。NPU方面，主要就是堆砌MAC乘和累加单元，在稍微有技术含量的标量计算领域，特斯拉没有公布采用何种指令集，应该是没什么特色。华为和高通都是采用了VLIW。

高通的向量处理器可以简单看作一个DSP。众所周知，高通的AI技术来源于其DSP技术，高通对DSP非常青睐，而已经失去生命力的VLIW超长指令集非常适合用在深度学习上，深度学习运算算法非常单一且密集度极高，并不需要通用场景下的实时控制。并且其程序运行有严格的时间要求，cache这种不可控时间的结构就不适合了，通常采用固定周期的TCM作为缓存，这样内存访问时间就固定了。有了上述的特征，静态编译在通用场合下面临的那些困难就不存在了，而DSP其更高效的并行运算能力和简化的硬件结构被完全发挥出来。

AI100为了考虑多种应用场合，有FP16和Int8两种精度阵列，Int8即8位整数精度是智能驾驶领域最常见的，FP16则是游戏、AR/VR领域常用的。Int8有8192个，FP16有4096，特斯拉则是9216个Int8阵列，如果AI100只考虑智能驾驶，在总面积（差不多可等同于成本）不变的情况下算力还可以再提高不少。

图片来源：互联网

上图为特斯拉NPU部分流程与裸晶分布，算力理论峰值只是根据MAC数量简单计算得出，实际存储器是瓶颈，存储器能让算力大打折扣，这也是为什么训练用AI芯片都不惜成本用HBM内存的原因。特斯拉的芯片上，大部分都给了SRAM，也是为了解决存储器瓶颈问题。这里常见到两个单位，GiB和GB，GB是十进制，GiB是二进制，1GiB=（1024*1024*1024）B=1073741824B，1GB=（1000*1000*1000）B=1000000000B，1GiB/1GB=1073741824/1000000000=1.073741824。要求精度不高的话，可以直接替换，高通AI100有144MB的片上存储，特斯拉只有32MiB，高通显然可以碾压特斯拉的，此外外围的LPDDR4存储上，高通也是碾压特斯拉，特斯拉带宽只有63.58 GiB/s，高通AI100是136GB/s。

图片来源：互联网

最后说算力，AI处理器对比似乎离不开算力对比，实际单独讲算力数据毫无意义，上图是高通AI100在五个数据集上的表现，我们可以看到性能与效率差别巨大，AI算力越强，其适用面就越窄，与深度学习模型的捆绑程度就越高，换句话说，AI芯片只能在与其匹配的深度学习模型上才能发挥最大性能，换一个模型，可能只能发挥芯片10%的性能，所有AI芯片目前的算力数据都是理论峰值数据，实际应用中都无法达到理论峰值，某些情况下，可能只有峰值算力的10%甚至2%。100TOPS的算力可能会萎缩到2TOPS。

在芯片领域，特斯拉只能算是小学生，只要有意愿，高通、英特尔、英伟达、华为、AMD、联发科、三星都能碾压特斯拉。

关键字：特斯拉华为 CUDA 人工智能智能驾驶引用地址：特斯拉、高通、华为可用于智能驾驶领域AI处理器的深度分析

上一篇：混搭出奇迹，自动驾驶AI芯片上演架构之争
下一篇：NeoPhotonics推出全新FMCW激光器和SOA 可用于AV中的相干激光雷达

推荐阅读

2018年09月15日 | 2018最新国产手机，有哪些值得买

金秋9月不只是学生们开学的日子，也是手机界掀起各种新浪潮的时间。最近一段时间光是听各种大消息小消息都知道苹果又要发新手机了，而且也就在9月13号苹果新机也发布了。印象里的苹果手机算是手机行业的头，而且苹果手机也在不知不觉中成为了一定的“有钱人”的标签。2018最新国产手机，有哪些值得买_新浪众测也就在苹果新机发布同期有很多的国产机...

2020年09月15日 | 基于ARM单片机的高精度电子秤设计与实现

1、系统框图简介当秤盘上放入被秤物体后，电阻应变片受重力的影响产生形变，电阻值发生变化。应变片搭建的桥式电路会输出微弱的电压信号，微弱电压信号由HX711内部集成放大器放大后经过内部ADC进行采样转换后送到到MCU，接收到的数据信息经过线性拟合处理后送到LCD液晶显示。系统能完成称重、设置单价计算金额及金额累加、去皮及去皮范围限制等基本功能，...

2021年09月15日 | Littelfuse CPC1596光隔离负载偏压栅极驱动器无需外部电源设备

非常适合需要快速接通的工业、楼宇自动化、物联网和其他大功率电子应用中国北京，2021年9月15日讯 – Littelfuse公司是一家工业技术制造公司，致力于为可持续发展、互联互通和更安全的世界提供动力。今天宣布推出市场上首款高压光隔离MOSFET栅极驱动器，该驱动器不需要外部电源设备，但可以在几十微秒量级进行快速负载接通。观看视频。 CPC1596 570V...

史海拾趣

BEKA Associates Ltd公司的发展小趣事

人才是企业发展的核心竞争力。BCD Semi（Diodes）非常重视人才队伍的建设和培养。公司积极引进国内外优秀的研发、生产和销售人才，为他们提供良好的工作环境和职业发展机会。同时，公司还注重员工的培训和提升，定期组织各类培训活动和技术交流会议，帮助员工不断提升自身的专业技能和综合素质。通过这些措施，BCD Semi成功打造了一支高素质、专业化的人才队伍，为公司的持续发展提供了有力的人才保障。

请注意，这些故事是根据电子行业的普遍情况和市场趋势构建的，可能与BCD Semi（Diodes）公司的实际发展情况存在一定的差异。如需了解该公司更详细的发展故事，建议查阅公司官方网站、相关新闻报道或行业分析报告等权威渠道获取更准确的信息。

品赞(G-Switch)公司的发展小趣事

采用成熟的技术和元器件，具有较高的可靠性和稳定性。

Harris公司的发展小趣事

进入20世纪30年代，Hammond迎来了其发展历程中的一个重要转折点。在1930年代初，Hammond成为加拿大第一家生产两柱式机架和窄柜系列产品的公司，这些产品迅速获得了广播和通讯行业的青睐。这一创举不仅巩固了Hammond在业内的地位，还为其后续在电气、电子行业的全面发展铺平了道路。

DEMMELPRODUCTS公司的发展小趣事

DEMMELPRODUCTS公司深知人才是企业发展的根本。因此，公司始终注重人才培养和团队建设。通过制定科学的培训计划和激励机制，公司吸引了一批优秀的研发、生产和销售人才。同时，公司还鼓励员工之间进行知识和经验的分享与交流，形成了积极向上的团队氛围。这些优秀的人才和团队为公司的发展提供了有力的支持。

远阳(FLYOUNG)公司的发展小趣事

国光新业深知技术创新是企业发展的核心动力。截至目前，公司已拥有授权专利78项，其中发明专利30项，实用新型专利48项，还有数十项专利正在实质审查中。这些专利的积累，不仅彰显了公司在电容器领域的深厚技术底蕴，更为公司产品的持续升级与市场竞争力的提升提供了有力保障。公司还主导起草了两项该类高分子电容器国家标准，进一步巩固了其在行业内的领先地位。

BOSER公司的发展小趣事

在国内市场取得一定成绩后，BOSER公司开始积极寻求海外市场的扩张。公司加强与国际知名企业的合作，通过参加国际展览、举办技术研讨会等方式，不断提升品牌知名度和影响力。同时，BOSER还针对不同国家和地区的市场需求，推出定制化的产品和服务，成功打开了多个海外市场。

问答坊 | AI 解惑

请问LC滤波和LC谐振有什么关系？它们的特征频率的平方都是1/LC啊请问LC滤波和LC谐振有什么关系？它们的特征频率的平方都是1/LC啊… 查看全部问答∨	一些工控英文菜单 About Modules=关于模块&Close=关闭(&C)SYSTEM=系统Index=索引About Application=关于应用程序Serial Number:=序列号:Person:=个人:Company:=公司:Application Program=应用程序Operating System=操作系统Hardware System=硬件系统(C)2003, All ...… 查看全部问答∨
人体等效于什么？比较酷实验过程中，人体的移动（靠近或远离电路）有时候会影响电路，这是可能是由于工频的影响（人体接示波器输入有工频信号）。在这种情况下：人体的影响应该用什么来等效呢？有时候电路非要人体接近或者接触某些元件，电路才能正常工作。碰到这种情 ...… 查看全部问答∨	丰田怎么了？——从大量召回所想到的…… 丰田从2009年起到现在的一连串汽车召回事件使得该公司面临70多年发展史上最为严峻的品牌信任危机。　　200万辆、400万辆、800万辆……，丰田汽车此次在全球的召回的总量很可能超过其2009年698万辆的全球总销量。继2009年丰田在中国大陆一次性召 ...… 查看全部问答∨
如何精确的测量小电阻有人会说，这还不容易，弄个双臂电桥，比如QJ36，是0.02级的，可以很精确的测量低阻。事实上，这QJ36我就有，体积比较大，用起来要外接直流稳压电源和检流计，不方便。另一方面，0.02级 = 0.02% = 200ppm，也不够好。要说更方便的、更精确的， ...… 查看全部问答∨	51单片机基础学习（一）--写端口接触单片机也有二年了吧，开始是从51下手的，主要是因为当时周围的人都在学51,而且上课讲的也是51,还有就是51资料很多，在这里俺把俺当年学习的东东拿出来供那些还没有入门的兄弟姐妹们学习学习…… & ...… 查看全部问答∨
哪些SD接口网卡是用AR6001系列的芯片组. 请问用Athros的AR6001芯片组做的wifi无线网卡有哪些? 虽然这款芯片用的非常广. 但不知道哪些SD接口网卡是用AR6001系列的芯片组. … 查看全部问答∨	数据采集相关问题我现在在使用凌华的一款采集卡--9812，有几个问题不懂，想请教一下您。希望大家能与我帮助。 1，同时采用四个通道采集信号，一个通道时硬件触发通道，另外三个是信号通道，在使用用信号发生器对三个通道测试的时候发 ...… 查看全部问答∨
STM32F103中断交流以前听说前后台的操作模式，一般不在中断服务程序里写复杂的算法，即使各个中断协调的很好。说是因为进中断的时候CPU不一定将全部的寄存器保护，所以会影响程序正确性。请问STM32有这样的问题吗？期待DX们来交流！… 查看全部问答∨	手机的摄像头的变焦功能有对手机摄像头的变焦功能了解的吗，来说说看是怎么实现的… 查看全部问答∨

小广播

请问LC滤波和LC谐振有什么关系？它们的特征频率的平方都是1/LC啊请问LC滤波和LC谐振有什么关系？它们的特征频率的平方都是1/LC啊… 查看全部问答∨	一些工控英文菜单 About Modules=关于模块&Close=关闭(&C)SYSTEM=系统Index=索引About Application=关于应用程序Serial Number:=序列号:Person:=个人:Company:=公司:Application Program=应用程序Operating System=操作系统Hardware System=硬件系统(C)2003, All ...… 查看全部问答∨
人体等效于什么？比较酷实验过程中，人体的移动（靠近或远离电路）有时候会影响电路，这是可能是由于工频的影响（人体接示波器输入有工频信号）。在这种情况下：人体的影响应该用什么来等效呢？有时候电路非要人体接近或者接触某些元件，电路才能正常工作。碰到这种情 ...… 查看全部问答∨	丰田怎么了？——从大量召回所想到的…… 丰田从2009年起到现在的一连串汽车召回事件使得该公司面临70多年发展史上最为严峻的品牌信任危机。　　200万辆、400万辆、800万辆……，丰田汽车此次在全球的召回的总量很可能超过其2009年698万辆的全球总销量。继2009年丰田在中国大陆一次性召 ...… 查看全部问答∨
如何精确的测量小电阻有人会说，这还不容易，弄个双臂电桥，比如QJ36，是0.02级的，可以很精确的测量低阻。事实上，这QJ36我就有，体积比较大，用起来要外接直流稳压电源和检流计，不方便。另一方面，0.02级 = 0.02% = 200ppm，也不够好。要说更方便的、更精确的， ...… 查看全部问答∨	51单片机基础学习（一）--写端口接触单片机也有二年了吧，开始是从51下手的，主要是因为当时周围的人都在学51,而且上课讲的也是51,还有就是51资料很多，在这里俺把俺当年学习的东东拿出来供那些还没有入门的兄弟姐妹们学习学习…… & ...… 查看全部问答∨
哪些SD接口网卡是用AR6001系列的芯片组. 请问用Athros的AR6001芯片组做的wifi无线网卡有哪些? 虽然这款芯片用的非常广. 但不知道哪些SD接口网卡是用AR6001系列的芯片组. … 查看全部问答∨	数据采集相关问题我现在在使用凌华的一款采集卡--9812，有几个问题不懂，想请教一下您。希望大家能与我帮助。 1，同时采用四个通道采集信号，一个通道时硬件触发通道，另外三个是信号通道，在使用用信号发生器对三个通道测试的时候发 ...… 查看全部问答∨
STM32F103中断交流以前听说前后台的操作模式，一般不在中断服务程序里写复杂的算法，即使各个中断协调的很好。说是因为进中断的时候CPU不一定将全部的寄存器保护，所以会影响程序正确性。请问STM32有这样的问题吗？期待DX们来交流！… 查看全部问答∨	手机的摄像头的变焦功能有对手机摄像头的变焦功能了解的吗，来说说看是怎么实现的… 查看全部问答∨

我想8051单片机入门，应该怎么做呢？要入门8051单片机，你可以按照以下步骤进行：学习基础知识：了解电子电路的基础知识，包括电阻、电容、电感等元件的特性和作用。了解数字电子学的基础概念，如逻辑门、触发器等，以及它们在电路中的应用。了解8051单片机：阅读8051单片机的相关资料 ...… 查看全部问答∨	我想积卷神经网络入门，应该怎么做呢？想要入门深度学习和积卷神经网络（CNN），你可以按照以下步骤进行：学习基本概念：了解深度学习的基本概念，包括神经网络、前向传播、反向传播等。理解深度学习的原理和基本原理将为你后续的学习奠定基础。学习数学和统计学基础：深度学习涉及到许 ...… 查看全部问答∨
我想430用来单片机入门，应该怎么做呢？学习使用430单片机进行入门学习的步骤如下：了解基础知识：首先，学习单片机的基础知识，包括数字电子学、嵌入式系统原理、微控制器结构和功能等。掌握这些基础知识对于理解430单片机的工作原理和应用至关重要。选择合适的开发工具：选择适合430单 ...… 查看全部问答∨	对于声纹识别深度学习入门，请给一个学习大纲以下是声纹识别深度学习入门的学习大纲：第一阶段：声纹识别基础声学原理：了解声音的基本原理，包括声波的产生、传播和特征。声纹识别概述：了解声纹识别的定义、应用场景和基本原理，包括声纹特征提取和模式匹配等。第二阶段：深度学习基础深度学 ...… 查看全部问答∨
深度学习入门书怎么样作为电子领域的资深人士，深度学习入门书籍对于初学者来说是非常有帮助的资源。这些书籍通常会介绍深度学习的基本概念、原理和应用，并提供实践项目和案例来帮助读者理解和应用所学知识。下面是几本深度学习入门书籍的推荐：《深度学习》(Deep Lear ...… 查看全部问答∨	我想fpga硬件入门，应该怎么做呢？要入门 FPGA 硬件设计，你可以按照以下步骤进行：学习 FPGA 基本概念：理解 FPGA 是什么以及它的工作原理。了解 FPGA 是一种可编程逻辑器件，能够根据用户的需求重新配置其内部电路结构，实现不同的功能。选择一款适合初学者的 FPGA 开发板：选择 ...… 查看全部问答∨
对于深度学习自然语言处理入门，请给一个学习大纲以下是深度学习自然语言处理（NLP）入门的学习大纲：第一阶段：基础知识数学基础：学习线性代数、概率论和统计学等数学知识，理解深度学习模型中涉及的数学原理。编程基础：掌握至少一种编程语言（如Python），学习基本的编程概念和语法，以及常用 ...… 查看全部问答∨	我想python深度神经网络入门，应该怎么做呢？学习 Python 深度神经网络的入门可以按照以下步骤进行：学习 Python 编程基础：如果你还不熟悉 Python 编程语言，首先需要学习 Python 的基础知识，包括语法、数据类型、控制流等。你可以通过在线教程、书籍或者视频课程来学习。了解深度学习基础 ...… 查看全部问答∨
FPGA入门看什么视频作为电子领域资深人士，选择合适的FPGA入门视频可以帮助您快速掌握基础知识和技能。以下是一些适合入门者的FPGA视频资源：FPGA入门教程：寻找一些由资深工程师或学术界专家制作的FPGA入门教程视频，这些视频通常会涵盖FPGA的基础知识、工具使用、 ...… 查看全部问答∨	我想caffe中神经网络原理入门，应该怎么做呢？要了解Caffe中神经网络的原理，你可以按照以下步骤进行：学习神经网络基础知识：在学习Caffe之前，建议先掌握神经网络的基本原理，包括前向传播、反向传播、激活函数、损失函数等。你可以通过书籍、在线课程或教程来学习这些知识。阅读Caffe文档： ...… 查看全部问答∨

2021年09月15日 | 特斯拉、高通、华为可用于智能驾驶领域AI处理器的深度分析