历史上的今天

今天是:2024年08月26日(星期一)

正在发生

2021年08月26日 | KAUST将机器学习训练速度提高7倍 有助于改进自动驾驶汽车等应用

发布者:Harmonious88 手机看文章 扫描二维码
随时随地手机看文章

据外媒报道,沙特阿拉伯阿卜杜拉国王科技大学(KAUST)的研究人员发现了一种能够显著提升训练速度的方法。通过观察采用大型训练数据库的分布式机器学习中产生结果零的频率,可以显著加快大型机器学习模型的训练速度。


黑科技,机器学习,模型训练,自动驾驶

计算机的1和0(图片来源:techxplore.com)


AI模型通过在数据库上进行训练来开发“智能”,而此类数据库都被事先标记好,以告知模型如何区分不同输入信息,然后再做出相应的反应。输入的已标记数据越多,该模型就越擅长完成分配给它的任务。对于自动驾驶汽车等复杂深度学习应用而言,它们需要大量输入的数据库以及很长的训练时间,即使采用了强大且昂贵的高度并行超级计算平台也是如此。


在训练期间,小型的学习任务被分配给数十或数百个计算节点,然后在运行下一个任务之前,这些计算节点会通过通信网络分享结果。在此种并行计算任务中,计算量消耗最大的来源之一是每个模型步骤中计算节点之间的通信。


KAUST的研究人员表示:“在分布式深度学习中,通信是主要的性能瓶颈。随着模型规模的迅速增长,我们还看到在学习过程中产生零值的比例在增加,称为稀疏性。我们的想法是利用此种稀疏性,通过只发送非零数据块来尽可能提高有效带宽的使用效率。”


基于KAUST早期研发的SwitchML方法,即通过在处理数据传输的网络交换机上运行高效的聚合代码来优化节点间的通信,研究人员希望能够通过识别结果零,并研发一种方法,以在不中断并行计算过程中,同步减少传输,而进一步优化该方法。


研究人员表示:“确切地说,如何利用稀疏性来加速分布式训练是一个具有挑战性的问题。所有的节点需要在同一时间内处理同一个位置的数据块,因此我们必须协调节点,以确保只聚合同一个位置的数据块。为了克服这个问题,我们打造了一个聚合程序以协调此类工作者,指导它们接下来发送哪个数据块。”


该团队在一个由一组图形处理单元(GPU)构成的测试台上展示了其OmniReduce方法,并且在典型深度学习任务中速度加快了7倍。


引用地址:KAUST将机器学习训练速度提高7倍 有助于改进自动驾驶汽车等应用

上一篇:伏达半导体推出50W车载无线充解决方案,充电效率高达77%
下一篇:自行换电池只要 3 分钟!德国推出全新电动车不用排队等充电

推荐阅读

在输出模式下:ODR是数据输出寄存器,但是在 输入模式下,同时也用来配置上拉下拉设置。在Alientek的源码中的按键输入实验中有如下一段初始化代码:void KEY_Init(void){ RCC->APB2ENR|=1<<2; //使能PORTA时钟 GPIOA->CRL&=0XFFFFFFF0;//PA0设置成输入 GPIOA->CRL|=0X00000008; GPIOA->CRH&=0X0F0FFFFF;//PA13,15设置...
为了让机器人实现蟑螂般的快速移动,吴一川和加州大学伯克利分校一位长年研究蟑螂的生物学家罗伯特福尔教授展开了合作:“教授发现,蟑螂移动的时候,通过腿部的动作,有时是腾空跳跃的,只不过因为这个腾空的高度相比我们人类太低了,我们很难发现。” 为了还原蟑螂的移动,课题组把用高速摄像机拍下来的蟑螂移动的视频研究了几十次,“我们需要找到蟑...
一台服务器、一台电脑、一台手机最重要的电子零部件是什么?没错,就是CPU处理器。它主要负责数据计算、控制功能,是最核心的部分。不过你又知道有多少种CPU架构吗?主流的X86、ARM到底有什么区别?下面就给大家介绍一下几种常见的CPU架构:X861978年6月8日,Intel发布了史诗级的CPU处理器8086,由此X86架构传奇正式拉开帷幕。首次为8086引入X86作为计算机...
随着“工业4.0”在全球范围内引发了新一轮工业转型竞赛,许多国家都在工业自动化领域逐步发力,拥抱智能化时代。作为该领域应用广泛且最重要的控制元件之一,继电器被赋予了更为艰巨的“使命”,既要尽可能小型化,又得保持高性能和高可靠性。 深耕工控领域多年的技术型分销商Excelpoint世健的产品经理Wilson Wang表示,有别于传统的工业用继电器,工业自...

史海拾趣

问答坊 | AI 解惑

《谈混合信号系统中的接地》

《谈混合信号系统中的接地》 这篇文章主要讲解数字和模拟混合信号系统中的接地问题,值得一看 《谈混合信号系统中的接地》 帖子:http://www.cntronics.com/bbs/redirect.php?tid=905&goto=lastpost#lastpost…

查看全部问答∨

强悍的IE文件提取器,非常好用

经常在网上冲浪的我们,肯定看过视频、听过歌曲,可是我们并没有主动下载他们,怎么实现了在线视听的效果呢?其实他们都已经下载到你的电脑里面了,只是它们都存储在一个特殊的地方——IE缓存;而本程序可以将IE缓存里指定类型的文件提取出来。 ...…

查看全部问答∨

nkstub.lib unexpected

请教各位大侠: 小弟今天在编译WinCE 6.0 BSP的时候,卡在Oal下面就是过不去, 错误信息如下: BUILD: [01:0000002951:ERRORE] C:\\WINCE600\\PLATFORM\\mini2440\\Src\\Oal\\OalExe\\sources(15) :  U1033: syntax error : \'$(_COMM ...…

查看全部问答∨

女生选择数据库方向合适吗?

  我是计算机一名大三女生,现在开始选方向了,只有4个方向,权衡了一下,觉得好像除了数据库方向,其它都很差劲,可又不知道这个方向具体以后可以从事哪些职业,适不适合女生,学好它还需要哪些基础课程...(c,java,我比较喜欢java,C很差...) ...…

查看全部问答∨

再纠结stm32:can not find arm device 灭了你!

调程序调的正欢或者正纠结的时候,最郁闷的原因之一:刚才还好好的能下载能调试现在突然它弹出一个对话框:can not find arm device  你又要停下本来就紧巴巴的进度来排错找原因。 我也经常遇到这样子的情况,我的解决办法通常有两个:1. ...…

查看全部问答∨

求问各位大大,我该如何起步学习设计电源呢?

非常冒昧的提出了这个问题,还请有经验的各位大大不吝赐教,帮我指点迷津啊! 我是一个大三学生,学过模电、数电等知识,申请了一个学校的创新项目来改造实验室电源,希望能够将实验室普通使用的电源改造成可调节成多量程的模式,实现的方式是希望 ...…

查看全部问答∨

神舟IV LCD显示SD卡图片 (简易电子相架功能)

目的: 在LCD上显示图片方案: 由于STM32F107VC内置内存只有64K,不足以全屏显示板载LCD,SSD1289,320x240x16bit        图像数据只能通过外部存储设备读入,板置W25X16,或SD。数据需要提前导入。   ...…

查看全部问答∨

【聊聊DSP】从零开始学TI DSP开发

今天回家比较早,看见坛子里的活动,积极参与一下 最早接触DSP好像是06、07年的事情了,当时在一家大型国企从事软件开发工作,和杭州大华在视频方面有些项目合作,名义上是联合开发其实我们都不懂那块,当时好像视频压缩大华采用的是BF533,算是我 ...…

查看全部问答∨

功率测试组合方案有哪些优势?

最近全程参加了泰克的一个关于功率分析仪PA4000的一个在线研讨会,泰克推出1-4通道的高精度功率分析仪,除了0.02%的精度、独特的双分流器功能以及其他关键特性外,那个speaker陈经理还多次强调“与Tek示波器”的完整功率测试组合方案。以前电源设计 ...…

查看全部问答∨

四川赛区 成绩公布

本帖最后由 paulhyde 于 2014-9-15 03:10 编辑 四川赛区 成绩公布    …

查看全部问答∨
小广播
最新汽车电子文章
换一换 更多 相关热搜器件
随便看看

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved