神经拟态计算赛道又开始热起来了

发布者:EEWorld资讯最新更新时间:2024-05-31 来源: EEWORLD关键字:神经拟态  英特尔 手机看文章 扫描二维码
随时随地手机看文章

近日,英特尔宣布推出全球最大的代号为Hala Point的神经拟态系统(neuromorphic system),最初布署在桑迪亚国家实验室,基于英特尔Loihi 2神经拟态处理器构建,旨在支持类脑AI领域的前沿研究,解决AI目前在效率和可持续性等方面的挑战。


英特尔实验室神经拟态计算实验室主任Mike Davies表示:“当下AI模型的算力成本正在以不可持续的速度上升,行业需要规模扩展的全新方法。为此我们开发了Hala Point,它将深度学习的高效与新颖的类脑学习和优化能力结合在一起,我们希望通过对Hala Point的研究,能在大规模AI技术的效率和适应性方面有所推进与突破。”


作为从大学中孵化的项目,2017年英特尔就发布了其首款神经拟态芯片Loihi,并以USB dongel形式提供给 40 多个学术研究小组用于研究目的。


此次发布Hala Point,对神经拟态领域意味着什么?日前,英特尔中国研究院院长宋继强给予了详细解读。


Hala Point是什么?


Hala Point系统由封装在一个六机架的数据中心机箱中的1152个Loihi 2处理器组成,大小相当于一个微波炉。包含12块板,每块板上有96颗芯片,该系统支持分布在140544个神经形态处理内核上的多达11.5亿个神经元和1280亿个突触,最大功耗仅为2600瓦。Hala Point还包括2300多个嵌入式x86处理器,用于辅助计算。


在大规模的并行结构中,Hala Point集成了处理器、内存和通信通道,内存带宽达每秒16PB,内核间的通信带宽达每秒3.5PB,芯片间的通信带宽达每秒5TB。该系统每秒可处理超过380万亿次8位突触运算和超过240万亿次神经元运算。

image.png


Hala Point有多厉害?


在英特尔第一代大规模研究系统Pohoiki Springs的基础上,Hala Point改进了架构,将神经元容量提高了10倍以上,性能提高了12倍。


在执行AI推理负载和处理优化问题时, Loihi 2神经拟态芯片系统的速度比常规CPU和GPU架构快50倍,同时能耗降低了100倍。早期研究结果表明,通过利用稀疏性高达10比1的稀疏连接(sparse connectivity)和事件驱动的活动,Hala Point运行深度神经网络的能效比高达15 TOPS/W,同时无需对输入数据进行批处理。批处理是一种常用于GPU的优化方法,会大幅增加实时数据(如来自摄像头的视频)处理的延迟。尽管仍处于研究阶段,但未来的神经拟态大语言模型将不再需要定期在不断增长的数据集上再训练,从而节约数千兆瓦时的能源。


宋继强说道,相比于Pohoiki Springs(此前推出的系统,包含768颗Loihi1)系统,尺寸从5U增加到了6U,但是神经元总数从1亿增加到了11.5亿,扩充了10倍。考虑到人脑800多亿神经元的,Hala Point系统已经达到了人脑的1/80。


在用于仿生脉冲神经网络模型时,Hala Point能够以比人脑快20倍的实时速度运行其全部11.5亿个神经元,在运行神经元数量较低的情况下,速度可比人脑快200倍。虽然Hala Point并非用于神经科学建模,但其神经元容量大致相当于猫头鹰的大脑或卷尾猴的大脑皮层。

image.png

Hala Point的意义


宋继强解释道,通过Hala Point,英特尔证明了其可以保证11.5亿个神经元彼此高效可靠的互联。


在神经拟态系统的规模化验证上,英特尔一直在通过不同的产品形态进行尝试。从2020年推出768颗Loihi1的Pohoiki,到2022年推出8 Loihi2的单板PCB Kapoho Point,再到今天1152颗Loihi2的多路集成的Hala Point,以不断验证Loihi的规模。


宋继强表示,跨不同PCB的板级互联需要专门设计,以实现更低延迟及更低的功耗,神经元间通信可能至少要跨越三个层级的I/O,Hala Point验证了大规模Loihi部署中的网络协议和物理层通信的性能。通过增加3D互连的接口,Hala Point验证了神经拟态系统不止可以水平互联,还可以实现垂直互联。


Loihi如何模拟真正的大脑


人脑作为地球上最为高效的计算设备,可以仅仅用20w的功率,1.3公斤的质量,就能完成每秒100万亿次的运算量。如果用计算机来模拟的话,功耗要达到人脑的500万倍之多。这也是Loihi等类脑芯片的目标:即实现大脑一样的低功耗及高性能。


宋继强解释道,Loihi主要利用两个方式实现低功耗。首先是改变了传统冯诺依曼的计算架构方式,通过存算一体,节约了数据在内存与CPU之间搬运的功耗,同时又可以实现高带宽。其次,则是采用了异步时钟,通过事件驱动方式工作,即有事件的路径处于工作状态,其他路径都是休眠的。同时,消息传输依靠的是队列式的动态连接,并不真正占用总线


因此,即便是规模庞大的处理器集群,神经拟态计算系统也是稀疏化、局部并行化的计算。非常适合低功耗、低延迟的工作。


大脑有神经元和突触之分,神经元指的是组成神经系统结构和执行神经功能活动的一大类高度分化细胞,突触则是是指一个神经元的冲动传到另一个神经元或传到另一细胞间的相互接触的结构。


英特尔的Loihi也有类似操作,所以叫做类脑芯片。内部有承载神经元胞体能力的组织,有计算逻辑、存储逻辑、模拟输入输出等,也有模拟轴突和树突的输入输出。


Loihi也是类似。在其神经元模型中,可以处理收到信号的序列、计算及输出,甚至还可以模拟出神经元的衰减过程。突触操作则是参数化神经元的链接过程。宋继强表示,神经拟态系统每一个操作都是可以模拟到真实行为,因此神经元和突触各有各的功能,不过对于应用到不同的算法模型上,要赋予不同的物理意义。


神经拟态的可塑性就体现每个神经元和突触连接都是可配置的,可以根据训练模型进行调整,从而实现更优化的持续学习过程。

image.png

如图,Loihi 2相对于Jetson Orin Nano,功耗有了明显的降低。


Loihi 2与Intel 4


神经元的逻辑模型需要的计算逻辑和存储逻辑是固定的,所以晶体管越小,实现一个神经元所需要的空间越小。宋继强表示,与忆阻器等利用模拟工艺实现神经拟态不同,英特尔认为全数字是更优化的方案,可以更容易实现批量生产和测试。


Loihi 2采用的是Intel 4的预制程,它是第一款采用Intel 4制程技术的芯片。由于使用了新制程,相比14nm的Loihi 1,Loihi 2的芯片面积从60平方毫米缩小到31平方毫米,单核依然为128个神经元核,但每个神经元核内的神经元数量由1000个提高到了8000个,整个单芯片支持的总的神经元数量由之前的12.8万个增加到了一百万个。


随着未来制程的不断缩微以及漏电流的减少,Loihi的性能、密度以及功耗表现,都会进一步提升。


应用探寻


宋继强强调,推出Hala Point并不意味着Loihi 2要专注于大规模的任务。Loihi 2更好的应用场景是在多路处理优化上,其低功耗高带宽的特性适用于包括多路视觉处理、传感器融合处理等并发处理方面。目前Loihi有一半的应用是跟机器人、操控、多模态视觉挂钩的。


宋继强还表示,即便是针对数据中心的任务卸载,在某些应用中,Loihi可以比CPU或GPU节能3000倍,因此在诸如科学和工程问题解决、物流等领域实现高效的计算。


在2024年4月国际声学、语音和信号处理会议 (ICASSP)上,英特尔发表的论文显示,Loihi 2 在小规模边缘工作负载的效率、速度和适应性方面的数量级提升。


今年的世界移动通信大会(MWC)上,爱立信研究院(Ericsson Research)就展示了其如何将Loihi 2神经拟态处理器应用于电信基础设施效率的优化。


生态构建


为了让更多群体用好神经拟态计算,英特尔组建了INRC(英特尔神经形态研究社区),目前已有超过200支研究团队从事相关研究。英特尔中国研究院也邀请联想、北京大学、清华大学等高校,参与INRC中,从而合作探索神经拟态的更多应用。


比如,英特尔近期就推出了英特尔神经拟态挑战赛,主要围绕实时音频去噪领域进行算法及硬件上的创新,从而展现神经拟态计算的优势。


另外,英特尔也推出了Loihi开发软件Lava,作为开源软件,Lava是一套模块化的、开源的,可以支持多平台的,可以和其他软件实现互操作的软件开发框架。

image.png

INRC社区的开发计划



未来规划


宋继强表示,英特尔未来会围绕制程、软件以及社区三方面,推动神经拟态计算的扩展,这也是Loihi赢得胜利的关键要素。

关键字:神经拟态  英特尔 引用地址:神经拟态计算赛道又开始热起来了

上一篇:三星电子:正按计划推进 eMRAM 内存制程升级,8nm 版本基本完成开发
下一篇:NVIDIA 携手全球计算机行业建立 AI 工厂和数据中心

推荐阅读最新更新时间:2024-11-16 22:23

Intel以全新理念迎接新黄金十年的挑战
2020年注定是特殊的一年,由于新冠病毒在全球的肆虐,全球经济似乎被按下了暂停键,对于半导体行业也是一个不小的打击。根据全球领先的信息技术研究和顾问公司Gartner预测,由于新冠疫情对半导体供需的影响,2020年全球半导体收入预计将下降0.9%,远低于上一季度所预测的增长12.5%。 然而,疫情带来了严峻的考验,也带来了经济结构调整的加速。如何把握机遇,开创新格局?近期,英特尔公司以“智存高远,IN擎未来”为主题,采用线上直播的形式,面向全国媒体举行年度战略“纷享会”。英特尔公司全球副总裁兼中国区总裁杨旭、英特尔中国研究院院长宋继强以及英特尔市场营销集团副总裁兼中国区总经理王锐对英特尔技术、生态、未来规划分别作出
[物联网]
<font color='red'>Intel</font>以全新理念迎接新黄金十年的挑战
英特尔眼里的智能汽车和智能交通
很多人看到这个话题也许都会想:这和英特尔有关吗?这是我们熟悉的那个几乎把 Intel Inside 标志贴到每一个PC的英特尔吗?如果我告诉你这家芯片巨擘在汽车科技方面已经耕耘了好几年,你会不会感到惊讶?说不定用不了多久,你就能开上 Intel Inside 的汽车了 当然这么说是不准确的,因为英特尔中国区总经理夏乐蓓(Rupal Shah)告诉我,除了驾乘体验方面,像是汽车的研发测试、物流管理以及智能交通方面,英特尔都有智能化的触及,也许用车联网这个词来形容英特尔的着眼点可能更合适。 智能化的驾乘体验 现在智能汽车这个概念非常火,各种科技企业、互联网公司或直接或间接造车的新闻也是不绝于耳,很多厂商都喜欢用 驾
[汽车电子]
CPU双雄ISSCC较劲 Intel小胜AMD
在美国旧金山举行的国际固态电路会议(ISSCC)上,两大处理器供货商Intel与AMD的较劲显然是前者胜出;无论在新讯息或论文的发表上,Intel都占上风。 在ISSCC上,Intel表示该公司第一款32奈米服务器处理器将采用6核心;AMD则是讨论了首款将整合x86与绘图处理核心的处理器Llano。 在ISSCC举行的同时,Intel终于发表了Itanium 9300处理器,这是该公司首款采用QuickPath Interconnect技术的产品,让OEM厂能以额外逻辑链接8颗多核心处理器;到目前为止,AMD在对称式多重处理系统(symmetric multiprocessing system)中只能链接4颗芯片,不
[半导体设计/制造]
CPU双雄ISSCC较劲 <font color='red'>Intel</font>小胜AMD
ARM CEO称已占领平板电脑市场不惧英特尔
ARM CEO沃伦·伊斯特(Warren East) -->   据国外媒体报道,ARM CEO沃伦·伊斯特(Warren East)周四表示,在平板电脑市场,英特尔并不会对ARM构成威胁。   伊斯特预计,明年全球平板电脑销量有望达到6000万部,其中大部分将采用ARM处理器。伊斯特承认,会有几款型号的平板电脑将采用英特尔Atom处理器,但能否成功还是个未知数。   伊斯特说:“在能耗方面,Atom处理器并不适合平板电脑,这一点英特尔很清楚。”苹果iPad平板电脑采用的就是ARM处理器。调研公司Strategy Analytics数据显示,上个季度iPad占据了平板电脑市场95%的份额。   伊斯特还预计,
[手机便携]
ARM CEO称已占领平板电脑市场不惧<font color='red'>英特尔</font>
英特尔称明年低成本笔记本都将采用Menlow平台
据境外媒体报道,英特尔公司世界领先项目(World Ahead for Intel )副总裁Davies近日称,三家主要低成本笔记本电脑计划(英特尔公司同学电脑(Classmate PC)、华硕电脑公司的Eee PC,还有麻省理工学院的人人电脑-OLPC),打算在明年推出第二代型号的低成本电脑,它们都将采用英特尔公司的Menlow平台。 关于人人电脑,Davies指出,人人电脑被推迟是因为NAND闪存价格上涨,以及材料成本增加。最近有报道称,人人电脑的成本已从176美元升至190美元左右。 有传言称,相关机构已经作出转向英特尔平台的决定,然而,在媒体向英特尔公司求证消息时,英特尔代表只是说公司正在设计第二代处理器XO,对人人电
[焦点新闻]
可穿戴市场遇挫,英特尔Quark处理器停产
摘要:上周末,英特尔发布通知,包括SoC、处理器及微控在内的13款夸克芯片将从2019年7月18日开始退役,最后的出货日期是2022年7月17日。相比普通处理器一年左右的退役期,夸克芯片的退役时间长达3年,毕竟这些芯片主要用于工业、嵌入式等行业市场,这类产品支持周期本来也很长。 尽管苹果、小米这样的公司还在不断推出高端及廉价智能穿戴设备,但是这两年智能穿戴市场没那么火了,许多初创公司要么转型要么倒闭了。 2013年英特尔为了跟ARM芯片抢夺智能穿戴、物联网等市场,推出了Quark夸克处理器,这是一种精简版的单核X86,最大特色就是功耗极低、核心面积也非常小,原本是打算作为高性能Core、移动版Atom之外的英特尔处理器第三极的
[安防电子]
可穿戴市场遇挫,<font color='red'>英特尔</font>Quark处理器停产
英特尔10纳米有难度,高通有望夺回明年苹果基带订单
2016年下半开始,苹果改变多年作法,iPhone Modem订单不再由高通(Qualcomm)包办,改成英特尔和高通共同接单,冲击高通营收。据传今年下半英特尔更会踢走高通,成为iPhone Modem(基带)芯片的独家供应商。对此有专家认为,高通不必过于失望,2019年仍有望夺回全数订单。 The Motley Fool 24日报导,目前英特尔供应给iPhone 7、iPhone 8、iPhone X的Modem芯片,是委托台积电代工。据了解英特尔准备收回自制,今年下半的Modem芯片“XMM 7560”,将改用英特尔自家14纳米制程生产。凯基投顾知名分析师郭明錤预测,下半年的iPhone Modem芯片将由英特尔独揽大单。
[半导体设计/制造]
英特尔低端酷睿CPU上市 海尔电脑再当首发先锋
6月2日,英特尔酷睿架构的中低端E21XX奔腾双核系列以及4XX赛扬系列在东莞隆重首发,并于6月3日与全球正式同步发行销售。本次产品发布活动,标志着英特尔公司在不到一年的时间内,彻底完成了全线产品的“酷睿”转型。 据了解,为了配合酷睿新产品的发布,包括海尔、富士康等多个合作伙伴一起举行系列促销和推广活动。同时,在活动现场,各方还联合启动了2007东莞电子竞技“酷睿挑战赛”。 据介绍,能够成为英特尔本次活动“左膀右臂”的海尔电脑毫无疑问地成为了英特尔新款中低端处理器台式机首发系统商。英特尔中国区技术总监靳光辉也明确表示,海尔在这次切换中对英特尔的支持最为坚决,因此英特尔也坚决支持海尔在本次英特尔全线酷睿架构处理器“出海”中领跑。而富
[焦点新闻]
小广播
最新半导体设计/制造文章

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 市场动态 半导体生产 材料技术 封装测试 工艺设备 光伏产业 平板显示 EDA与IP 电子制造 视频教程

词云: 1 2 3 4 5 6 7 8 9 10

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved