历史上的今天

今天是:2024年11月14日(星期四)

2019年11月14日 | Graphcore AI加速器芯片将商业化进程

发布者:落寞梦惊 来源: 半导体行业观察关键字:Graphcore  AI加速器芯片 手机看文章 扫描二维码
随时随地手机看文章
致力于开发AI工作负载加速器的英国公司Graphcore宣布了一个里程碑:其智能处理单元(IPU)已在Azure上启动。这标志着微软等大型云供应商首次公开提供对Graphcore芯片的支持。


Graphcore说,Azure上的IPU向客户开放,优先授权那些“专注于[自然语言处理]的边界”和“在机器智能方面取得新突破”的用户。


资料显示,Graphcore(由Simon Knowles和Nigel Toon于2016年创立)迄今已从Robert Bosch Venture Capital,三星,Amadeus Capital Partners,C4 Ventures,Draper Esprit,Foundation Capital,Pitango Capital和人工智能使Arm联合创始人Hermann Hauser和DeepMind联合创始人Demis Hassabis处获得了投资,公司的估值也达到15亿美元。他们的第一个商业产品是16纳米PCI Express卡(C2),该卡将于2018年面世,而该软件包也同样将在Azure上发布。


“微软与Graphcore紧密合作了两年多。在此期间,由杰出工程师Marc Tremblay领导的Microsoft团队一直在开发Azure的系统,并一直在IPU上增强高级机器视觉和自然语言处理模型,” Toon说。“一段时间以来,我们一直在与许多领先的抢先体验客户和合作伙伴进行广泛合作,以确保[这些产品]可以面向公众发布。”

image.png

C2具有两个互连的Colossus IPU,每个都包含16个内核和236亿个晶体管。单个芯片的1,216个IPU可以与每个300核内存配对,, 可达到每个内核100 GFLOPS(其中一个GFLOP等于每秒十亿个浮点运算)的运算能力,并可以运行多达10,000个程序。其中,每芯片的内存带宽为45TB / s,这就使得使C2的全卡带宽为90TB / s 。 Graphcore声称,理论上的最大数据量比HBM2图形芯片的100倍。


C2旨在与Graphcore定制的Poplar(一种用于AI和机器学习的图形工具链)配合使用。它与Google的TensorFlow框架和Open Neural Network Exchange(可互换AI模型的生态系统)集成在一起。据预计,到2019年第四季,他们将实现与Facebook PyTorch的初步兼容性,而全部的功能支持将在2020年初到来。


为了证明IPU的效率,Graphcore说它和Microsoft开发人员通过Google的Transformers双向编码器表示(BERT)语言模型实现了最先进的性能和准确性,该语言模型通过预先训练句子之间的关系来学习句子之间的关系。他们用一台装有八张C2卡的IPU服务器在56小时内训练了一个BERT变种(BERT Base),他们声称客户的推理吞吐量平均提高了3倍,延迟提高了20%以上。

image.png

微软技术研究员道格·伯格(Doug Burger)说:“自然语言处理模型对Microsoft极为重要。在Azure上运行我们内部的AI工作负载和同时为AI客户服务。” “我们对与Graphcore处理器上的新合作将为我们的客户带来的巨大潜力性感到非常兴奋。Graphcore产品扩展了Azure的功能,我们在此所做的努力是确保Azure仍然是AI最佳云的策略的一部分。”


在等式的图像识别方面,Graphcore表示,欧洲搜索引擎Qwant设法在IPU上运行Facebook的模块化ResNext架构而获得了收益。正如Graphcore解释的那样,ResNext包含重复的块,这些块汇总了IPU“有效”支持的转换集。Qwant和Graphcore报告说,对于组卷积(即信号和图像处理中的互相关联),图像搜索的性能提高了3.5倍,吞吐速度提高了77倍。


“我们现在非常高兴能够将Graphcore技术商业化地提供给更多的客户,” Toon补充说。“我们期待支持创新者实现IPU机器智能的下一个重大突破。”


Graphcore芯片在Azure上的发布是在Untether AI成立一周后进行的。UntetherAI是一家多伦多创业公司,该公司正在开发用于AI推理工作负载的高效芯片。他们获得了2000万美元的风险投资。而总部位于加利福尼亚州的Mythic亦筹集了8,520万美元用于开发自定义内存结构,他们预计到2025年将达到911.8亿美元的市场中。换而言之,Graphcore不乏毗邻的竞争对手。

image.png

总部位于旧金山的初创公司AI Storm今年早些时候为其AI边缘计算芯片系列完成了1320万美元的融资,总部位于山景城的Flex Logix于4月推出了推理协处理器,该处理器声称其吞吐量可达到现有芯片的10倍。另一个竞争对手Xnor.ai最近推出了一款始终在线的太阳能供电设备,该设备能够加速最新的机器学习算法。去年11月,世界语科技公司(Esperanto Technologies)为其7纳米AI芯片技术筹集了5800万美元。


Graphcore还宣布,其IPU已与Dell服务器机架技术集成在一起,这意味着企业客户将能够在自己的场所构建机器智能计算。更多细节将在下周在丹佛举行的超级计算会议上宣布。


关键字:Graphcore  AI加速器芯片 引用地址:Graphcore AI加速器芯片将商业化进程

上一篇:Marvell ThunderX2解决方案让Microsoft Azure开发更成熟
下一篇:瑞萨电子RE微处理器荣获2019Aspencore全球电子成就奖

推荐阅读

随着互联网的发展,技术进步及高性能低功耗处理芯片的推出,部分穿戴设备例如智能手表、智能手环已走向商业化。而这些新兴的3C产品的崛起也带新增了3C行业的需求。根据IDC报告显示,预计到2020年智能穿戴设备出货量将增至2.13亿台,其市场规模预计将会达到340亿美元,年复合增长率25%。而随着未来可穿戴设备的市场规模的迅速增加,相关设备供应商也将迎来...
1.复杂电子系统的发展及其测量需求 典型的复杂电子系统主要有:宽带雷达,捷变频电台,电子对抗,宽带无线通信,卫星通信等系统。 射频微波电路是复杂电子系统的重要组成部分,主要完成发射和接收信号的功率控制和频率搬移,对整个电子系统灵敏度,动态范围等指标有决定性的影响。典型的射频微波电路包含天线,放大器,滤波器,频率合成器,传输线...
集微网消息,随着新冠疫情的持续蔓延,很大程度上加速了线上办公模式转移,从而也催化了服务器储存市场规模。根据TrendForce集邦咨询旗下半导体研究处最新调查,在新冠疫情之下,除了智能终端装置的普及间接带动云端需求外,企业数字转型更加速云端服务的渗透率,加上数字经济如社群媒体互动与网络消费模式的黏着度提升,使云端供应商得以汇聚大量消费者数...

史海拾趣

问答坊 | AI 解惑

Wince RAS拨号属性的设置

在Wince里创建了cmnet进行GPRS拨号连接,但是连接属性里的拨号地点默认是“单位”,这样会导致拨号码前多了一个“9”,变成“9,*99***1#”,拨号连接不成功。必须手动将拨号地点改为“住宅”才行。 请问大家,如何设置能够使拨号地点默认为“住宅 ...…

查看全部问答∨

有调通过marvell wifi 8686 sdio接口驱动来讨论下???

正在调sdio接口的wifi 8686驱动,sdio确认好的,读写寄存器,加载固件都没问题。有以下问题: 1. 我是直接把驱动放在bsp中编的,wince启动后自动加载wifi驱动, 并且这个wifi驱动会自行搜索热点。我的理解是wifi驱动加载固件启动完wifi芯片注册网络 ...…

查看全部问答∨

protel 99se中,sp232E在哪个库中?

如题。 protel 99se中,SP232E所在的库叫什么?…

查看全部问答∨

lstAdd的使用问题!

    SESSION_POS_S *pTestpos1, *pTestpos2, *pTestpos3, *pPos;     LIST *pMyList = NULL;     int NodeIndex = 0;             DPRINT("-------- lstAdd测试 -------\\n ...…

查看全部问答∨

看看我的成果

本人长期从事单片机开发应用,积累了一定的经验。本人将毕生研究心得集成了文字,放在我的博客里,希望大家光临指导,并给点意见。我的博客地址;http://blog.mcuol.com/user/Article/500.html…

查看全部问答∨

愤怒了搞ARM了

看了看买来的开发板,不晓得能做些啥子有意义的东西来玩,感觉自己如果堕落会浪费很多的时间,最近几天一直在想自己以后该怎么办,今天拿出买来很久的ARM开发板有一种冲动的感觉,TMD应届生就比你们所谓的有经验的差。。。希望热心的网友能够例举些 ...…

查看全部问答∨

ez430-rf2500遇到了问题。。求指点

 想请问你一下 那个ez430-rf2500为什么ed连上电池两个灯还是不闪。。ap的红灯在闪烁。。并且PC上温度只有一个ap温度显示。。就是说ed的没有反应。。好像是没有连接到网络。。后来又折腾了一下。。现在ap的红绿灯都在闪。。但是ed还是没反应。 ...…

查看全部问答∨

特权同学写的sdram控制器读出的数据全是FF?

最近在用特权同学写的sdram控制器,但是串口读出的数据全是FF,不知道出错在什么地方?用没用过调通的朋友,不吝赐教,万分感谢啊…

查看全部问答∨

高手帮忙看一下这程序

#include<reg51.h>    //  包含51单片机寄存器定义的头文件unsigned char code Tab[ ]={0xc0,0xf9,0xa4,0xb0,0x99,0x92,0x82,0xf8,0x80,0x90};  //数字0~9的段码unsigned char int_time ; //中断次数计数变量unsigned ...…

查看全部问答∨

Verilog HDL信号类型不一致

module main (                       ....); wire   clk1MHz; // 产生1MHz的时钟波形 // 输入为20MHz的时钟 clock_divider  instT1MHz &nb ...…

查看全部问答∨
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
更多往期活动
随便看看

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved