历史上的今天

今天是:2024年11月13日(星期三)

2018年11月13日 | 带你了解一下什么叫Gen-Z结构

发布者:huanguu 来源: 半导体行业观察关键字:Gen-Z结构 手机看文章 扫描二维码
随时随地手机看文章

我们所知道的计算机系统是建立在网络和存储速度较慢,而CPU内存的反应速度较快基础上的。多年来,设计人员为这些组件开发了相应的语言和接口,需要多层软件将内存命令转换为网络和存储命令,反之亦然。

 

到目前为止,CPU内存对相对于网络和存储I / O的速度使得这些软件层对系统性能的影响很小。

 

然而,随着摩尔定律的发展,网络和存储技术正迅速赶上CPU内存速度,现在几代软件层发挥的作用变得越来越重要。

 

在本文中,我们将Gen-Z结构视为消除现有系统瓶颈的解决方案,并通过统一通信路径并使用CPU内存加载/存储语言简化软件来显着提高系统效率和性能。

 


迈向新的计算架构

 

如图1所示,计算架构正在迅速发展为异构系统,包括多种计算单元(CPU / SoC,GPU,FPGA)和不同类型的内存/存储元件(DRAM,存储器),在本地互连在一起或远程通信。

 

此类体系结构应通过允许添加或删除资源,或在更新版本/技术可用时替换此类资源来提供更好的灵活性和可伸缩性。

 

image.png

图1 - 新的计算架构

 


以CPU为中心的方法

 

利用当今以CPU内存为中心的方法,图1中的系统使用各种硅组件、接口和软件层实现,如图2所示。

 

image.png

图2 - 以CPU内存为中心的系统架构

 

在计算系统的这种特定实现中,PCI Express被用来连接CPU内存、GPU / FPGA内存和高性能/低延迟存储器。SSD阵列通过主机总线适配器或NIC连接,使用光纤通道、Infiniband、NVMe-oF或以太网作为传输接口。

 

其中一个CPU的DRAM中的数据必须在到达SSD阵列之前遍历4个接口域,随后会产生相关的软件开销和缓冲区复制操作。

 

这里,可扩展性是一个问题:升级到下一代SCM可能需要升级/更换相关的CPU / SoC。同样,扩展SSD阵列可能需要HBA / NIC下游的结构交换机。

 


内存语义方法

 

Gen-Z是一种内存语义结构,它将CPU内存字节可寻址的加载/存储模型扩展到整个系统。事实证明,加载/存储模型是CPU与内存子系统通信的最快、最有效的方法。为了启用此模型,Gen-Z将计算与介质分离,将介质特定功能与其正确所属的介质放在一起。图3说明了这个原理。

 

image.png

图3 - 从CPU内存接口到与介质无关的结构

 

这一重要变化允许系统中的每个计算实体都是介质不可知和分解的。使用Gen-Z内存语义结构,可以使用交换拓扑实现图1中的系统,如图4所示。

 

image.png

图4 - 使用Gen-Z的系统架构

 

通过这种方法,所有设备彼此对等并通过简化的、高性能、低延迟的通信路径说出相同的加载/存储语言,而不会导致当前总线体系结构的转换惩罚和软件开销。

 

Gen-Z协议定义了大量的内存语义操作(通过OpCodes / OpClasses),可以实现高效的数据传输,以卸载计算资源,优化互连使用并降低软件开销。在所示的示例中,可以使用适当的OpCode / OpClass在一次加载和一次存储操作中将来自DRAM的数据复制到SSD阵列。

 

在可扩展性方面,系统可以通过独立升级,添加或删除计算,内存或存储元素而不影响功能,为每个工作负载和环境精确定制。

 


关于Gen-Z

 

Gen-Z架构专注于提供高效率、高带宽和低延迟。

 

通过利用经过验证的装载/存储模型实现高效率。简化了Gen-Z硬件接口层,从而最大限度地减少了对软件层的需求。消除这种复杂性、开销和诱导系统延迟可以显着提高系统性能。

 

高带宽以两种方式实现。Gen-Z支持非对称通信路径,这意味着可以将更多通道专用于读取路径而不是写入路径,反之亦然。此外,Gen-Z支持多种信令速率,包括16,25,32,56和112 GT / s。总而言之,这些功能将使Gen-Z能够跟上行业不断增长的速度需求,同时还允许将Gen-Z通信路径调整为特定的工作负载流量模式。

 

通过减少软件堆栈来实现低延迟。与传统的服务器存储和大量分层的网络堆栈不同,Gen-Z采用轻量级软件接口,直接对硬件进行内存读写操作。

 


芯片设计师需要的Gen-Z资源

 

希望成功开发Gen-Z产品的芯片设计师需要一些关键资源,具体如下:

 

Gen-Z控制器IP:SoC、交换机、存储介质控制器和其他类型的Gen-Z设备都需要可配置的高质量控制器IP才能连接到Gen-Z结构。在撰写本文时,两家IP供应商,Gen-Z联盟的成员已经宣布了Gen-Z控制器IP的当前和未来可用性。

 

Gen-Z PHY IP:初始Gen-Z实施将专注于经过验证的、部署的NRZ PHY信令技术和速度,利用16和32 GT / s的PCIe PHY和25 GT / s的IEEE802.3 PHY的可用性。后期部署可能会利用先进的PAM4 PHY信令速率,如56和112 GT / s。

 

Gen-Z验证IP:全面验证IP(VIP)工具的可用性对于保证集成在SoC之前和之后Gen-Z IP的质量至关重要。在撰写本文时,两家供应商已宣布为Gen-Z提供验证IP。

 

 

FPGA原型开发板:FPGA原型开发是确保系统级功能和互操作性的必要步骤。目前的FPGA技术允许Gen-Z原型设计高达56 GT / s(PAM4)和32 GT / s(NRZ)。还开发了连接器,以通过铜和光学连接以这些速率实现多通道Gen-Z信令。FPGA原型开发板可从多家供应商处获得,预计基于FPGA技术的Gen-Z特定原型开发平台即将推出。

 

Gen-Z联盟包括来自各个技术领域的成员,这对于构建产品生态系统至关重要,其中所有必需的硬件和软件组件彼此互操作。

 


结语

 

Gen-Z为计算机行业提供了一个独特的机会,可以利用现有的CPU内存重新定义现代计算并克服当前的挑战。随着新公司继续加入不断发展的Gen-Z开放式生态系统,构建模块、产品和服务的可用性自然会增加,并使新设计和产品能够应对新的工作负载和新出现的挑战。

 

Gen-Z为创新的高性能、低延迟解决方案提供了机会,这些解决方案将是开放、简单且经济、高效的。

 


关键字:Gen-Z结构 引用地址:带你了解一下什么叫Gen-Z结构

上一篇:加快深度学习速度,MathWorks 将提供全新GPU 加速容器
下一篇:Arm中国自主研发“周易”平台,让AI无处不在

推荐阅读

机器人行业发展至今,有过高潮,亦有过低谷,但,现阶段,商业化应用落地,成为众多厂商急于寻求的突破口。纵观整个机器人市场,不管是国内国外,应用场景、核心技术等诸多问题都困扰着机器人公司。也正因此,透过行业层层线索背后,望潮科技发现,急于商业化成为厂商们“没学会走就想要跑”的焦虑现状。用“一面是海水,一面是火焰”这句话形容现阶段的机...
/*为自已写的矩阵键盘检测+数码管显示+蜂鸣器响采用if().....else嵌套方式;编译通过,却后二列显示不出来(你找出来了吗?一个不算问题的问题)*///----------------------------------------------------------------#include <pic.h>#define uint unsigned int#define uchar unsigned char__CONFIG(0x3B31);const unsigned char table[] =...
是德科技公司(NYSE:KEYS)日前宣布,5G基站制造商创智联恒选择是德科技的终端设备仿真仪(UEE)解决方案平台UeSIM验证符合O-RAN标准的小基站性能。是德科技作为全球领先的技术公司,致力于帮助企业、服务提供商和政府客户加速创新,创造一个安全互联的世界。 创智联恒是最新加入O-RAN生态系统的制造商,选择了是德科技的UEE解决方案来验证符合O-RAN标准...
2021年11月12日,鸿海举行线上法人说明会,鸿海董事长刘扬伟分享了集团在电动车方面的整体布局。据台媒中央社报道称,明年上半年,在中国台湾,鸿海将正式销售电动巴士E-bus;中国大陆方面,将携手Gogoro制造电池模组和建立换电站;在墨西哥则规划扩充现有车用工厂规模。对于明年下半年的规划,刘扬伟谈到,美国商用电动轻型卡车供应商Lordstown Motors的...

史海拾趣

问答坊 | AI 解惑

什么是功率MOSFET?

我们都懂得如何利用二极管来实现开关,但是,我们只能对其进行开关操作,而不能逐渐控制信号流。此外,二极管作为开关取决于信号流的方向;我们不能对其编程以通过或屏蔽一个信号。对于诸如“流控制”或可编程开关之类的应用,我们需要一种三端器件 ...…

查看全部问答∨

降低FPGA功耗的设计技巧

使用这些设计技巧和ISE功能分析工具来控制功耗    新一代 FPGA的速度变得越来越快,密度变得越来越高,逻辑资源也越来越多。那么如何才能确保功耗不随这些一起增加呢?很多设计抉择可以影响系统的功耗,这些抉择包括从显见的器件选择到细小的基 ...…

查看全部问答∨

windows CE开发之基础入门

Windows CE开发之基础入门   最近一段时间,移动设备开发越来越多的成为了程序员社区的话题。移动设备主要包括智能手机和PDA,是嵌入式开发中很重要的一个方向。在智能手机领域被大多数手机厂商支持的J2ME无疑是领头羊,随着多普达推出了515手机 ...…

查看全部问答∨

大虾们快来帮忙.C#在读BMP文件是提示找不到文件.

我用VISUAL STUDIO2003编写WINCE 4.2程序, 想在窗体上画个BMP图片,这个图片我已经其它的画图工具画好了,存成了一个a.bmp文件.然后我把它拷贝到工程的debug目录下,编译后, 将exe文件和该图片一起拷贝到wince4.2设备(我的电路板)的同一个目录下,,, ...…

查看全部问答∨

7146视频采集卡问题

请问有没有人做过7146芯片的视频采集卡驱动,刚开始接触驱动开发,对过程不是很了解…

查看全部问答∨

Accurately measuring ADC driving-circuit settling time

Many modern data acquisition systems consist of highspeed,high-resolution ADCs.1 CMOS-switched, capacitorbasedADCs are often chosen for such designs due to theirlow cost and low power dissipation. These ADCs use anunbuffered front ...…

查看全部问答∨

怎样才能有效地控制堆栈溢出

                                 我用得是keil&nbsp;&nbsp;MDK3.4 芯片是STM32F103ZET6,可是最近老出些莫名奇妙的错误,有人说是堆栈溢出,在 ...…

查看全部问答∨

对学习使用MATLAB同学的几个建议

MATLAB是我们常用的工具。而快速学习和熟练掌握MATLAB对于高效完成工作很有意义。本文从亲身的经验出发,介绍一下怎样学习和使用MATLAB,这些办法都是已经被若干人证明很不错的。 1. 学习MATLAB的基础语法略过了。如果你不太确定,可以在command下 ...…

查看全部问答∨

双核F28M35的RAM问题

F28M35中单独的m3核中的ram区是怎么读写的?其中的ram分成了四个区,应该怎么使用ram呢?可以四个作为一个用吗?还是有什么说法?哪位大虾知道讲解下,如果能有个例程就更好了…

查看全部问答∨

关于功率放大的问题

现在我需要用单片机做一个100V、50Hz的三相交流电源,功率要求500w,单片机产生出的正弦波要经过功率放大电路才能把功率给提上来,这个功率放大器该如何做呢????…

查看全部问答∨
小广播
最新物联网文章
更多往期活动

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved