英特尔推出一颗128核心256线程的“算力炸弹”:至强6性能核处理器背后有什么技术?

发布者:EEWorld资讯最新更新时间:2024-09-27 来源: EEWORLD作者: 付斌关键字:英特尔  至强  数据中心 手机看文章 扫描二维码
随时随地手机看文章

过去三年,英特尔基于公司“四年五个制程节点”战略,持续加速推进产品创新,今年是一个重要的里程碑,其中全新的英特尔至强6处理器系列是极为关键的一个产品。


今年6月,英特尔发布了英特尔至强6能效核产品(代号Sierra Forest),为客户提供高密度计算和最佳的每瓦性能。9月26日,英特尔继续向市场投下一枚重磅的“算力炸弹”,即至强6性能核产品(代号Granite Rapids),它将为AI、数据库及科学计算等计算密集型工作负载提供最佳单核性能。尤其是最高128个核心和256条线程设计的产品,简直让人目瞪口呆。


性能更进一步的至强


英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立在发布会揭开了英特尔至强6性能核处理器的神秘面纱。



从型号上来看,至强6性能核处理器分为至强6900P、6900E、6700P、6500/6300等,其中,6900P是Granite Rapids的“完全体”,也是此次发布的重点,后续型号将在今年底和明年初陆续补齐。



具体拆解型号,后缀的“P”意味着采用的是性能核(Performance Core),代表这款产品主打便是高性能;6900和i9、i7、i5类似,代表着其顶尖强大,提供72到128核的多种规格,TDP有400W和500W两种,组合成已公开5种型号。



至强6900P作为业内首款性能核数量正式“破百”的产品,具有划时代意义,目前x86和Arm架构的产品最高只有96核水平,性能核数量要追平英特尔,起码得等到下个季度。


全新的架构设计


在设计上,这款处理器采用了灵活的架构设计,分为计算单元(Compute Die)和I/O单元(I/O Die)。


具体来说,计算单元包含了x86内核、内存控制器和缓存,而I/O单元则集成业界领先的PCle、CXL、UPI等通用协议,以及英特尔独有的加速器。通过不同的单元组合,可以更好地满足云边端在不同场景、性能及功耗方面的需求,并推出更优化的产品。


英特尔至强6900P系列配备了三个计算单元和两个I/O单元,内含多达128个x86内核。相比两年前主流服务器搭载的24至48个核的至强处理器,新产品在内核数量和整体性能上实现了显著提升。



在安全性方面,英特尔做了很多努力。客户非常关注数据安全,尤其是在云计算中。英特尔在第五代至强处理器中引入了英特尔TDX技术,提供硬件层面的机密计算架构,在英特尔至强6性能核产品中,TDX技术进一步升级至2.0版本。英特尔已与国内多家云厂商合作,积极推进TDX的应用落地。



随着至强处理器性能提升,能耗也随之增加,英特尔重视节能减排,推进液冷技术的发展。过去一年,英特尔与多家液冷厂商合作,推出了浸没式液冷和冷板式液冷方案,为数据中心提供低PUE和TCO的散热技术。英特尔还与业界许多厂商合作推出互换认证标准化模式,以推动液冷生态系统的成熟。



针对AI加速进行了优化


在AI加速方面,从第四代至强处理器开始,英特尔推出了专属指令集——英特尔®高级矩阵扩展(英特尔® AMX),这使得CPU更好地支持常见的大模型推理计算。该指令集在最新一代至强处理器中也进行了升级。


与上一代相比,至强6性能核处理器在性能和能效方面都有显著提升:内核数量从64提升至128,单核性能提升1.2倍,每瓦性能显著提升。尽管功耗增加30%至500瓦,但整体算力实现了双倍提升,能够帮助客户降低30%的总体拥有成本(TCO)。



最新的英特尔至强6性能核处理器可以运行12种常见工作负载,包括通用计算、数据库、科学计算及AI任务。比如,在Llama2和Llama3等大模型推理中,单颗CPU性能和每瓦特性能相比上一代提高了两倍以上,尤其是在AMX加速下,70亿参数的Llama2大模型推理性能提升了约3.08倍。


虽然很多AI负载运行在GPU上,但AI服务器或加速系统中绝大多数仍使用英特尔CPU处理器。因为在加速系统中,CPU需要出色的I/O性能和单核性能,以支持更快、更大的内存。英特尔与主流GPU厂商及AI生态合作伙伴建立了良好的合作关系,共同定义至强规格,提供最佳的系统体验。


此外,DC-MHS是开放计算项目OCP发布的模块化硬件系统规范,英特尔也参与了多个服务本土市场的开放算力模组规范的制定,如OCSP。未来英特尔将进一步分享相关内容。



开始引入MRDIMM技术


在计算能力提升的同时,英特尔也关注内存性能的增强。AI等工作负载对内存速度、带宽和吞吐有着极高的要求。英特尔至强6900P支持最高6400MT/s的DDR5内存,并引入了领先的MRDIMM技术,支持高达8800MT/s的数据传输速率,相较上一代5600MT/s实现了大幅提升。此外,该平台还拥有更完整的UPI接口和更多的PCle通道。



MRDIMM技术是一种创新的内存技术,它通过在内存模块上集成数据缓冲区,实现两个列的同步操作,一次向CPU传输128字节数据,而传统DRAM模块一次传输64字节。在使用MRDIMM内存的情况下,对于内存敏感型工作负载,如科学计算和AI任务,性能可以提升1.2~1.3倍。


除了更快的内存,英特尔还在推动更大的内存应用。CXL技术是英特尔发起的新技术平台,从上一代的CXL 1.0提升到这一代的CXL 2.0,能帮助客户突破物理内存限制,为数据库或大内存场景提供支持。接下来国内合作伙伴将分享他们在该领域的创新。



英特尔的朋友圈


英特尔市场营销集团副总裁、中国区云与行业解决方案和数据中心销售部总经理梁雅莉在发布会上表示,我们每天都处在飞速发展的数字浪潮中,AI已经成为各界关注的焦点,并展现出巨大的潜力。AI技术广泛应用于各行各业,如医疗辅助决策、机器视觉、金融量化交易与风险管理,以及智慧城市和智能家居。无论是个人生活还是产业发展,AI都在深刻影响着我们的社会和经济,就像当年的互联网浪潮,通过智能技术颠覆传统行业的格局和模式,重塑商业效率和产业价值链,加速各行各业的数字化进程,并推动计算产业进入新阶段。



当前,国家强调新质生产力是先进生产力的发展方向。它不仅仅是对传统商业模式的优化,也不仅仅是商业模式的微调,而是通过技术的革命性突破、生产要素的创新配置和产业的深度转型升级,催生出新质生产力。算力作为新型生产要素,结合数据和算法,能够推动经济模式的转变,加速产业升级,为新时代的崛起提供关键动力。同时,算力也是新质生产力的重要组成部分。



根据IDC的评估结果显示,15个重点国家的计算力指数每提高1个点,国家的数字经济和GDP分别增长3.6‰和1.7‰。算力指数发展到一定阶段后会产生放大效应。数据中心作为算力的主要载体,在过去近20年得到了长足发展。英特尔也在这一过程中,通过平台和产品的不断演进,持续优化数据中心架构。在云计算、大数据和AI成为普遍生产工具的今天,英特尔至强6性能核处理器为探索数据中心架构的变革奠定了坚实基础,释放了算力的价值。


英特尔至强6性能核处理器相较于上一代CPU,在计算密度、内存容量、数据处理和能效优化四个方面都得到了显著提升:


  • 计算密度:CPU核数最高可达128核,在40%的利用率下,每瓦性能提升了1.9倍,为AI、数据分析和科学计算等计算密集型业务提供了强有力的支持。

  • 内存性能:性能核处理器支持MRDIMM和CXL2.0技术,提升了内存带宽和容量,解决了CPU核数大幅提升后内存性能匹配的问题。

  • 数据安全:通过加速器技术以及TDX和SGX安全机制,支持高速、安全的数据处理,为可信服务和机密计算提供了有力支持,这是当前技术发展的核心环节。

  • 能效优化:通过CPU自身的能耗优化和先进数据中心的制冷技术,满足客户在算力大幅提升后的能效需求。



会议上,英特尔的小伙伴也纷纷介绍了基于至强6产品的相关合作:浪潮信息基于英特尔至强最新平台设计了模块化、松耦合的开源架构,满足客户多样化算力的部署需求;宁畅基于至强6性能核处理器设计了数据中心高密度系统,其设计的1U两节点和2U两节点服务器,可支持4颗至强CPU,全液冷实现100%覆盖,功率高达120kW,PUE低至1.05,极大降低TCO;阿里云基于英特尔至强6性能核开发了 “阿里云基于英特尔至强6的第九代ECS实例”;超聚变CXL内存池与英特尔至强6性能核处理器完美结合,为大家呈现两种极具性价比的使用模式;字节跳动云服务平台火山引擎第四代云服务器的一个实例基于英特尔TDX的方案打造,以机密虚拟机为核心,构建了机密计算的一个基础云服务,同时也结合了可信隐私计算的一个技术积累,共同构建了一个大模型的可信应用体系。

关键字:英特尔  至强  数据中心 引用地址:英特尔推出一颗128核心256线程的“算力炸弹”:至强6性能核处理器背后有什么技术?

上一篇:NXP全新i.MX RT700跨界MCU搭载eIQ Neutron NPU, 以高性能、低功耗赋能AI边缘
下一篇:​IAR全面支持国科环宇AS32X系列RISC-V车规MCU

推荐阅读最新更新时间:2024-11-20 18:44

Nvidia 和 AMD 天价并购案,竟都针对英特尔而来?
环球晶 11 月 30 日宣布以 45 亿美元并购世创电子(Siltronic AG),这已经是今年以来第 7 桩重大半导体并购案;总计今年以来,全球半导体产业的并购金额已经接近 1,300 亿美元,超越 2015 年时的高峰,再次刷新历史新高纪录。 根据 IC Insights 统计,2015 年全球半导体产业总并购金额为 1,077 亿美元,而今年光是加总前 6 大规模半导体业者并购金额,即达 1,250 亿美元,若再加上最新的环球晶并购案,今年半导体并购金额已经稳居历年来最高。 以环球晶 45 亿美元的并购金额来看,虽然排不上今年并购的前 5 名,但无损其对产业重大意义。首先,环球晶将透过这宗并购,从全球第 3 大跃升为第
[手机便携]
Nvidia 和 AMD 天价并购案,竟都针对<font color='red'>英特尔</font>而来?
京东与英特尔启动全量企业级业务合作
京东 与 英特尔 今天对外宣布深化战略合作,双方将在目前的合作基础上,正式启动全量企业级业务合作。   具体来看,一方面,双方将基于京东大数据平台整合、分析、利用大数据的结果,结合英特尔的云计算、物联网力量及存储和编程解决方案,针对不同应用场景输出中小企业客户偏爱的产品、配置、价格、解决方案及服务。双方将共享已有的中小企业客户数据及用户画像分析,并连同OEM合作伙伴共同制定适合于中小企业客户的产品、解决方案及服务内容。英特尔和京东共同规划的新产品及解决方案,将优先在京东平台首发及销售。   另一方面,京东与英特尔将在市场营销上展开更大规模的联动,包括联合在京东平台上进行更多新产品首发活动,并针对中小企业业务投入资源予以曝光及营销宣
[嵌入式]
英特尔移动芯片将用3D晶体管 节能不明显价格高
    北京时间12月11日消息,英特尔本周一披露了移动设备芯片的新细节。去年,英特尔推出3D晶体管架构,它与过去的设计完全不同,可以提高运算速度,减少能耗。不过,英特尔至今没有将它应用到智能手机、平板芯片中。这种技术叫“TriGate”晶体管。   在旧金山的国际电子元件会议上,英特尔披露了技术细节,提供了一些性能指标数据,准备用新版的生产制程来做到这点。不过,对于新晶体管在移动市场的好处有多大,产业专家有分歧。   一直以来,英特尔的处理器用在服务器、PC上,作为计算引擎。但是PC市场在减速,消费者转向了智能手机和平板。英特尔几年来一直尝试切入,试图凭制造追上ARM。   大多的移动设备用的是节省空间的SoC(片上系统),它将微
[手机便携]
英特尔第一财季净利34亿美元 同比下降41%
凤凰网科技讯 北京时间4月23日消息,英特尔公司(NASDAQ:INTC)今天发布了截至3月27日的2021财年第一季度财报。财报显示,按照美国通用会计准则(GAAP)计算,英特尔第一财季营收为197亿美元,较上年同期的198亿美元下降1%;净利润为34亿美元,较上年同期的57亿美元下降41%。
[手机便携]
英特尔第三波裁员,或影响供应链厂商 | 图说新闻
英特尔 再裁员,将影响供应链厂商; 中兴 再被宽限三月,剑悬头顶如何解; 高通 向 魅族 索赔5.2亿,魅族指高通专利谈判不够透明公正。精彩科技新闻,尽在每日图说。   今年四月,英特尔宣布将在全球各地进行裁员,预计裁员1.2万人,占到其全球员工总数的约为11%。英特尔的前两轮裁员主要针对的是移动设备业务,以及性能不让人满意或是缺乏商业潜力的产品线。     英特尔本月底迎来第三次裁员浪潮,主要针对全球销售和营销部门。 英特尔收缩渠道销售和营销活动,有业内人士透露,预计此项举措将会影响到英特尔生态圈的供应链厂商。     英特尔还将调整他们的报告系统。未来,位于各个国家的分部将直接向美国公司
[嵌入式]
特斯拉未来或不再采用英伟达的芯片
据报道,电动汽车制造商特斯拉将不再使用英伟达(Nvidia)公司的芯片来支持其大规模车载娱乐系统,改而使用 英特尔 公司的芯片。 据伊安-金的报道,Model 3和新版Model X及Model S等汽车就将依赖于英特尔的芯片。 目前,英伟达方面仍拒绝就伊安-金的报道置评。与此同时,特斯拉公司的代表也表示不对业界猜测发表评论。 目前来看,英伟达也为特斯拉的Autopilot自动驾驶系统提供芯片支持,或许这一合作也将好景不长。CNBC近日报道称,特斯拉也在自主研发芯片,以支持未来的无人驾驶汽车。
[嵌入式]
大幅改进物联网路线图,英特尔让物联网开发不再复杂
本文作者:英特尔公司 物联网规划与产品线管理部门总经理Jonathan Luse 在2018年国际嵌入式应用展览会(Embedded World 2018)上,英特尔向物联网开发者和集成商传递了这样一个声音:我们会尽最大努力帮助大家更快地制作原型,推进理念,从而尽早推出解决方案。 英特尔物联网事业部已经与众多物联网开发者及合作伙伴进行了深入地沟通,并仔细了解了他们的想法。据此,英特尔全面改善了针对开发者工具和物联网解决方案资源的路线图,旨在为整个生态系统带来更为优质的无缝体验。 新元件 英特尔展示了英特尔® FPGAs和Movidius™ Myriad™ 2 VPUs,这些组件可以高效能地为边缘应用加速。英特尔的
[网络通信]
富士通接受平板电脑订单 配备新英特尔芯片
北京时间5月11日,据国外媒体报道,日前富士通公司开始接受其Stylistic Q550 Slate平板电脑的订单,该产品是最早使用Oak Trail处理器的平板电脑产品之一。该处理器是英特尔公司专门为平板电脑设计的第一款处理器。 该平板电脑有两种类型,30G固态硬盘,双单元电池版售价729美元,62G固态硬盘,四单元电池版售价849美元。它将在6月份全面投放美国市场。该产品配置了英特尔凌动Z670处理器,即Oak Trail。在今年四月中旬北京举行的英特尔开发者论坛上,该处理器被正式发布。时钟频率为1.5GHz,并配置特制加速器以支持1080p高清视频回放。 富士通在二月初发布该产品,主要面向商业用户。该产品使用 Windo
[半导体设计/制造]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved