新的Arm GPU助力释放消费电子设备市场中的游戏和AI创新潜能

发布者:心有所属最新更新时间:2024-08-19 来源: eepw关键字:Arm  GPU  消费电子 手机看文章 扫描二维码
随时随地手机看文章

作为人们日常数字生活中不可或缺的一部分,Arm GPU赋能了从当今智能手机上的沉浸式游戏,到各类边缘侧人工智能 (AI) 体验的方方面面。目前,Arm合作伙伴的GPU出货量已超过100亿颗,而这一卓越成就归功于我们业界领先的生态系统。这些 GPU 广泛应用于包括智能手机、平板电脑、智能电视、机顶盒、智能手表和 XR 可穿戴设备在内的各类消费电子设备。


去年此时,我们推出了新的第五代GPU架构及一系列新的GPU,包括 Arm Immortalis-G720 GPU。 MediaTek的天玑9300 系统级芯片(SoC)平台便采用此GPU。之后,知名手机厂商vivo和OPPO的旗舰智能手机都先后采用了该芯片。

今年,我们很高兴推出第二代基于Arm第五代GPU架构构建的GPU产品,成为 Arm 终端计算子系统 (CSS) 的重要组件。其中包括新的 Arm Immortalis-G925 GPU、Arm Mali-G725 GPU 和 Arm Mali-G625 GPU,它们适用于从旗舰智能手机、高端手机,到智能手表、入门级移动设备等各类消费电子设备,这些 GPU 产品的两大设计重心:

●   作为手机游戏持续演进的一部分,实现沉浸式视觉体验

●   在主流应用中加速实现 AI 体验

出色的游戏性能

去年推出的 Immortalis-G720 在多数的图形基准测试中都以其峰值性能(每秒帧数, fps)和更长游戏时间的持续性能击败对手。通过推出 Arm 目前性能最强、效率最高的 GPU —— Immortalis-G925,我们持续推动这一出色表现。在 Arm 参考平台上进行比较时,Immortalis-G925 的性能 (fps) 比 Immortalis-G720提高了 37%。此外,在提供与 Immortalis-G720 相当的游戏性能时,Immortalis-G925 的功耗降低了 30%。

1718272591959307.png

图 Immortalis-G720对比其他SoC在领先的图形基准测试中的表现情况

这一出色性能延伸到了关键的手机游戏领域,与 Immortalis-G720 相比,Immortalis-G925 的性能平均提升了 46%。单看各款游戏,《原神》的性能提升 49%,而《Roblox》的运行速度加快 46%。其他热门手机游戏的性能提升幅度均在 29% 至 72% 之间,包括《使命召唤手游》、《暗黑破坏神:不朽》、《明日之后》、《堡垒之夜》和《绝地求生手游》。

这些令人惊喜的游戏改进对于开发者和最终的游戏玩家来说都意义非凡。

1718272616365355.png

图 Immortalis-G925整体性能提升

不断追求更逼真的游戏体验

手游内容趋势的演变是Arm持续关注的重点,用以确保我们的 GPU 产品能满足开发者和生态系统合作伙伴的需求。Immortalis-G925 也不例外,该 GPU 专为最新的游戏技术、功能和趋势而设计。而正是整个生态系统的协同合作,造就了更优异的游戏体验。

近年来,场景几何在手游领域持续发展,其可增加游戏对象的清晰度,有助于创建更逼真的地形,并为游戏角色赋予更高的真实感。事实上,随着开发者努力创建更多的场景细节和更高的真实感,热门游戏《堡垒之夜》和《原神》的几何复杂度同比增长了 9% 至 11%。

复杂的片段着色技术通过为对象和角色赋予纹理感,制作出更逼真的游戏体验。该技术可实现高质量游戏效果,如光晕、模糊和基于物理的着色。在《堡垒之夜》和《原神》中,片段着色器在 GPU 上花费的时间激增,同比增加 27% 到 43%。

为满足针对更复杂几何体的需求,Immortalis-G925引入了片段预处理 (Fragment Prepass) 的新机制。借助该图形技术,应用无需进行任何对象或原语排序,并且在处理几何工作负载时,能够更高效地减少过度绘制。通过片段预处理,我们观察到由于无需对象排序,渲染线程周期缩短高达 43%。这不仅提高了性能和能效,也减少了 CPU 的负载。

自从在 Immortalis-G715 GPU 中引入光线追踪以来,该技术正愈发普遍,其有助于创建更真实的阴影、反射和高级光照效果。Immortalis-G925 持续推动光线追踪内容的改进,对复杂对象的光线追踪性能提高了 52%。通过对光线追踪内容进行内部测试,我们正进一步提高其性能。例如,在游戏场景透明度方面保持相同准确度的同时,性能提升 27%。开发者也可选择将游戏场景透明度的准确性略微降低,由此带来高达 52% 的惊人性能提升,并降低 57% 的内存流量。

1718272651107406.png

图 Immortalis-G925光线追踪提升

增加着色器核心,以支持更多的消费市场

为应对笔记本电脑、Chromebook 和游戏手机等各类消费电子设备市场日益增长的性能需求,Immortalis-G925 所支持的着色器核心数量增加了 50%,达到 24 个核心的最大配置,而上一代最多只有 16 个。

为扩展到该性能点,图块吞吐量和命令流前端 (Command Stream Front-end, CSF) 均经过更改和优化。我们已经能够将图块吞吐量翻番,并对 CSF 进行了多项改进,包括对关键命令的硬件支持和增加硬件接口数量,以加快将作业分配给着色器核心的速度。

在新推出的 GPU 中,着色器核心的数量均已扩展。Immortalis-G925 可配置 10 个以上的核心,适用于旗舰智能手机等高性能消费技术市场。Mali-G725 可在六至九个核心之间扩展,主要针对高端手机市场。此外,它还能提供与 Immortalis-G925 相同的 API 支持,同时为 Immortalis-G925 目标范畴以外的稍低级别设备提供引人入胜的沉浸式游戏体验。Mali-G625 可在一至五个核心之间扩展,适用于智能手表和入门级移动设备。

1718272678552182.png

图  Immortalis-G925、Mali-G725和Mali-G625的核心数

AI性能提升

与前几代产品一样,我们不断提升 AI 工作负载在 GPU 上的性能和效率。作为 Arm 终端 CSS 的重要组件,Immortalis-G925 在 AI 和机器学习 (ML) 网络中的推理速度比 Arm 2023 全面计算解决方案 (TCS23) 中的 Immortalis-G720 提高了 34%。虽然大多数 AI 处理工作能够在 CPU 上进行,但 GPU 为各种 AI 用例提供加速功能,包括图像分类、图像分割、对象检测、自然语言处理和语音转文本等。

与 TCS23 中的 Immortalis-G720 相比,Immortalis-G925 作为 Arm 终端 CSS 的一部分,在关键用例中提供一系列 AI 性能改进。在图像处理方面(包括分割和分类),Immortalis-G925可实现41%的性能提升,表现抢眼。同时,在超级采样任务中,开发者可以使用神经网络对图像进行向上扩展,其性能可提高近30%,而在自然语言处理和语音转文本,性能可提高 50%,同样十分惊艳。

1718272702991100.png

图 Immoratlis-G925 AI性能提升

此外,Arm正携手生态系统合作伙伴,以提高AI性能。通过与Unity合作,我们帮助将int8支持引入面向基于 Unity 应用的ML框架Sentis。采用int8后,其性能提升44%,同时内存占用空间减少,从而改善了基于ML的移动游戏体验。

最后,作为 Arm 终端 CSS 的一部分,我们协同设计并交付 GPU 物理实现。我们携手领先的代工厂合作伙伴,实现了流片就绪的 Immortalis-G925 三纳米工艺的物理实现,助力我们的合作伙伴能够在三纳米工艺上充分发挥功耗、性能和面积 (PPA) 优势,同时通过生产就绪的芯片解决方案来缩短芯片的开发与部署时间。

生态系统协作推动图形技术进步

除了推出 GPU 新品,Arm 还致力于与游戏生态系统合作,从而带来先进的图形特性和功能。

我们正在与 Epic Games 携手,在安卓上启用其虚幻引擎 5 (Unreal Engine 5) 桌面平台渲染器。对于开发者来说,这将确保 Immortalis 和 Mali GPU 也能在移动设备上提供桌面级质量的渲染和图形效果。作为虚幻引擎 5 桌面平台渲染器相关工作的一部分,用于光线追踪的 Lumen 光照解决方案已针对 Arm GPU 进行了优化,尤其是支持基于硬件光线追踪的 GPU。使用 Lumen 的开发者可以利用我们的最佳实践建议来管理场景复杂性、更新频率和探测器设置,达到游戏主机品质的光照效果。

我们还与 Google 和 MediaTek 围绕安卓动态性能框架 (Android Dynamic Performance Framework, ADPF) 展开合作。借助这一来自 Google 的强大 API,开发者能够根据移动设备的实时热状态信息来优化其应用的用户体验和性能。在手机游戏等高要求应用中,这可以降低功耗、避免过热并延长游戏时间。通过在 Arm 技术驱动的 Google Pixel 8 智能手机上启用 ADPF,我们在 2024 世界移动通信大会 (MWC 2024) 上展示了 Steel Arms 手机游戏演示,呈现了25% 的每帧能耗减低,以及 35% 的帧速率提升。

与此同时,Arm还通过一系列GPU工具和资源,保持对游戏开发者一贯的生态系统支持。Arm Performance Studio 延续 Arm Mobile Studio 的成功,借助扩展分析工具,进一步支持移动设备和 GPU 以外的一系列新工作负载、平台和设备,包括面向服务器市场的CPU和Arm Linux平台。作为Arm Performance Studio的一部分,我们新增了Arm Frame Advisor,使开发者能够更易实现图形分析和优化,从而更准确地针对其优化目标,并更快地将软件推向市场。

为新一代AI和游戏体验而打造

随着手游和AI工作负载的不断演进,新一代 Arm GPU 可提供出色的性能和效率优势,带来无可匹敌的用户体验。之前的 Arm GPU 已应用于主要的消费电子设备中,并展现出优异的峰值和持续游戏性能,而新一代 GPU 将延续先前产品的强劲势头。

1718272732711638.png

通过Immortalis-G925、Mali-G725和Mali-G625,我们的目标是覆盖从旗舰到入门等不同级别的广泛消费电子设备,我们看到越来越多的消费者与合作伙伴要求更加沉浸式的手游和 AI 体验。我们新的 GPU 能够满足这些需求,提供无与伦比的游戏和 AI 性能。这意味着,全球数百万开发者和数十亿用户与基于 Arm 架构的设备进行交互,将获得更快、更沉浸式、更智能的视觉体验。


关键字:Arm  GPU  消费电子 引用地址:新的Arm GPU助力释放消费电子设备市场中的游戏和AI创新潜能

上一篇:MediaTek Genio 130A(MT7933) Wi-Fi6 游戏手柄方案
下一篇:如何设计一套太阳能无线信号系统

推荐阅读最新更新时间:2024-11-07 13:35

arm9 mini2440 supervivi烧写方法
一: 使用JLink V8烧写Nor Flash方法: 一. 做好准备工作: 比如安装JLink驱动,USB转串口驱动(如果是笔记本)... 二. 将开发板跳线拨到Nor端,连接好JLink,JLink另外一端连接在笔记本USB端口上,开发板上电。 三. 烧写: (1)打开 开始- SEGGER- J-Link ARM V4.081- J-Flash ARM; (2)File- Open Project,打开s3c2440a_embedclub.jflash(此文件在) (3)Options- Project settings 选择Flash,点击Select flash device,选中开发板对应Nor Flash型
[单片机]
<font color='red'>arm</font>9 mini2440 supervivi烧写方法
英伟达市值飙升 这事要从GPU说起
在过去两年里,英伟达的市值飙涨超过7倍,股价直线攀升,甚至突破了1000亿美元的关口。这样的大好形势在很大程度上受益于GPU在人工智能领域起到的关键性作用,可以说,现在几乎所有涉足人工智能的企业都在用英伟达的芯片。这让它在“一夜之间”成为了人工智能行业中举足轻重的角色。 然而,在GTC CHINA媒体见面会上,黄仁勋却说,英伟达一开始做人工智能时其实完全没有想到生意的问题。 ▲ GTC CHINA 2017 大会 放在几年前,大家对英伟达的印象,还是一个游戏显卡芯片的龙头老大。而今,它已经摇身一变,成为一家实打实的人工智能公司。 18年前,英伟达推出了全球第一个图形处理器(GPU),此后,GPU成为计算机中独立于CPU的另一个重
[嵌入式]
ARM指令ldr与str解析
S3C2440A datasheet上关于这两条指令的说明如下: SINGLE DATA TRANSFER (LDR, STR), The single data transfer instructions are used to load or store single bytes or words of data. 简单的理解就是数据的传送/存储指令。 接下来是datasheet上关于这两个指令格式的说明: {cond}{B}{T} Rd, where: LDR --- Load from memory into a register STR --- Store from a
[单片机]
提高利润率:苹果Mac会弃用Intel选择ARM
    有媒体报道称,苹果一直在考虑提高利润率,可能不再在Mac计算机中使用英特尔的处理器芯片。 苹果已经许可了ARM的技术,为iPhone和iPad开发了专用处理器,有迹象表明苹果有朝一日会对Mac如法炮制。 过去苹果曾多次更换计算机处理器。苹果在Apple II/III中使用6502处理器,推出Mac时换用了摩托罗拉68000,后来换用PowerPC,最近选用了英特尔的x86处理器。   每次换用处理器,苹果都制造了很大的后向兼容性问题,但最终都得到了客户认可。如果苹果再次更换处理器,业界人士和用户不会感到意外。   苹果决定为iPhone和iPad开发专用处理器,这样做的优势是:苹果可以利用经过特别优化的处理器开发革命性的产品
[手机便携]
智能汽车时代:消费电子企业卷入整车降价潮
越来越多做消费电子的企业也开始进入汽车行业。 在中国的优势产业中,涉及消费电子、电机、电源等领域的产业链积累了相当的动能。事实上,2023年正在迎来一股降价浪潮,而在这个时刻,我们会看到不少汽车零部件企业陷入了困境。实际上,不论是从事消费电子还是电源领域的企业,在手机等领域早已取得了巨大的成就。在这个激烈的成本竞争时期,我们也因此看到了一些手机和车机跨界融合的案例的发生。 随着2023年智能化的发展趋势不断深化,许多致力于 智能手机 、平板电脑、笔记本电脑等消费电子产品制造或供应的企业,已在积累多年的基础上,凭借技术和资源优势(包括价格和速度等),将业务扩展至智能汽车领域。目前看来,这涉及提供汽车零部件、显示屏、功率 芯片
[汽车电子]
智能汽车时代:<font color='red'>消费电子</font>企业卷入整车降价潮
基于ARM9和μC/OSII高速实时多任务数据采集的智能化设计
引言 随着IT技术、电子技术、通信技术、以及自动控制技术的飞速发展,对工业现场数据的高速实时采集就成为电子产品和工业控制技术发展不可避免的一个环节。 本文针对高速实时多任务数据采集中的多任务实现算法以及实时性、实效性和高速性的要求,提出了基于ARM9和μC/OSII操作系统的智能化设计方案,实现了任务优先级动态调度、系统工作参数动态设定、系统内部软件智能化设计,针对低速外围设备进行了系统优化,并提高了系统可靠性改善了内部任务同步性。 1 整体电路设计 整个采集系统的硬件电路如图1所示。首先利用多路调制电路对12路信号进行调制,这部分包含相应的信号转换、抗干扰、以及初步的信号处理等,使得各路采集信号能够达到ARM9内核对信号采集
[单片机]
基于<font color='red'>ARM</font>9和μC/OSII高速实时多任务数据采集的智能化设计
ARM程序优化及其在嵌入式TCP/IP协议实现中的应用
随着嵌入式技术的发展,人们对系统的智能化、小型化的要求也越来越高。基于ARM结构的微处理器以其高性能、低功耗、低价格等方面的优势被广泛应用于各种电子产品,特别是一些高端的嵌入式控制应用中,例如移动电话、工业控制、网络通信等方面。ARM技术具有很好的性能和功效,其合作伙伴包括许多世界顶级的半导体公司。可以说ARM技术几乎无处不在。 TCP/IP互联网协议族在全世界范围内已经成为开放系统互联的协议,它提供了很好的交互操作能力,可兼容多种网络技术。嵌入式技术与TCP/IP技术的结合已经展现出强劲的发展势头和巨大的市场潜力。如何开发面向 ARM的高效代码,尤其是提高类似于TCP/IP协议栈等基础性的软件模块的执行效率已成为每个从事基于AR
[单片机]
<font color='red'>ARM</font>程序优化及其在嵌入式TCP/IP协议实现中的应用
arm学习笔记二(arm寻址方式)
工作状态 arm状态 32位指令 thumb状态 16位指令 存储器的格式 最大寻址空间为4gb 大端格式:字数据的高字节存储在低地址中,低字节存放在高地址中 小端格式:与大端格式相反 axd查看寄存器 ================================================================= arm寻址方式(貌似计算机原理中学过) 处理器根据指令中给出的地址信息来寻找物理地址的方式 立即寻址 立即数寻址 示例代码如下: add r0,r0,#1; r0 --r0+1 add r0,r0,#0x3f; r0 --r0+0x3f 以十六进制表示的立即数要加0x或& 寄存器寻址 利用寄存器中的
[单片机]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved