深度丨天玑9400发布,手机处理器用上PC级CPU架构
·聚焦:人工智能、芯片等行业
欢迎各位客官关注、转发
10月9日,联发科技(MediaTek)正式发布了其旗舰级5G智能体AI芯片——天玑9400。
该芯片采用了台积电的第二代3nm制程工艺,并搭载了第二代全大核架构的CPU。
本代旗舰芯片的CPU将天玑9300的4个超大性能核心之一升级为了Arm最新推出的Cortex-X925核心(主频高达3.62GHz)。
同时,还配置了3个Cortex-X4超大核(主频为3.3GHz)以及4个Cortex-A720大核(主频为2.4GHz)。
这些配置使得天玑9400在单核性能上相较天玑9300提升了35%,多核性能则提升了28%。
联发科追求的是低能耗与高性能的双重优势,而非单纯追求极致的IP频率。
这一目标,正是通过全新的CPU全大核架构得以实现。
其中,Cortex-X925核心因其高达3.62GHz的主频以及PC级的IPC性能表现,被赋予了[超超大核]的美誉。
Cortex-X925作为Arm最新推出的性能核心,专为3nm工艺打造,采用了PC级别的架构设计,为处理器提供了更为强大的性能支撑。
此外,Cortex-X925还引入了矢量管线技术,该技术在Integer8计算性能(TOPS)方面实现了50%的提升。
然而,尽管Cortex-X925在主频上表现出色,但与高通即将推出的骁龙8 Gen 4的CPU超大核主频相比仍有所不及。
这反映了在当前摩尔定律放缓的背景下,IC性能已呈现出高度冗余甚至过剩的趋势。
因此,如何在性能和功耗之间找到最佳平衡点以实现优异的设计体验成为了芯片设计者面临的重要挑战。
而联发科技在天玑9400上所采用的全 大核CPU架构设计以及对于IP选择的审慎考量正是对这一挑战的有力回应。
天玑9400相较于其前代产品天玑9300,实现了显著的性能提升,具体表现为单核性能提升了35%,多核性能提升了28%。
在安兔兔跑分测试中,天玑9400在实验室环境下的成绩已突破300万分大关,这进一步印证了其强大的性能表现。
GPU及NPU提升,再度拉高AI性能
在 GPU方面,天玑9400搭载了全新的顶级12核GPU Immortalis-G925,其峰值性能相较于上一代实现了显著提升,达到了41%的增幅,同时功耗降低了44%,光追性能也提升了40%。
此外,天玑9400还支持PC级的天玑OMM追光引擎和星速引擎超分技术,这两项技术均代表了业内的最先进水平,支持业内最先进的插帧技术和超分技术。
从这些数据可以看出,天玑9400在CPU和GPU方面均实现了性能的飞跃,同时功耗控制也达到了极高的水平,这无疑是物理学原理在技术创新中的一次精彩应用。
在NPU方面,天玑9400集成了第八代AI处理器NPU 890,联发科以[慧、强、密]三字概括其卓越能力。
NPU 890的加入,使得天玑9400在AI性能和能效方面均实现了显著提升。
在ETHZAIBenchmark v6.0的跑分测试中,天玑9400取得了6773分的优异成绩,位居手机芯片AI性能榜首。
随着CGN(即CPU、GPU、NPU)性能的飞跃式提升,其与内存传输速度之间的鸿沟日益显著,这一现象被业界形象地称为[内存墙],它成为了制约芯片整体算力提升的关键因素。
为有效应对这一挑战,天玑9400开创性地引入了三星LPDDR5X 10.7Gbps技术,该技术引领移动内存领域新风尚,其性能相较于前代产品实现了25%的显著提升。
此外,天玑9400还依托其独特的[黑鹰]架构设计,进一步优化了缓存布局,使得缓存与CGN之间的距离大幅缩短,从而极大减少了数据传输所需时间。
在具体能力上,天玑9400支持端侧LoRA训练,并首发了端侧高画质视频生成功能。
同时,其大语言模型的提示词处理性能提升了80%,进一步增强了对图片、文字、数字相对关系的理解能力,而功耗则降低了35%。
此外,天玑9400还兼容市面上主流的大模型,包括阿里云、百川智能和Google等。
补充AI应用场景,实现AI跨应用的串联
当前, AI 行业的发展正面临挑战,各大AI明星公司的产品在具体应用场景上尚显不足。
然而,近期诺贝尔物理学奖授予[AI教父]的荣誉,无疑为AI领域注入了新的活力。
在智能手机这一AI应用的理想平台上,经过数月的软硬件迭代,天玑9400的问世为用户带来了全新的AI体验。
联发科正积极与各行业APP开发者合作,为AI智能体、第三方应用程序和大模型之间提供统一的标准接口,以实现AI跨应用的串联。
AI智能体化引擎的引入,更是将传统AI应用推向了更高级别的智能体化应用阶段。
该设备集成了DAE(Dimensity AgenticAIEngine),一种AI智能体化引擎,赋予了手机主动思考、计划并执行任务的能力。
它显著增强了设备的自主学习与决策能力,能够主动适应并优化用户习惯,进而提供更加个性化、智能化的服务体验。
天玑9400通过一系列创新技术实现了对大模型的高效优化,包括硬件支持的低位宽KV缓存技术、GQA(图查询语言)的应用以及内存使用的优化策略。
这些措施共同提升了AI任务的执行速度和精度。
在AI端侧落地方面,天玑9400打破了传统[云训练、端推理]的模式,业界首发了LoRA训练技术。
这一创新使得用户能够直接在本地设备上进行模型训练,实现了推理与训练的双重加速。
此举不仅降低了对云端资源的依赖,还显著减少了数据传输延迟与带宽消耗,从而提升了整体处理速度。
同时,它也有助于用户更好地掌控个人隐私,有效避免了数据泄露的风险。
端侧AI训练的另一突出优势在于其能够深化手机AI对用户的理解。
相比传统的云侧训练模式,端侧训练能够基于用户的日常使用数据进行持续累积训练。
这意味着手机AI将能够更准确地捕捉用户的偏好和习惯,随着时间的推移而不断优化服务体验。
AI革新手机行业,开启新一轮创新周期
尽管苹果公司于 2024年9月推出了iPhone 16系列,但由于其创新动力不足,该系列上市后的销量远未达到市场预期。
与此形成鲜明对比的是,以人工智能为代表的新技术革新正引领智能手机行业进入[新一轮创新周期]。
在此背景下,2024年已被业界公认为[AI手机普及元年]。据知名研究机构预测,该年全球新一代AI手机的出货量将达到1.7亿部,占智能手机整体出货量的约15%。
更令人瞩目的是,预计至2027年,AI手机的复合增长率将高达73.47%。
面向2025年,旗舰移动芯片在支持端侧AI方面的能力将成为决定其竞争优势的关键因素之一。
自2023年起, 众多手机品牌已着手将自主研发的AI大模型集成至手机产品中。
相较于云端AI,端侧AI因其部署于本地,具备更高的数据安全性、更快的响应速度以及更为流畅稳定的运行表现。
然而,核心挑战在于,受限于手机计算能力的局限性,当前大多数端侧大模型的参数规模相对较小,进而限制了AI体验的进一步拓展,使得处理较为复杂AI任务时仍需依赖云端AI的支持。
因此,未来谁能率先在端侧AI领域实现技术突破,颠覆传统AI体验,便能在即将到来的市场竞争中占据有利位置。
在此过程中,一个至关重要且基础性的环节便是拥有具备更高AI计算能力、能够支持更大规模参数端侧AI的先进芯片。
SoC定义AI手机,3nm带来新机遇
随着上半年销售数据的公布,智能手机市场的复苏趋势已得到进一步确认。
在这一过程中,[AI手机]作为频繁被提及的关键词,已成为推动市场复苏的重要力量。
大模型入端标志着AI大模型发展的新阶段,智能手机作为过去十几年中最为重要的移动终端,被赋予了双重使命:
既要推动大模型的商业化变现,又要利用大模型为自身带来新的增长点。
然而,与手机品牌和机构的热情高涨相比,消费者对AI手机的概念仍然缺乏清晰的认识,使用体验也存在诸多不足。
这主要归因于AI手机的硬件核心——SoC(系统级芯片)尚未达到理想状态。
权威调研机构IDC和Counterpoint均对AI手机给出了明确定义,并一致将手机SoC作为评判AI手机的重要标准。
IDC认为,AI手机应搭载满足AI算力需求的移动端芯片,并集成深度学习AI功能,其NPU(神经网络处理器)算力需大于30 TOPS。
而Counterpoint则强调,AI手机需具备集成或独立的神经网络运算单元(如APU、NPU、TPU),以确保强大的AI算力。
按照上述标准审视市场上的AI手机,真正符合要求的产品并不多。
目前,仅有天玑9300、苹果A17 Pro、高通骁龙8Gen3等少数几款SoC的算力达到了[过线]标准,而搭载这些芯片的AI手机数量也相对有限。
相较于苹果A17 Pro所采用的初代3nm制程,天玑9400所采用的第二代3nm制程在技术上更为成熟。
同时,与天玑9300所采用的4nm制程相比,天玑9400在整体设计上也有了更大的发挥空间。
结尾:
手机 SoC芯片市场的格局,已趋于稳定态势。在安卓阵营中,除去iPhone的独特地位,其开放芯片生态系统主要围绕联发科与高通两大品牌展开。
AI手机的诞生将智能手机市场的竞争与手机SoC紧密地联系在一起,同时也将创新的压力从手机品牌转移到了SoC厂商身上。
部分资料参考:华尔街见闻:《天玑9400:顶级SoC芯片设计思路解构》,电脑报:《为什么说天玑9400是下一个时代的AI芯片?》,雷科技:《天玑9400首发实测:更强的全大核,稳稳的旗舰神U》,芯东西:《三年追超苹果,从能效比到端侧AI,联发科为高端芯片树立新标杆》,硅星人Pro:《联发科打响手机芯片[卷AI]的第一枪》,壹观察:《天玑9400:趋势之芯,赢在未来之道》,远川研究所:《天玑9400问世:旗舰SoC竞争升级》,虎嗅APP:《谁是高端旗舰手机的幕后推手?》
本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。
推荐阅读: