一场座舱大模型的竞赛,正在拉开序幕。
8月,英特尔在深圳举办AI座舱产品暨车载独立显卡发布会上。
会上,其发布了首款锐炫车载独立显卡ARC A760-A,这在已经高度内卷的座舱市场,又投下一颗重磅炸弹。
英特尔副总裁、汽车事业部总经理Jack Weast在发布会上说,这是未来导向型的高性能AI产品。
ARC A760-A算力达229TOPS,搭配了16G的DDR6显存,与集成显卡相比TFLOPS高4倍;支持4K,以及最多8块独立显示屏,并搭载Xe图形引擎及XMX计算引擎。
「将独立显卡带入汽车行业,这样可以在汽车中运行大语言模型,在车里体验到在家里一样的3A PC游戏,创造如同PC般的座舱体验。」
在汽车行业,凭借在手机行业积累多年的IP、功耗等优势,高通在近几年迅速吃下了大部分智能座舱芯片的份额。
去年5月,英伟达和联发科宣布合作,将共同打造完整的AI智能座舱方案。
随着英特尔产品的接连发布,PC和移动时代的芯片巨头们,再度聚首汽车市场,座舱芯片必将迎来新一轮血雨腥风的争夺战。
早在2017年前后,英特尔曾经以车载处理器Apollo Lake进入车用芯片市场,主要服务于数字座舱、数字仪表以及娱乐系统。
这一战略随着其对Mobileye的收购,逐渐转移到智能驾驶上。
而今年CES之后,英特尔希望在座舱上首先实现「王者归来」。Jack Weast在近期的采访中表示,「我们的方向非常明确,主要注重在车内座舱这一块。」
在今年美国CES上,英特尔发布汽车业务的首款新产品:第一代软件定义汽车SoC。
加上这一次发布的独显产品,英特尔车载的产品逐渐完善。
入门级和中端车型可以搭载英特尔软件定义车载SoC,而高端车型则可以通过部署英特尔车载独显,利用其带来的强劲算力来获得更多先进功能。
一、智舱性能天花板
与目前主流的座舱芯片相比,英特尔新发布的GPU可以用性能猛兽来形容。
目前,高通正在逐渐辅货的8295座舱芯片,其AI算力一般为30TOPS。
英特尔锐炫A760-A则提供了229TOPS的平台算力,搭配了16G的DDR6的高速大容量显存,可以提供各种AI能力的组合,也是目前座舱内最强大的3D渲染芯片。
英特尔中国区技术部总经理高宇,在发布会上解释了如此高算力的考量:
「随着AI技术快速发展,必然有很多当下难以预料的场景会快速出现。所以我们呼唤车厂,把AI算力进行预置。
迎接未来两年,舱内AI应用的大爆发。」
得益于大算力、大容量显存,平台可以承载更大的模型。
从目前的优化结果来看,它直接覆盖了从6B、7B、10B、13B,甚至是18B参数规模的模型。
「今天,凡是为端侧专门设计的大模型,都可以在英特尔锐炫A760-A上流畅运行。」
A760-A还可以实现多模型并发,将不同的模型能力进行组合,从而更加出色的完成任务。
它可以 同时运行两个7B的模型来完成不同的任务,甚至可以同时运行4 - 5个2B以上的模型来实现不同的任务矩阵。
另外,A760-A还实现了超低的时延和极快的输出。
根据实测的结果,6B模型在这款显卡上,首Token的时延是0.058秒,而它的吞吐量达到了1秒88个Token,相当于150个汉字,响应速度极快。
相比之下,如果将7B的大模型压缩到30 - 40TOPS的芯片平台上,首Token的响应速度可能在3秒左右,无法实现流畅的用户体验。
在车机交互上,凭借强大的算力,英特尔的合作方中科创达,还开发了新一代座舱UI,该产品同时支持7块高清屏幕进行3D图像渲染、6个车载摄像头和交互功能。
新的UI将要求极高的3A游戏大作引入车载环境,同时还能运行AI PC丰富的应用程序,实现智能移动办公。
二、目前大模型上车的唯一解
当然,仅有算力还不够,英特尔还看准了大模型上车所带来了新机遇。
早期的车载应用,不论是导航、音乐等,更像是手机功能的补充,可能就是一个放大版的手机,车厂、Tier1不需要做太多的工作,就可以实现。
但在大模型、生成式AI时代,新型的应用无论是对算力,还是对中间的细分软件提供的服务、安全性,都提出了更高的挑战,以前的计算平台很难满足需求。
这种变化,甚至会将芯片厂商重新拉回起跑线。
英特尔副总裁、中国软件和先进技术事业部总经理李映认为,「现在生成式AI对算力的要求和对未来车载的软件定义。
实际上无论是我们还是竞争对手,都在面临一个全新的未来,大家的起点是一致的。」
他表示,现在市场上有的车机用30 - 40TOPS的算力就能跑大模型,但基本上只能做Demo展示,离真正落地还有一段距离。
要实现良好交互体验,车机上整体可能要跑一个ASR自动语音识别模型,一个2B参数的意图识别模型,一个7B的大语言模型,再加一个TTS语音合成模型,需要四个模型并发。此外,车机还要兼顾其它娱乐场景。所有这些需求在30-60TOPS算力的芯片上,基本是无法满足的。
「在可见的将来,真正能够让座舱实现大模型、3D非常良好的互动的唯一解决方案,就是今天发布的这款GPU产品。」
在发布会上,英特尔特别强调了其与国内外多个主流大模型的适配,包括智谱、商汤绝影、百川、百度等。
我们现在看到的AI应用还只是冰山一角,未来在生成式AI时代中的应用还会井喷式发展,成为AI座舱上的主流。
三、将PC生态导入汽车
芯片平台的竞争,说到底还是生态的竞争。英特尔座舱芯片的最后一块拼图,则着眼于应用生态。
除了新兴的大模型应用,英特尔对传统的ARM架构的移动应用,也做了准备。
在过去的几年当中,英特尔投入了很多的技术,解决跨指令集、跨操作系统的应用支持。其中一个很重要的技术就是投入了五六年的IBT技术,其目的是不管是基于ARM的指令集,还是其他的指令集,都可以在X86的指令集下实现无缝连接。
比如,腾讯的PC商店很大一部分是基于英特尔的IBT技术,上面已经有几千种的传统移动应用,都可以移植到X86平台。
李映表示,「我们在车载的应用是基于同样的架构,所以非常有信心,可以很好地应对未来生成式AI应用的井喷。把传统的移动应用,无缝移植到车载环境中。」
此外,Jack Weast在发布会上提到,英特尔在PC上形成的包括AI模型与工具组成的生态系统,与汽车业务的路线图完全兼容。
目前,英特尔的AI PC加速计划已经与超过100家ISV合作伙伴,实现了300项新功能,并在AI PC平台上优化了500多个AI模型。
「可以利用这个庞大的生态系统,将所有软件引入汽车,从而获得AI PC体验,无论是生产力、娱乐还是社交内容的创新。」
可以说,这次的车载GPU产品,是英特尔重回汽车市场的关键落子。
作为座舱芯片领域的后发者,英特尔势必不能只是拿出一个中规中矩的产品。
在这场车载芯片的战争中,英特尔有足够强烈的决心。
随着高通更高端的平台,以及英伟达与联发科舱驾融合方案推出,一场硬战即将开打。
- SI5344-EVB,基于 Si5344 任意频率、任意输出、抖动衰减时钟乘法器的评估板
- 使用 ROHM Semiconductor 的 BA70BC0WFP-E2 的参考设计
- 使用 California Eastern Laboratories 的 UPG2155TB 的参考设计
- LT3088IM 升压型固定输出稳压器的典型应用
- 使用 Diodes Incorporated 的 ZR78L04 的参考设计
- EASYKIT DCDC,用于带有 Easy 汽车模块的 HV 到 LV DC/DC 转换器评估套件的评估板
- LTC2159、16 位、20Msps 低功耗 ADC 的典型应用
- ADM7151 800 mA 超低噪声、高 PSRR、RF 线性稳压器的典型应用
- Panda Board, OMAP 4 Panda Board System Reference 基于 OMAP4430 SoC OMAP 处理器
- IRF610耳放