芯原戴伟进:大模型已经来到了边缘

发布者:EEWorld资讯最新更新时间:2024-06-13 来源: EEWORLD作者: 付斌关键字:芯原  NPU  IP 手机看文章 扫描二维码
随时随地手机看文章

6月13日,在芯原AI专题技术研讨会上,芯原执行副总裁、IP事业部总经理戴伟进分享了大模型时代,边缘计算变革的机遇与挑战。



“大模型已经来到了边缘。”戴伟进表示,AGI大模型正在从AI Everywhere走到AI for Everyone。各行各业都在推广大模型,现在数据中心正在将大型人工智能模型引入嵌入式系统,首先落地的边缘设备包括手机、AI PC、汽车。



具体到芯原边缘端的产品,神经网络处理器 (NPU)方面, 已在全球累积出货超过1亿颗,已被72家客户用于其128款人工智能芯片中,拥有超过10个市场应用领域


图形处理器 (GPU) 方面,已在全球累积出货近20亿颗,经过近20年的嵌入式市场耕耘,目前芯原已经拥有70项国内外专利,近千万辆汽车搭载了芯原的IP。芯原GPU得到了各种广泛的应用,其核心技术在于图形运算及渲染、 3D 建模、2D或 3D图形加速等图形处理,适用于大型并行运算应用,以及云游戏、大型桌面游戏。


视频处理器 (VPU)方面,已经达到全球领先水平,该产品能够利用AI赋能智能视频处理,实现预测性视频质量优化,专用视频处理单元,可以实现高密度、超低时延流媒体,同时具备成本效益规模,帮助视频协作、云游戏以及交互式流媒体不断加速。


芯原AI-Computing IP 产品覆盖数据中心、边缘服务器、嵌入式设备三个场景,包括VIP9X00 NPU IP、CC8X00 GPGPU IP、GC9X00AI NPU+GPU IP、CCTC-MP Tensor Core GPU IP。



在软件框架上,芯原针对图形、通用GPU、AI三大方向优化,结合芯原的Acuity工具包,这款强大的IP支持含PyTorch、ONNX和TensorFlow在内的所有主流框架。



芯原的NPU IP拥有全球领先的性能,实际测试,可以在2秒以下处理20步Stable diffusion 1.5,LLaMA2 7B则达到了20 Tokens/s。



早在第十三届芯原CEO论坛上,芯原就对大模型的未来进行了五大预测:

  • 与无差异化的多模态大模型相比,以语言为基础的多模态大模型会成为主流;

  • 2028年,中国基础大模型的数量将少于10个;

  • 2028年,用于端侧微调卡和推理卡的销售额将超过用于云侧的训练卡;

  • 2026年,内置AIGC的手机将成为中高端手机的主流,是中高端手机换机的主驱动力;

  • 2026年,全球双目全彩AR眼镜出货量将突破1,000万台。


在Chiplet方面,针对AIGC应用,芯原设计开发所需的平台化的Chiplet方案及相关技术,并提供从Chiplet、Die-to-Die接口、封装到软件的整体解决方案。


回顾历史,2001年芯原在上海成立,成为落地张江的第一批芯片设计公司之一。2020年芯原股份在科创板上市。


截止至2023年12月底,公司员工总数为1,864人,其中89%为研发人员;张江716人,成都781人,南京229人。2022年35%销售收入来自境外;95%研发人员在国内。


目前,芯原的半导体IP授权业务销售收入达到全球第七,在中国则达到第一,知识产权授权使用费收入全球第五,IP种类全球第二。

具体从每种芯片来看,2023年全年,在芯原IP授权业务收入中 (包括知识产权授权使用费、特许权使用费) ,图形处理器GPU IP,神经网络处理器NPU IP和视频处理器VPU IP收入占比合计约72%。


芯原提供芯片设计平台即服务(Silicon Platform as a Service, SiPaaS),即从无制造 (Fabless) 到轻设计 (Design-lite)。从2016到2019,4年4代产品成功流片与量产,第一代从规格定义到流片16个月,后两代从规格确定到流片9个月,首次流片即量产。


此外,芯原还提供一站式设计服务。芯原拥有14nm/10nm/7nm/5nm FinFET和28nm/22nm FD-SOI工艺节点芯片的成功流片经验,同时已有5nm SoC一次流片成功,多个一站式服务项目正在执行,可提供包含软件支持的整体解决方案,设计能力获得全球知名企业客户的认可,且晶圆厂中立。

关键字:芯原  NPU  IP 引用地址:芯原戴伟进:大模型已经来到了边缘

上一篇:嵌入式技术正在大变革
下一篇:芯原查凯南:NPU如何推进嵌入式智能设备发展

推荐阅读最新更新时间:2024-11-16 22:20

新思科技联合Elektrobit推出用于ARC功能安全处理器IP的EB tresos Classic AUTOSAR软件
为加快早期软件开发,Elektrobit将其Classic AUTOSAR软件移植到新思科技的ARC EM 和HS功能安全处理器上 基于ARC处理器的硬件和软件平台让汽车芯片开发者能够根据AUTOSAR标准快速开发关键安全功能 组合解决方案支持用于单芯片汽车解决方案的集成安全管理器,可降低系统成本,减少芯片功耗和面积,并提高实时响应速度 新思科技(Synopsys, Inc. , 纳斯达克股票代码:SNPS)近日宣布,为汽车行业提供嵌入式互联软件产品的全球供应商Elektrobit (EB)为其符合ASIL-D的DesignWare®ARC® EM及ARC HS功能安全(FS)处理器IP提供EB tresos Clas
[汽车电子]
满足智能电视应用MIPS祭六核心处理器IP
    多萤串流趋势兴起将带动智慧电视SoC全面升级。Android 4.0、Windows 8作业系统力拱手机、平板及电视多萤(Multi-screen)影音串流应用,导致智慧电视(Smart TV)SoC须在维持低成本的前提下,扩增时脉、视讯编解码转换、Miracast无线显示及资讯安全保护机制。为此,美普思(MIPS)已打造六核心矽智财(IP)设计和完整Android开发工具,将助力品牌厂大幅增强智慧电视效能。 美普思策略行销总监Kevin Kitagawa表示,手机与平板将加速成为数位家庭中与电视连结的互动式第二萤幕,以实现多萤影音串流。 美普思策略行销总监Kevin Kitagawa表示,A
[手机便携]
基于FPGA IP核的线性调频信号脉冲压缩
近年来,随着现场可编程门阵列(FPGA)在雷达信号处理中的广泛应用以及FPGA芯片技术的发展,为大家提供了一种较好解决数字脉压的途径。其中,利用 IP核 设计FPGA数字系统成为一种趋势,这些知识产权核可以大大简化 FPGA 的设计,加快设计速度,缩短研发周期,而且经过不断的优化,IP核具有了更好的精度和更快的运算速度,实际的工程应用效果很好。   本文以此为出发点,对线性调频信号的脉冲压缩进行了研究,仿真,并提出了一种采用IP核设计脉冲压缩的方法。   1 线性调频信号的脉冲压缩   1.1 脉冲压缩的实现原理   脉冲压缩可以采用“共轭滤波器对”的匹配滤波法和相关处理法。匹配滤波法对应于频域相乘,相关处理法对应于
[嵌入式]
基于FPGA <font color='red'>IP</font>核的线性调频信号脉冲压缩
基于C8051f020单片机和UDP/IP协议实现地震勘测传感器网络的设计
随着地震勘测技术向着精细测量方向发展,有必要对频带宽、灵敏度高、失真度小的地震检波技术进行深入的研究。同时,在勘测现场要按一定方式放置一组检波器,将这一组检波器的数据进行综合分析,从而得出相应的勘测结果。 本文根据地震勘测原理,提出一种构建地震勘测传感器网络的方案:将各节点信息传输到监控PC机,采用虚拟仪器技术,使用Labview编写运行在PC机上的测控软件,进行相应的数据分析和处理;基于全光纤迈克尔逊干涉系统,采用交流相位跟踪零差检测技术(PTAC),实现对待测信号的精确检测和误差信号的补偿,减小信号漂移对系统的影响;采用C8051f020单片机对解调后的信号进行采样,并将相关数据通过UDP/IP协议进行网络传输。方案实现了
[单片机]
基于C8051f020单片机和UDP/<font color='red'>IP</font>协议实现地震勘测传感器网络的设计
基于交互式网络的IP机顶盒功能及未来发展
IPTV(Internet Protocol TV or Interactive Personal TV)也叫交互式网络电视,是利用宽带网的基础设施,以家用电视机或计算机作为主要终端设备,集互联网、多媒体、通信等多种技术于一体,通过IP协议向家庭用户提供包括数字电视在内的多种交互式数字媒体服务的崭新技术。IPTV业务核心框架主要由内容运营平台、业务运营平台、业务承载传输网络、用户终端网络等四大部分组成。IPTV技术涉及了视频编解码、网络分发、数字版权保护、终端接入等各面的技术。 IP机顶盒是视频解码终端,相当于一台自带嵌入式操作系统的计算机。从图1可以看出,IP机顶盒一端通过DSL或以太网方式接入IPVT网络,一端将通
[家用电子]
华为发布汇聚型IP微波产品和Gb/s IP微波新版本
    华为近日在世界移动通信大会(Mobile World Congress 2011)上发布业界唯一一体化汇聚(Nodal)微波产品RTN980,支持Hybrid和纯分组汇聚。同时,发布支持单通道1Gb/s的RTN900系列新版本,两大新品的发布完善了华为端到端的IP微波方案,充分满足了移动宽带业务发展需求。     本次发布的RTN980是目前业界集成度最高的汇聚型微波产品,该设备仅有5U高(22cm),支持14个方向的汇聚,并具备汇聚28个方向的演进能力,同时支持TDM和分组交叉能力,满足TDM向未来全IP时代的演进需求,分组交叉容量高达22G,满足高密度微波部署时的汇聚需求。     新版本RTN900系列产品包
[网络通信]
NiosII的I2C控制IP及其在成像系统中的应用
摘要:详细介绍一种I2C控制IP的工作原理及其可编程寄存器,给出该IP在CMOS数字成像中的应用实例。该实例基于可编程片上系统(SOPC)技术设计,在NioslI IDE中通过编写程序来实现系统功能,并通过QuartusII软件自带的SignaITapII进行验证。结果表明,在CMOS成像领域选用该IP核,系统能充分利用SOPC技术的优势,具有扩展性好、控制灵活、开发周期短等特点。 关键词:SOPC;I2C控制IP;CMOS 1 IP的硬件结构及寄存器 1.1 IP硬件结构 IP内部结构如图1所示。主要由波特率时钟寄存器、寄存器组控制器、并行I/O接口、I2C可编程接口、I2C接口引擎5个模块组成。波特率时钟产生器用来
[工业控制]
NiosII的I2C控制<font color='red'>IP</font>及其在成像系统中的应用
与ARM扩展合作关系,进一步满足消费和网络应用先进片上系统设计的需求
进一步增强芯原为关键的垂直市场提供的片上系统应用平台       中国上海,2007年5月9日 ——芯原股份有限公司(芯原)和ARM公司(伦敦证交所:ARM;纳斯达克:ARMHY)今天宣布,芯原获得ARM926EJ-STM处理器的授权。ARM不仅将向芯原提供ARM922TTM 处理器和ARM7TDMI处理器,通过这一授权协议,芯原还将作为ARM授权设计中心,拓展目前基于ARM926EJ-S软核处理器的解决方案,打造具有综合功能、可配置的缓冲存储系统,还将增强芯原针对音频/视频、语音和多媒体等消费电子应用提供ASIC交钥匙设计的实力。     通过这一授权协议,芯原将能够直接为客户提供适用于任何代工工厂或加工点的基于ARM技术的设
[焦点新闻]
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved