历史上的今天

今天是:2024年11月15日(星期五)

正在发生

2021年11月15日 | NVIDIA发布包含数十种新的、更新的加速计算库

发布者:EE小广播 来源: EEWORLD关键字:NVIDIA  软件开发  工具包  量子计算 手机看文章 扫描二维码
随时随地手机看文章

用于加速PyData生态系统量子计算、到户交付和超级计算的65个软件开发工具包,为150多种产品带来了性能提升。


 image.png


NVIDIA发布了65个全新及更新的软件开发工具包,包括库、代码样本和指南,为正在推动广泛计算挑战前沿的数据科学家、研究者、学生和开发者带来更好的特性和功能,这些新推出及更新的加速计算库再次体现了NVIDIA在软件方面的投入,及其对AI行业的承诺。


NVIDIA创始人兼首席执行官黄仁勋在其GTC主题演讲中发布了这些新增内容,其中包括用于加速量子计算、到户交付算法和图形神经网络挖掘的新一代SDK。


NVIDIA产品目录中有150多个加速计算工具包,NVIDIA开发者计划中的近300万名成员使用这些工具包,这个数字在过去五年增长了6倍。CUDA(并行计算平台和编程模型)仅在去年就被下载了700万次,自发布以来的下载次数已达到3000万次。


拓展新市场


新发布的SDK有:


NVIDIA ReOpt:用于实时物流,引入了先进的大规模并行算法,可以优化车辆路线、仓库选择和车队组合。其动态改道功能可以减少旅行时间、节省燃料成本并最大限度地减少闲置时间,这将为物流和供应链行业节省数十亿美元。


cuNumeric:用于阵列计算,实现NumPy应用编程接口,可以自动扩展到多GPU和多节点系统,而不需要修改代码。这将给使用Python的2000万名数据科学家、研究者和科学家带来重要的价值。该工具包现已在GitHub和Conda上提供,可以扩展到数千个GPU,为PyData和NumPy生态系统创造加速计算。


cuQuantum:用于量子计算,大大加快了模拟大型量子电路的速度,使量子研究者能够研究更广泛的算法和应用空间。开发者可以模拟分子的近期变异量子算法和能够识别容错的纠错算法等领域,也可以加速Atos、谷歌和IBM的流行量子模拟器


CUDA-X加速 DGL容器:用于图形神经网络,为从事具有大型图形的GNN的开发者和数据科学家提供了一种快速建立工作环境的方法。该容器使得在结合DGL和Pytorch的集成GPU加速GNN 环境中的工作变得很容易。凭借GPU加速GNN,我们可以挖掘图形中的洞察,即使是有接近一万亿条边的全球最大图形也不例外。例如Pinterest使用具有数十亿个节点和边缘的图形神经网络来了解其具有超过3000亿个Pin的生态系统。该网络基于GPU和各种经过优化的库,可用于模型的训练和推理。


Amazon Web Services机器学习总监Alex Smola表示:“我们团队十分高兴能与NVIDIA合作,通过用于图形构建的RAPIDS cuDF、用于图形采样的RAPIDS cuGraph和GNN的自定义计算内核来加速DGL。而开源的DGL也能通过亚马逊NeptuneML以托管式服务的形式提供。”


经过更新的SDK加速应用开发


众多最受欢迎的NVIDIA SDK都增强了功能并进行了升级,包括Clara、DLSS、RTX、Nsight和Isaac工具包。


其他经过更新的SDK包括:


RAPIDS 21.10:用于数据科学,提供时间序列数据处理这项新功能并对现有算法进行多项加速。适用于 Apache Spark 3.0 的 RAPIDS 加速器允许企业在不更改代码的情况下加速其在 NVIDIA GPU 上的分析操作。今年以来,NVIDIA最受欢迎的SDK之一——RAPIDS的下载量增长了400%。


Deepstream 6.0:用于智能视频分析的Deepstream 6.0引入了新的图形合成器界面,使具有最低编码能力的用户也能使用计算机视觉,还引入了可视化拖放界面,可实现简单、直观的AI产品开发流程。


Triton 2.15、TensorRT 8.2和cuDNN 8.4:用于深度神经网络,为大型语言模型提供新的优化,并且为梯度增强决策树和随机森林提供推理加速。


DOCA 1.2:用于数据中心网络,提供一个零信任的安全框架,该框架通过硬件和软件认证、线路速率数据加密、分布式防火墙和智能遥测来扩展威胁保护。


Merlin 0.8:用于推荐系统,具有预测用户下一步行动的新功能,只需很少的用户数据,甚至无需用户数据,并且支持大于GPU内存的模型。


适用于SDK的新培训课程


根据IDC预计,全球全职开发者的短缺数量预计将从2021年的140万增加到2025年的400万。该分析公司认为,创建提供教育和赋能的基础设施是弥补这一短缺的长期解决方案。


NVIDIA深度学习培训中心的两门新课程支持并加速开发者对SDK的学习和使用,为该学院的40多门课程目录增添新的内容。


“用于DPU的DOCA介绍”是一门自学课程。该课程向开发者、研究者和学生介绍

NVIDIA DOCA的基本概念。NVIDIA DOCA是一个用于在NVIDIA BlueField DPUs上实现加速数据中心计算的平台。


将于本月晚些时候推出的“构建实时视频AI应用”课程将介绍如何使用NVIDIA 

DeepStream智能视频分析工具和NVIDIA TAO工具套件将原始视频数据转化为基于实时深度学习的洞察,从而实现用于构建高性能流媒体管道的硬件加速组件。


配合新SDK的NVIDIA 深度学习培训中心课程包括:


由教师授课的“加速数据科学基础”和自学课程“加速端到端数据科学工作流”使用NVIDIA RAPIDS加速数据科学库来应用各种GPU加速机器学习算法,包括XGBoost、cuGRAPH的单源最短路径以及cuML的 KNN、DBSCAN和逻辑回归,以便执行大规模的数据分析。


“构建智能推荐系统”涵盖NVIDIA Merlin和其他用于构建高效推荐系统的基本工具和技术以及如何部署用于实时推荐的GPU加速解决方案。


关于NVIDIA


NVIDIA在1999年发明的GPU激发了PC游戏市场的增长,重新定义了现代计算机显卡、高性能计算和人工智能。公司在加速计算和人工智能领域的创新研究成果正在改变交通运输、医疗、制造等万亿美元级行业,并推动许多其他行业的发展。


关键字:NVIDIA  软件开发  工具包  量子计算 引用地址:NVIDIA发布包含数十种新的、更新的加速计算库

上一篇:NVIDIA cuQuantum SDK 创造量子计算模拟世界纪录
下一篇:MediaTek 部署人工智能前沿技术 六篇论文入选 AI NeurIPS会议

推荐阅读

        本月1日,美国司法部起诉联华电子,指控涉嫌偷窃美光DRAM技术并提供给福建晋华。日本《产经新闻》驻华盛顿记者盐原永久昨(14)日撰文,认为中美贸易战已经从单纯的贸易壁垒和关税战,演化成抓经济间谍。并且忧心如果日本企业不尽快想出应对之策,恐怕会被卷入中美贸易战之中。        盐原认为,美国对于中国来势汹汹的挑战,是...
2009年7月,三菱汽车工业公司的电动汽车“i-MiEV”上搭载了尼吉康的“充电器一体式DC-DC变流器”,这是对驱动电动汽车不可或缺的高压/低压两个电池进行充电的设备,可通过家用插座轻松充电。此外,2010年12月,日产汽车公司的第一代电动汽车“LEAF”上也采用了“车载充电器”。这些产品凝结了电源控制电路技术、电源控制软件技术、加工技术、解析技术等尖...
随着本周苹果推出带有 M1 芯片的新款 MacBook Pro,MacBook Air 和 Mac mini 机型,也标志着苹果正式从英特尔处理器过渡的开始,而这三款机型也仅仅是开始。苹果重申向 Apple Silicon 的过渡将需要大约两年的时间才能完成。苹果公司没有透露下一步哪款机型将使用 M 系列芯片,但是到目前为止,以下机型最有可能成为下一批配备 M 系列芯片...
广告摘要声明广告【文/伍勿武】在国产伺服系统企业的努力下,技术研发水平正不断提升,同时国产伺服系统市场接受度正逐步提高。据高工机器人产业研究所(GGII)数据显示,2019年伺服系统国产化率达到了22.86%。在伺服系统市场上,目前已有部分企业的伺服产品实现大规模量产,以性价比的优势满足中小型和经济型用户的需求,而从各企业布局来看,伺服系统模...

史海拾趣

问答坊 | AI 解惑

红外遥控的发射与接收

本帖最后由 paulhyde 于 2014-9-15 04:04 编辑 光谱位于红色光之外, 波长为0.76~1.5μm,比红色光的波长还长,这样的光被称为红外线。 红外遥控是利用红外线进行传递信息的一种控制系统,红外遥控具有抗干扰,电路简单,编码 及解码容易,功耗 ...…

查看全部问答∨

瑞萨发布采用片上大容量闪存和SRAM的MCU

瑞萨科技推出采用片上闪存的 32 位 MCU SH74504 和 SH74513 , 有助于汽车应用中的辅助驾驶控制系统实现“ 主动安全” 功能 , 并可实现比早期同类产品更高的性能。样品将从2009年2月开始在日本交付。 SH74504 和 SH74513 是采用瑞萨科技 SuperH ...…

查看全部问答∨

串口跟max232到底是咋接的?

我从网上找到两种相反的连接方式: 1。是串口2脚接max232的RIN 2。是串口2脚接max232的ROUT 软件仿真的时候用方式2才能正常收发数据,可是找了很多开发板来看,都是按方式一连接的。。。 很纠结,哪位高手能给个准确的答案呢!!感谢!! …

查看全部问答∨

soket编程修改网关参数

各位DX,请问怎么通过soket编程来修改网关的参数? 是这样的,我的是wince5.0或4.2的系统,想通过soket来修改IP,网关等参数,该如何实现?读网关的要用到哪些API?在网上找了好久没找到,谢谢!…

查看全部问答∨

USB与片内RC

偶还没有调试具体内容.......不过,看了香斑竹的“RC不适合USB”,太可怕了,真的么???偶熟悉的另一颗单片机,人家做的很好噢:.25%  Accuracy for USB with no ExternalComponents(不过,那个公司也确 ...…

查看全部问答∨

给大家看看我已经做好的STM8L152C6T6的美女开发板

下载 (47.24 KB) 2010-9-18 14:55 下载 (52.58 KB) 2010-9-18 14:55 下载 (45 KB) 2010-9-18 14:55 下载 (41.55 KB) 2010-9-18 14:55 下载 ( ...…

查看全部问答∨
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved