历史上的今天

今天是:2024年11月15日(星期五)

2021年11月15日 | NVIDIA发布包含数十种新的、更新的加速计算库

发布者:EE小广播 来源: EEWORLD关键字:NVIDIA  软件开发  工具包  量子计算 手机看文章 扫描二维码
随时随地手机看文章

用于加速PyData生态系统量子计算、到户交付和超级计算的65个软件开发工具包,为150多种产品带来了性能提升。


 image.png


NVIDIA发布了65个全新及更新的软件开发工具包,包括库、代码样本和指南,为正在推动广泛计算挑战前沿的数据科学家、研究者、学生和开发者带来更好的特性和功能,这些新推出及更新的加速计算库再次体现了NVIDIA在软件方面的投入,及其对AI行业的承诺。


NVIDIA创始人兼首席执行官黄仁勋在其GTC主题演讲中发布了这些新增内容,其中包括用于加速量子计算、到户交付算法和图形神经网络挖掘的新一代SDK。


NVIDIA产品目录中有150多个加速计算工具包,NVIDIA开发者计划中的近300万名成员使用这些工具包,这个数字在过去五年增长了6倍。CUDA(并行计算平台和编程模型)仅在去年就被下载了700万次,自发布以来的下载次数已达到3000万次。


拓展新市场


新发布的SDK有:


NVIDIA ReOpt:用于实时物流,引入了先进的大规模并行算法,可以优化车辆路线、仓库选择和车队组合。其动态改道功能可以减少旅行时间、节省燃料成本并最大限度地减少闲置时间,这将为物流和供应链行业节省数十亿美元。


cuNumeric:用于阵列计算,实现NumPy应用编程接口,可以自动扩展到多GPU和多节点系统,而不需要修改代码。这将给使用Python的2000万名数据科学家、研究者和科学家带来重要的价值。该工具包现已在GitHub和Conda上提供,可以扩展到数千个GPU,为PyData和NumPy生态系统创造加速计算。


cuQuantum:用于量子计算,大大加快了模拟大型量子电路的速度,使量子研究者能够研究更广泛的算法和应用空间。开发者可以模拟分子的近期变异量子算法和能够识别容错的纠错算法等领域,也可以加速Atos、谷歌和IBM的流行量子模拟器


CUDA-X加速 DGL容器:用于图形神经网络,为从事具有大型图形的GNN的开发者和数据科学家提供了一种快速建立工作环境的方法。该容器使得在结合DGL和Pytorch的集成GPU加速GNN 环境中的工作变得很容易。凭借GPU加速GNN,我们可以挖掘图形中的洞察,即使是有接近一万亿条边的全球最大图形也不例外。例如Pinterest使用具有数十亿个节点和边缘的图形神经网络来了解其具有超过3000亿个Pin的生态系统。该网络基于GPU和各种经过优化的库,可用于模型的训练和推理。


Amazon Web Services机器学习总监Alex Smola表示:“我们团队十分高兴能与NVIDIA合作,通过用于图形构建的RAPIDS cuDF、用于图形采样的RAPIDS cuGraph和GNN的自定义计算内核来加速DGL。而开源的DGL也能通过亚马逊NeptuneML以托管式服务的形式提供。”


经过更新的SDK加速应用开发


众多最受欢迎的NVIDIA SDK都增强了功能并进行了升级,包括Clara、DLSS、RTX、Nsight和Isaac工具包。


其他经过更新的SDK包括:


RAPIDS 21.10:用于数据科学,提供时间序列数据处理这项新功能并对现有算法进行多项加速。适用于 Apache Spark 3.0 的 RAPIDS 加速器允许企业在不更改代码的情况下加速其在 NVIDIA GPU 上的分析操作。今年以来,NVIDIA最受欢迎的SDK之一——RAPIDS的下载量增长了400%。


Deepstream 6.0:用于智能视频分析的Deepstream 6.0引入了新的图形合成器界面,使具有最低编码能力的用户也能使用计算机视觉,还引入了可视化拖放界面,可实现简单、直观的AI产品开发流程。


Triton 2.15、TensorRT 8.2和cuDNN 8.4:用于深度神经网络,为大型语言模型提供新的优化,并且为梯度增强决策树和随机森林提供推理加速。


DOCA 1.2:用于数据中心网络,提供一个零信任的安全框架,该框架通过硬件和软件认证、线路速率数据加密、分布式防火墙和智能遥测来扩展威胁保护。


Merlin 0.8:用于推荐系统,具有预测用户下一步行动的新功能,只需很少的用户数据,甚至无需用户数据,并且支持大于GPU内存的模型。


适用于SDK的新培训课程


根据IDC预计,全球全职开发者的短缺数量预计将从2021年的140万增加到2025年的400万。该分析公司认为,创建提供教育和赋能的基础设施是弥补这一短缺的长期解决方案。


NVIDIA深度学习培训中心的两门新课程支持并加速开发者对SDK的学习和使用,为该学院的40多门课程目录增添新的内容。


“用于DPU的DOCA介绍”是一门自学课程。该课程向开发者、研究者和学生介绍

NVIDIA DOCA的基本概念。NVIDIA DOCA是一个用于在NVIDIA BlueField DPUs上实现加速数据中心计算的平台。


将于本月晚些时候推出的“构建实时视频AI应用”课程将介绍如何使用NVIDIA 

DeepStream智能视频分析工具和NVIDIA TAO工具套件将原始视频数据转化为基于实时深度学习的洞察,从而实现用于构建高性能流媒体管道的硬件加速组件。


配合新SDK的NVIDIA 深度学习培训中心课程包括:


由教师授课的“加速数据科学基础”和自学课程“加速端到端数据科学工作流”使用NVIDIA RAPIDS加速数据科学库来应用各种GPU加速机器学习算法,包括XGBoost、cuGRAPH的单源最短路径以及cuML的 KNN、DBSCAN和逻辑回归,以便执行大规模的数据分析。


“构建智能推荐系统”涵盖NVIDIA Merlin和其他用于构建高效推荐系统的基本工具和技术以及如何部署用于实时推荐的GPU加速解决方案。


关于NVIDIA


NVIDIA在1999年发明的GPU激发了PC游戏市场的增长,重新定义了现代计算机显卡、高性能计算和人工智能。公司在加速计算和人工智能领域的创新研究成果正在改变交通运输、医疗、制造等万亿美元级行业,并推动许多其他行业的发展。


关键字:NVIDIA  软件开发  工具包  量子计算 引用地址:NVIDIA发布包含数十种新的、更新的加速计算库

上一篇:NVIDIA cuQuantum SDK 创造量子计算模拟世界纪录
下一篇:最后一页

推荐阅读

昨天波音公司旗下极光飞行服务公司宣布了一项重大消息,它们推出的名为奥德修斯(Odysseus)的高空伪卫星要在2019年春天开始第一次飞行计划!该卫星采用先进的太阳能电池和轻质材料制成,仅靠太阳提供动力就能有效地无限飞行,并号称拥有当今持久性太阳能航空中最大的有效载荷能力,简直就是地表最强!奥德修斯(Odysseus),是古希腊神话中的英雄,对应罗...
简介 双象限电源可以为相同的输出端口提供正电压或负电压,而采用LT8714 4象限控制器可以轻松制造出这种电源。此处所示的双象限电源可用于多种应用,从玻璃贴膜(更改极性会改变晶体分子的排列)到测试测量设备,应用广泛。 Lt8714数据手册描述了双象限电源在第一个象限(正输入、正输出)和第三个象限(正输入、负输出)的工作方式。注意,在这两个象限中...
三星和华为等智能手机公司开始进入第二代可折叠手机的时代,而苹果仍在开发其首款可折叠 iPhone。近日有不少报道指出,苹果正在稳步推进可折叠手机的开发。现在,一份新的报告表明,当苹果推出可折叠的 iPhone 时,它将停售 iPad mini 这一产品类别。其背后的原因是,即将到来的可折叠 iPhone 将是 iPhone 和 iPad mini 的结合体,并将运行 ...
据报道,最近,特斯拉开始在旗下的超级充电站安装“星链”卫星宽带的天线,为充电的特斯拉车主们提供网络接入服务。  美国电动车制造商特斯拉和民营太空公司都是马斯克掌管的“兄弟企业”,特斯拉除了制造电动车之外,也在全球各地建设超级充电站网络。媒体指出,特斯拉超级充电站目前在市场上提供了体验最好的充电服务。  目前,其他的电动车充电站网...

史海拾趣

问答坊 | AI 解惑

使用Nios II 9.1 SP1 SBTE的Flash Programmer的几点注意事项.[Nios II]

自从Altera公司推出Nios II  9.1 Software Build Tools for Eclipse(简称Nios II 9.1 SBTE),许多新特性的引入,令众多使用者感到欣慰,尤其是在编译的速度上。但是Nios II 9.1 SBTE并不完美,譬如说无法调用用户自定义外设的HAL文件、 ...…

查看全部问答∨

can I use file system filter driver in windows ce 4 and above

I wrote a file system filter driver under xp using ifs 2003, don\'t know if can copy that to windows ce 4 and above?…

查看全部问答∨

2440下16C554串口扩展问题

平台 2440 系统 wince 5.0 芯片 TL16C554a    利用微软的16550的代码架构驱动16C554,通过修改pdd层,配置相关的注册表项,目前系统已经可以加载4个串口了,利用调试软件可以打开,关闭。由于扩展的4个串口目前不对外使用,为内部提 ...…

查看全部问答∨

wince6.0 flash动画 API

最近在wince6.0上面开发flash R3包里面有个adobe flash lite activex control插件 是支持flash动画的 这个插件应该对应一个API开发包吧 但我又不知道在哪里可以查到这个flash的api 所以没办法开发flash。请问大家在哪里,用关键字可以找到这个 ...…

查看全部问答∨

vc2005开发的智能设备ocx,如何改造能在pc(x86)下的智能设备应用中开发使用? 我快要疯了 ,请高手详细指点

vc2005开发的智能设备ocx,如何改造能在pc(x86)下的智能设备应用中开发使用?  我快要疯了 ,请高手详细指点…

查看全部问答∨

【招聘猎头顾问】Researcher/Consultant

【招聘猎头顾问】Researcher/Consultant Contact: MSN: hhlist0@hotmail.com Email: openymail@gmail.com Location: Beijing Title: Researcher/Consultant Responsibilies: 1.Executive searching,negotiation,delivery,maintenance for cl ...…

查看全部问答∨

申请LM3S8962 评估板

如果有可能,下一步对公司使用的其他测试机进行改造。 [ 本帖最后由 hejunzhan 于 2010-10-15 15:34 编辑 ]…

查看全部问答∨

【为C2000做贡献】TMS320F2812的CMD文件配置详解

CMD 2812的核心! [ 本帖最后由 fxw451 于 2011-4-7 09:29 编辑 ]…

查看全部问答∨

我的电路板上的3.3v输出lm1117芯片,实际输出却是4.2v

要是小于3.3v还好理解,怎么就会大于3.3伏呢,而且我换了一个片子还是输出这么多, 但是同样的1117芯片在另一块不同设计的电路板上输出是正常的。…

查看全部问答∨

STM8L152C6T6的USART1使用

最近在看这款芯片的USART,都看不懂,希望高手来教下我。我想通过电脑发送数据,然后在LCD上显示接收数据哦。方便的话可以加下我的QQ707474097,期待高手们的帮助。…

查看全部问答∨
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved