Phison 群联电子

文章数:92 被阅读:130161

datasheet推荐 换一换
随便看看
账号入驻

SSD在人工智能和机器学习中的角色

最新更新时间:2024-07-08
    阅读数:

人工智能(Artificial Intelligence/AI)和机器学习(Machine Learning/ML)这两个术语在计算机信息产业中的使用越来越广泛,但事实上,即使是经验丰富的IT从业者可能也不完全了解支持这两项技术所需要的计算和存储基础架构与设施。透过本文,群联将带您一探如何以固态硬盘(SSD)存储优化人工智能运算及机器学习成效。

什么是人工智能和机器学习?

首先,要理解人工智能和机器学习的第一步是明白它们在本质上并不相同。人工智能泛指能够像人类一样思考的软件,而机器学习则包括让软件学习新知,并持续提升掌握全新概念的能力。两种技术有所不同,但亦有关联及重迭性。

人工智能及机器学习并非近代出现的科学概念。早在1950年,计算机科学家艾伦.图灵(Alan Turing)就已提出,机器可以被制造得像人一样思考。到1959年,则有人工智能先驱马文.明斯基(Marvin Minsky)对一个自研的简易人工智能程序实施麻省理工学院的微积分入学测验,结果为该程序成功通过测验。

而在近代,电影中也充斥着对人工智能的刻画及想象。无论是《2001太空漫游》中的反派人工智能HAL 9000,或是在《终结者》中同样具有毁灭性的天网(Skynet),这些虚构剧情皆在一定程度上对人们造成了影响及混淆。万幸的是,至今这些剧情皆还未成为现实,我们的世界已实现的是各式人工智能及机器学习的成功应用实例。大多数的这些应用可能皆隐形于科技及产品中,但同时默默地对人们的日常生活及业务造成持续影响。例如,机器人流程自动化(Robotic Process Automation),或是英文俗称的「bot」,就是使用人工智能执行如阅读电子邮件及填写表格等业务。而机器学习则时常用于执法机构的脸部辨识,或医疗领域中的癌症诊断等任务。

人工智能和机器学习的运作原理?

尽管人工智能和机器学习在编程上有着诸多变化性,但在核心上,两种技术皆是基于规律的识别。在上述RPA阅读电子邮件的例子中,「bot」会被训练来识别邮件中的内容,并将其中包含「支付」或「逾期付款」等等词语归类至财会部门负责处理的范畴。除此之外,「bot」也能应用于解析电子邮件签名,利用图像识别判断该讯息是来自供货商(应付帐款)或是客户(应收帐款)。类似的功能在互联网安全领域也被普遍使用,人工智能软件被用来检查资安纪录中数以万计的数据点,并找寻可能的威胁。

相较于人工智能,机器学习则经常应用于基于规律识别来增强特定领域的知识。机器学习系统能达成在无预定的程序或具体规则下,不断透过数据学习变得更「聪明」。举例而言,我们能透过让一个机器学习算法「阅读」一百万张树木和植物的图像,并使其最终自行学会区分树木和植物的差异。由此可见,人工智能和机器学习于本质上的区别在于,人工智能应拥有相对完整的识别认知,而机器学习则能透过不断学习提升其认知能力。

在某种程度上,人工智能和机器学习都只是大数据处理的延伸。传统的大数据分析帮助我们探讨可见趋势并从大量数据集中得出新的见解。而人工智能和机器学习将这门科学推向更深的层次,利用如数据挖掘、统计分析及预测模型架设等数据科学流程,实现推论及决策优化。

在实行面上,人工智能和机器学习的操作可概分为四段流程:

 数据导入 - 将各式数据加载如Spark、Hadoop和NoSQL等数据库平台,以作为人工智能和机器学习的作业基础。

 数据前置处理 - 根据各平台需求,将数据提前拆分及整理。

 训练学习 - 使用各式神经回馈算法完善处理模型。

 推论 - 以模型实际处理高效判断及优化作业。

NAND快闪存储对于人工智能和机器学习的重要性

海量数据对于人工智能和机器学习的核心价值使得存储成为其成败的关键因素。人工智能和机器学习若缺乏弹性及效能兼具的存储,可能同时降低运算及存储架构利用率,并造成性能限制或损耗。因此选择正确的存储媒介对于人工智能及机器学习至关重要,而NAND闪存作为现今炙手可热的存储科技之一,于多方面皆高度适配其需求。我们可从上述人工智能及机器学习的四个实作阶段做思考。

在数据导入阶段,人工智能正在大量收集高度多样并甚至包含结构化及非结构化格式的数据集。这些可能以PB甚至EB为单位的数据不但复杂且可能来源遍布,因此,除了一个以高成本内存组成的快取处理层,我们同时需要另一层能弹性布数的大容量收纳层。而在此层中,足够的性能及可靠性便至关重要。时下前端的NAND闪存便能满足此些需求。

紧接着,在数据准备阶段的需求则转向与运算层合作的大量数据交换及格式化等处理,为紧接而来的训练和推论阶段做好准备。在此阶段,相较于传统存储,NAND闪存能真正提供足够的输入/输出(I/O)速度,降低数据准备时间成本。而最后的训练及推论阶段更无需多论。期间不断反复的高端演算处理所造成的大量数据及效能需求,既非缓存可以容纳,亦非其余低效能媒介所能胜任。

SSD如何实现人工智能和机器学习的成功

人工智能和机器学习所需的数据存储规模一般需以多种存储的混合方案应对。以层次化的配置将一些较不相关的数据交给性能及成本较低的存储,并同时安排一个高性层,处理数据生态系中顶端的重要「热」数据。搭载高端闪存的SSD能在人工智能及机器学习的各阶段中提供数据的快速移动及延迟减缓。

群联如何提供协助

群联客制化SSD解决方案能提供人工智能和机器学习工作负载所需的卓越效能和灵活性。群联X系列及AI系列产品是行业领先的高端PCIe固态硬盘解决方案,能完美应对各式训练及推论工作负载,助您实现次世代人工智能应用。

而针对高读取及成本优势的机器学习需求,群联已备好为读取密集应用而优化的大容量S系列固态硬盘,能在单个48U机架中容纳高达13PB的人工智能和机器学习应用数据,以存储密度和极低功耗提供最佳经济效益。

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: TI培训

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved