历史上的今天

今天是:2024年08月24日(星期六)

2020年08月24日 | 深度学习框架发展的新阶段,“名实陷阱”需保持警惕

发布者:EnchantedMagic 来源: eefocus关键字:AI技术  深度学习  大数据 手机看文章 扫描二维码
随时随地手机看文章

最近,美国推动的一系列科技封锁政策让人瞠目结舌。我们习以为常的世界科技秩序,毫无疑问正在以肉眼可见的速度被改变甚至重构。

 

在这样的话语氛围下,底层技术自主可控开始成为社会各界的共识与推动方向。而在科技产业进程里,半导体与计算机操作系统代表着过去有亏欠、今天急于填补的技术门类,也就是我们在今天能够清晰感受到被“卡脖子”的那些技术。而另一类则是中美大体处在齐头并进阶段,需要积极发展的“未来技术”。所谓昨日因今日果,如果我们不希望未来再次被卡脖子,那么今天这类技术也必须保持独立可控,甚至高速发展反超欧美——AI 技术就是这个领域的代表。

 

(去年 GitHub 就突然限制克里米亚、古巴、朝鲜、伊朗和叙利亚等国家用户访问)

 

在发展 AI 技术的进程里,最关键的开发底座相信读者已经很熟悉,那就是深度学习框架。在几年前,我们就专门讨论过深度学习框架独立自主的战略意义,今天来看已经一一应验。而国产深度学习框架发展到今天这个阶段,又出现了很多新的动向。在这个阶段我们需要的可能就不仅是简单的中美框架对标与扶持,而是更具有智慧、有策略,有合理产业节奏的方式去推动技术底座良性发展。

 

在此过程中,盲目执行平均主义的资源分配和产业推动,可能是最大的问题。进入深度学习框架发展新阶段,合适的产业策略应该是既期待和推动百花齐放,又能找到成为栋梁之材的佳木。

 

皆木皆花不是景。只有内在系统完善,发展机制合理的生态系统,才能培育起茁壮的中国 AI 丛林。


名实陷阱:深度学习框架发展新阶段,需要警惕什么?

在产业 AI 不断发展的今天,AI 底层技术工具和平台受到了社会各界,乃至世界各国的普遍重视。但在相关产业成果不断涌现的过程里,也势必因为 AI 技术是全新事物,缺乏产业通行的判断标准,导致政府、资本、媒体、产业,各领域的话语表达方式不一致,彼此理解差异很大,这导致后续行动的依据也不同。

 

举个例子,众多技术平台和工具进入大众视野,基本都会冠以首个、独家、突破这类的字眼。搭配上看似强大的资本与团队背景,很容易让行业外人士产生过高的心理预期。无论在芯片、操作系统,还是 AI、大数据领域,我们已经见过太多类似的问题,甚至闹剧。这类现象可以称之为自主科技产业上的“名实陷阱”。

 

这就像铁和金都是金属,但价值显然不同。但由于大众层面缺乏对科技产业的专业认知,就很难辨别名称相近平台的实际差异。

 

这一点在深度学习框架的发展中,也已经开始体现。今年以来,不仅谷歌 TensorFlow、Facebook 的 PyTorch、亚马逊的 MXNet 三大美国框架不断更新,国内很多深度学习框架也宣布向业界开源开放。比如一流科技自研的 Oneflow 深度学习框架、旷视科技的深度学习框架天元(MegEngine)等等。当然,每个框架背后都充斥着开发者的梦想和心血,也会在一些训练任务上展现出独特的优势。但如果我们横向对比这些新框架,会发现它们在核心技术、工具完整性、生态布局上有些参差不齐的缺失,甚至达不到国内老大哥“飞桨”的标准。那么如果从政策、资本、产业合作等层面都给予同样的赋能,显然会造成无差别大水漫灌的问题。

 

(飞桨全景图体现了全面的核心技术与完整的工具集)

 

事实上,到底如何定义什么是完整的深度学习框架,是一个非常专业化的产业问题。比如早在 2018 年,阿里开源了旗下的 X-Deep Learning,称其为“业内首个面向高维稀疏数据场景的深度学习开源框架”。而事实上 XDL 只能面向高维稀疏数据场景这一种需求,能力范围狭小,很快也就在开发者中不见了踪影。

 

同样的窘境在新近开源的深度学习框架中体现的尤为明显,像 Oneflow 这类技术轻骑兵,往往只针对单一的产业需求,会出现能力范围和工具性、生态性、产业特性的欠缺。而深度学习框架作为 AI 时代的操作系统,又恰恰是需要聚少成多、长期积累的领域。如果引导产业和开发者无差别入驻,那么显然会造成内部凝聚力失衡,无法形成有效生态的问题。

 

那么是否有办法,在产业周期中建立一个关于深度学习框架的判断机制呢?


三维模型:如何建立 AI 产业的价值判断机制?

我们当然不会认为深度学习框架一定就是老的好、新的差,或者强者恒强,大者通吃。也不认为新型深度学习框架就没有出现的必要,或者缺乏产业机遇。恰恰相反,百花齐放的产业形态是业界开始兴旺的表现。只是我们认为无论在产业政策、资本扶持,抑或产业合作上,都应该建立标准化、多元化的价值评判机制,引领深度学习框架向合理性、高效率发展。避免平均主义造成资源浪费,也避免大众听到创新和独立字样都等而视之,造成公共情绪的错误引导。

 

回归到深度学习框架领域,一个健康的价值判断模型,需要检测多个维度来审视一款产品或者平台的发展:

 

首先,在当前的科研大环境下,核心技术自主权和底层技术自主可控的价值已经非常明显。政策制定者、产业各界与媒体,应该坚定支持国产框架发展,甚至推动 AI 产业生态从美国框架向国产框架迁移,毕竟在目前的局势下,谁也无法判断下一个断供的是不是 TensorFlow。

 

然而,仅仅下载使用来支持是不够的,就像操作系统一样,深度学习框架本身难度很大,但更具挑战性的是生态的发展和汇集。相关政策与产业标准,也应该更加关注 AI 开发者生态,围绕生态需求制定针对性推动策略。在这方面,一个显著的指标就是开发者的数目,这能直观地体现生态繁荣程度,就拿飞桨举例,它已经凝聚超过 210 万开发者,而且正在通过自己的生态化规模将 AI 能力拓展到各行业,在产业阶段,理应得到更高的重视。

 

最重要的是,深度学习框架要体现出对国家经济转型升级的推动力,按现在的政策,就是深度学习框架是否能够负载今天新基建周期中,产业智能化带给深度学习框架的工业级承载需求。这个标准又包含几个部分,比如核心技术的完整、领先,能够负载大规模深度学习;另一方面是平台体系与技术能力对于工业化大生产领域的支撑能力。但大部分的深度学习框架交出来的成绩单都还没达到要求,要么是覆盖面狭窄,要么是企业不满意。如果向飞桨看齐,它已经覆盖通信、电力、城市管理、民生、工业、农业、林业、公益等众多行业和领域,在疫情期间也落地大显身手,目前已有 9 万家企业通过飞桨创建了超过 29.5 万个模型, 这些产业指标,显然是深度学习框架价值的最好判断标准,也是后来者亟需突破的方向。

 

在深度学习框架走向百花齐放的当口,我们希望能够避免眉毛胡子一把抓,达成重点分明、产业逻辑清晰的扶持策略与产业引导行为。


产业策略:推动 AI 底座整体发展的当务之急

对于 AI 基础设施来说,百花齐放的产业形态,甚至开发者纯粹兴趣式的创造都非常具有价值。但如果我们的目标是发展符合社会经济需求的工业化 AI 底座,通过新基建推动产业智能整体发展,那么就需要制定详实、完整的产业策略,推动深度学习框架与众多 AI 基础设施一道,向 AI 工业化大生产发展。在这样的目标下,有几件当务之急值得多加重视:

 

首当其冲的是,重点发展一个体系,有策略进行平台、数据、开发生态的打通。最佳方案是以发展度最好的深度学习框架为依托,有效整合再创新,与产业沟通,避免重复发明轮子,防止政策扶植、资本、社会舆论的资源错置或浪费。同时积极推动国产化、自主可控的深度学习框架发展。当然不是说要刻意规避美国优秀技术成果,但在目前阶段和国际形势下,积极推动甚至政策推动深度学习框架国产化、自主化,似乎已经是题中应有之义。

 

(国务院印发的《新一代人工智能发展规划》也提到了扶持深度学习框架的目标)

 

其次,技术评判标准的建立,是细化核心技术发展目标的关键一步。将深度学习框架拆解为更为详细的产业维度,厘清各平台的优劣势与发展所处阶段,是目前政府和业界需要共同完成的任务。例如深度学习框架能否保持高频升级迭代节奏,来解决产业不断涌现的新问题?核心框架的开发能否变得越来越便捷,让开发者和企业更容易上手?更别说需要大量具有突破性的新技术,来满足产业智能化转型过程中面临的门槛与痛点。在这些问题上,飞桨做的比较好,他们具备突出优势,核心技术发展方向也很明确,可以有效帮助产业快速发展,让社会资源对平台的价值判定更具标准化方案。

 

而且从另一个方向上看,不同的框架处在不同的发展周期,自然也需要不同的发展推动力。比如飞桨在产业核心能力上的特性、开发生态与产业应用上的积累,目前是其他框架所不具备的。建立关键技术的评判标准化体系,可以避免“大小班同上”,让发展领先的深度学习框架向下一个产业阶段进行探索,承担更重的社会价值。

 

而最关键的还是,深度学习框架必须要融入产业生态,建立起对社会经济的灌溉体系,否则就会为技术而技术,沦为空中楼阁。深度学习框架之所以重要,完全建立在 AI 技术可以赋能产业,提升社会生产力的基础上。那么发展深度学习框架自主化、国产化,也建立在技术平台与产业需求的高效对接与产业适配上。从这个角度看,在检验深度学习框架的价值与发展潜力时,也必须将其与行业结合的案例、效率、平台可行性纳为基础评判准则。比如说,飞桨推动大工业生产的可行性,正体现在对产业的适配和大量案例上。新冠疫情期间,就有大量 AI 应用高效产出并在各个防疫领域发挥作用。2 月 13 日,飞桨开源了业内首个口罩人脸检测及分类模型,随后,包括中石油、北京地铁在内的百余家试用企业纷纷应用落地。

 

(飞桨开源的口罩人脸检测及分类模型,助力复工复产)

 

此外,根据报道,百度与 OPPO 的合作中,提供了飞桨大规模分布式训练等技术能力,将 OPPO 推荐系统业务模型训练速度提升了 8 倍,模型扩大了 20 倍,推荐场景效果提升了 4%-5%,节省了 90%的内存,对于 OPPO 覆盖全球 3.5 亿用户的移动互联网服务起到了很大助推作用。

 

还有一个走出国门的案例是,基于飞桨打造的一款无人机自主飞行平台,已经在东南亚某国提供自主巡逻、火情监测、非法入侵、森林树木砍伐监测等功能方案,相比人工巡检效率提高 200%,森林覆盖面积从 40%提升到 100%,对当地森林防火工作提供了肉眼可见的助益。

 

在互联网、科技行业,以及工业、农业、能源、金融,乃至公共卫生与社会服务等领域的广泛落地,也是市场选择深度学习框架的一种体现,此前 IDC 发布的《中国深度学习平台市场份额调研》显示,深度学习市场形成谷歌、Facebook、百度三强态势,三者占据了国内超过一半的市场份额,由此可见一斑。从这些角度看,在国产深度学习平台自主可控创新的最佳契机与平台化底座的选择上,飞桨已经建立起了较为明显的优势。

 

当然,这只是对国产深度学习框架主流平台选择及扶持的一种思路,这也体现出,在我们重新审视 AI 产业发展周期与深度学习框架发展赋能时,或许需要更加体系化、生态化、产业指向的目光,来审视不同平台的差异化战略价值。

关键字:AI技术  深度学习  大数据 引用地址:深度学习框架发展的新阶段,“名实陷阱”需保持警惕

上一篇:立讯精密的上位史
下一篇:详解华为人工智能的星辰大海

推荐阅读

8月22日,重庆渝北区举行招商项目集中签约仪式,签约项目共45个,涵盖大数据、集成电路、人工智能、智慧医疗等领域,计划投资总额256亿元人民币。本次签约的亮点是签下钜芯、协同光电、创新维度、欣博电子等集成电路项目,以及华为软件开发云平台项目。据悉,钜芯公司将投资建设“钜芯集成电路研究院”,华为将挂牌成立非独立法人的“华为重庆软件开发云创...
引脚图#include<reg52.h>#include<intrins.h>#define uchar unsigned char#define uint unsigned int#define out P0sbit RS=P2^7;sbit RW=P2^6;sbit E=P2^5; void lcd_initial(void); //LCD初始化函数void check_busy(void); //检查是否忙碌函数void write_command(uchar com); //写命令函数void write_data(uchar dat); //写...
近日运动相机品牌 AKASO 在天猫上线了该品牌的天猫旗舰店,并上架了 AKASO EK7000 Pro,该产品在海外曾多次霸榜亚马逊运动相机销量第一,仅在 7 月,在亚马逊的销量就超过 15 万台。EK7000 Pro 是一款专注于运动摄影的相机,配备了 1600 万像素的镜头。该镜头支持 4K 25fps 视频拍摄和 170°超广角拍摄,远远超过了手机常见的 120°。对...
网络安全与功能安全的智能联合在带有嵌入式硬件安全模块的 CPU 上运行的安全堆栈如今被认为是汽车网络安全的核心。 因此,它们也是车辆功能安全的关键先决条件。 在最坏的情况下,针对网络攻击的安全保护不足的车辆系统最终可能会导致危及生命的情况。 ESCRYPT 解释了为什么最好将硬件安全模块及其安全功能直接集成到车辆的安全概念中。基于硬件安全模...

史海拾趣

问答坊 | AI 解惑

油压系统闭环控制卡的开发及其应用

介绍了作者在震雄参与开发的国内第一款用于油压注塑机的闭环控制卡。阐述了控制卡开发的必要性 ,详细介绍了控制卡的主要功能和特点。在注塑机控制系统的应用中 ,提出了针对非线性电控元件的控制解决方案及控制算法。…

查看全部问答∨

20年嵌入式领域开发经验精华二(转)

1.5.实时处理方面的考虑      实时处理是一个涉及范围很广的题目,其主要内容与系统的处理速度有密切联系,实时事件是嵌入式微处理器需要关注的主要任务。   例如:处理器跟串口进行通信时,通常通过上层软件(为 ...…

查看全部问答∨

编码器工作原理

编码器如以信号原理来分,有增量型编码器,绝对型编码器。 增量型编码器(旋转型)   工作原理:    由一个中心有轴的光电码盘,其上有环形通、暗的刻线,有光电发射和接收器件读取,获得四组正弦波信号组合成A、B、C、D,每个正弦波相差90度 ...…

查看全部问答∨

我的PCB文件怎么没有Mechanical layers?

我的PCB文件怎么没有Mechanical layers,而且我左侧的Current Layer里面也没有。Design->Option中的Mechanical layers也没有复选框,怎么回事呢?另一个PCB文件就有。…

查看全部问答∨

系统图标变花

自己写的程序,运行一段时间,没内存泄露关闭程序后系统图标都变花了,滚动条也变成无色了,请问各位大侠可能是什么原因造成的呢?…

查看全部问答∨

关于通过gprs发送彩信开发

怎么建立与MMSG网关建立通信的, 希望有经验的朋友指教, 如有源码,请发送到zenggyang2005@163.com 谢谢!…

查看全部问答∨

STM32F103的时钟问题

修改了一下英倍特板例程,做了个跑马灯小实验,系统时钟用8M*9=72M,每个灯延时常数为0x0B71B00(十进制数12M),用示波器测出刚好是延时1S,说明时钟是12M,可是下面的程序中系统时钟是72M的,是我的理解有误吗?希望高手赐教。#include  ...…

查看全部问答∨

c 对 DARAM 的操作问题

本帖最后由 dontium 于 2015-1-23 13:28 编辑 在学习DSP2000系列的过程中一直有一个问题没有搞清楚, 在TMS320LF240X 有544*16位字的片上DARAM,被分为3快:B0,B1,B2.在DARAM中,允许CPU在一个周期内对其进行读和写.如果能很好的利用好DARAM对程序的执 ...…

查看全部问答∨

C8051F350

我用的是内部振荡器,目的是点亮一个led灯。 程序如下: #include <c8051f350.h> sbit LED1 = P0^0;                     void OSC ...…

查看全部问答∨

关于430的远程升级

前几天有个坛友问倒了这方面的问题,我找到了一片技术文档,属于官方文档,现在上传上来。…

查看全部问答∨
小广播
最新嵌入式文章
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved