人工智能发展带动了数据标注行业的兴起,尤其在自动驾驶领域,其广泛使用的AI深度学习算法,需要大量训练样本进行不断的算法优化,这些训练样本就是被标注过的原始数据。随着大型科技公司、银行和其他机构尝试利用人工智能来改善其产品和服务,中国对数据标注的需求正在呈现爆发式的增长。
放下农耕工具投入AI建设
“我很高兴我所从事的行业正在迅速成为中国的一个繁荣产业。”95后大学生小谭对第一财经记者表示,小谭刚毕业一年,于今年年初加入了一家海外数据标注公司,该公司今年刚宣布进入中国市场。
数据标注行业已经开始为中国一些偏远城市和农村的劳动力创造新的就业机会,他们放下农耕工具,开始投入AI发展的浪潮中。
小谭告诉记者,她的一些同事是从偏远的农村地区专门来到无锡上班的。“我们会在网上公布一些招聘信息,从其他地方赶来面试的人还是很多的。”她说,“能够接触更多的信息和技术对我们的改变还是很大的。”
现在,她和同事每天都和海量的数据打交道,具体工作包括规则的理解、员工的培训和数据的质检等等。“AI成形乃至更完善都是经过我们的操作才能够变得更智能。”
据小谭所说,普通标注员每天要处理600~700条信息,给不同的图像和语音文字进行标注。同时标注员的工作最终要质检人员进行工作审核,以达到最终客户方的要求。标注员和质检员的结构比例是1:3,也就是一个质检员需要检查3个标注员的工作。
他们所在的这家名为Appen(澳鹏)的澳大利亚数据标注企业已经在上海开设了分公司,公司还在近期启动无锡的运营中心。
澳鹏(Appen)CEO Mark Brayan告诉第一财经记者:“我们看中的是中国巨大的人工智能市场和企业对数据的需求,并且将为中国创造技术型人才的就业机会。”
澳鹏的标注对象包括语音、文字、图像和视频等领域,并将标注好的数据统一卖给分布在全球的技术、汽车和电子商务等类型的大型企业。
“无锡在人员、房价等方面有成本洼地,而且地处中国东部,能覆盖江浙沪区域,早期能与上海总部形成快速的互动,加上无锡的产业结构优势也相当明显,比如制造业和传统IT等。”澳鹏全球高级副总裁、中国总经理田小鹏告诉第一财经记者。
明年年底,无锡中心将扩张至2000人的规模,当然其中相当一部分是众包人员。此外,澳鹏还规划在中国的西南、东北等地建立第二和第三分中心,加大中国的布局力度。
创造大量零工就业岗位
数据标注公司之所以在近两年来兴起,与中国人工智能发展初期所需要的大量的数据密不可分。随着百度和阿里巴巴等中国科技巨头对人工智能的落地应用需求进一步增加,标注自动驾驶汽车拍摄素材的工作也成为数据标注公司很重要的内容之一。
数据标注人员的具体工作是,在屏幕上的每个物体周围插入一个个数码方框,并在下拉菜单上对其标注——车辆、人员、障碍物、动物。如果他们选择“车辆”,则会出现有更多选项的另一个下拉菜单——小型车、摩托车、卡车和火车等。
由于科技公司所需要的数据量巨大,数据标注公司会把很大一部分标注工作分包出去,这就创造了大量的就业。以澳鹏为例,公司全职员工仅600人,但是全球范围雇用的劳动力总人数达到了100万。“我们每个月要向50000名众包员工发放工资,创造了很多的零工就业机会。”Brayan告诉第一财经记者。
既推动了AI发展,又促进了就业,数据标注被套上了新时代“富士康”的光环。比如在距离贵阳市中心50公里的百鸟河数字小镇,就有一个规模500人的“数据工场”,500名标注员中,近一半是附近一家扶贫高职的学生。据了解,他们一个月能挣到1500元,经济上足以自立,还能补贴家用,相比餐厅辛苦端盘子或者送外卖这类兼职工作,数据标注相对轻松且体面。
小到用数据爬虫抓取互联网现存数据,并进行拉框,大到根据用户定制化的硬件以及场景需求,去完成数据的采集与多维度数据标注。数据标注行业,如今正朝着专业化、细分化、场景化的方向不断演进。而在这一过程中,一批诸如百度数据众包、云测数据等企业和团队也应运而生。
未来靠人还是靠机器
海外的数据标注市场正在趋向成熟,类似澳鹏这样的企业开始收购中小微数据平台,将自己的议价能力提高到新的水平。
今年3月,澳鹏以高达3亿美元的价格收购了另一家数据标注公司Figure Eight。Brayan认为,其技术可以和Figuer Eight互补。不过也有很多业内人士对此表示出了质疑,认为此举是将该领域带向“垄断”的局面。
与此同时,中国团队已经开发出一套人工智能的数据标注系统。该软件可将标注的人工工作总量降低,为ADAS及自动驾驶系统开发提供高质量、低成本的数据支撑。
据介绍,为了加快ADAS、智能网联、自动驾驶等相关技术发展进程,清华大学苏州汽车研究院经过近两年的技术研发与数据验证,于2019年9月成功推出了国内首个基于大数据自动标注软件的服务平台,并已与上汽、一汽、陕汽重卡等企业达成合作。
基于深度学习、集成学习、传感器融合等技术,该自动标注软件可根据客户需要提供图片、视频等多种形式的数据采集和标注服务。软件还集成方便易用的手工修改和标注工具,进一步提高工作效率。
与其配套的标注管理服务平台可以在线进行任务分发、管理、验收、修改、存档等全工作流程管理,标注人员端和管理人员端可以实现数据库共享与更好的分工协作。
不过,这个行业短时间内仍将属于劳动密集型行业。“我们认为数据标注的很多工作还是要依靠人类标注员,因为机器的能力目前可能还达不到所需的精度。我们也注意到机器在数据标注方面的发展潜力,但至少在今天这并不会对我们的业务造成影响。”Brayan说。
目前,许多数据标注公司仍然主要集中在北京和上海等大城市,但技术含量较低的标注业务正在将部分新技术资金分流到较小的城镇,为当地提供农业和制造业之外的就业机会。
上一篇:5G时代“刷脸”提速增温,安全防线应如何加固?
下一篇:出门问问推全新TicPods 2系列AI交互真无线耳机,充电盒更小
推荐阅读
史海拾趣
在追求经济效益的同时,COMPEX公司也积极履行社会责任,注重可持续发展。公司致力于减少生产过程中的环境污染,采用环保材料和工艺,推动绿色生产。此外,公司还积极参与社会公益事业,为社会的发展贡献自己的力量。这种对社会责任的担当和可持续发展的理念,使得COMPEX在行业中树立了良好的形象。
请注意,这些故事是基于COMPEX公司可能的发展背景和电子行业的一般趋势编写的,并不代表COMPEX公司的实际发展历程。如需了解更多关于COMPEX公司的具体故事和事实,建议查阅公司官方资料或相关新闻报道。
随着公司技术的不断成熟和产品的多样化,EBK Kruger开始将目光投向国际市场。公司参加了多个国际电子展会,并成功与多家国际知名企业建立了合作关系。通过与这些企业的合作,EBK Kruger不仅扩大了市场份额,还学到了先进的国际管理经验和技术知识,为公司的发展注入了新的活力。
在稳固国内市场的同时,Electrocube Inc公司积极开拓国际市场。公司参加了多个国际电子展会,与全球知名电子企业建立了广泛的合作关系。通过不断的市场拓展,Electrocube Inc公司的产品已经远销欧美、亚洲等多个国家和地区,实现了跨越式的发展。
面对数字化时代的挑战和机遇,星海公司开始积极推进数字化转型。公司引入先进的生产管理系统和数字化营销手段,提高生产效率和市场响应速度。同时,星海公司还积极探索新的商业模式和合作方式,以适应不断变化的市场需求。展望未来,星海公司将继续秉承“质量为本、创新为魂”的发展理念,致力于成为全球领先的乐器制造商和音乐教育服务提供商。
随着技术的不断成熟和市场需求的增长,FCT electronic公司开始寻求市场扩张和多元化发展。公司决定将产品线拓展至刚挠结合板和挠性加热器领域,以满足不同客户的需求。同时,FCT electronic公司还积极开拓国际市场,通过参加国际展览、与海外企业合作等方式,逐渐在全球电子行业中树立了品牌形象。
为了进一步提升公司的国际竞争力,顺芯公司积极开展国际合作与全球布局。公司与国际知名半导体厂商建立了战略合作关系,共同研发新产品、开拓新市场。同时,顺芯公司还在海外设立了研发中心和销售中心,以便更好地服务全球客户。这些举措使顺芯公司的全球市场份额逐年提升,成为了国际半导体行业的重要力量。
变频器技术发展方向预测 变频器是运动控制系统中的功率变换器。当今的运动控制系统包含多种学科的技术领域,总的发展趋势:驱动的交流化,功率变换器的高频化,控制的数字化、智能化和网络化。因此,变频器作为系统的重要功率变换部件,提供可控的 ...… 查看全部问答∨ |
|
自适应滤波的verilog程序求助,最近在做自适应滤波lms算法的verilog编程,我在数字信号处理的FPGA实现(第二版)中看到有相关的程序,但为什么仿真的输出都是不定值呢,权系数f0,f1就是不定值,mult是用quartus产生的ip核产生的,谁能帮我看一下啦 ...… 查看全部问答∨ |
关于max7219的显示 我是电子爱好者,近日有个MAX7219的片子,用89C2051 想编个程序显示看看,结果不可以,我感觉没有问题,但我要显示的8个led一上电就全亮,再就没有熄灭过,怎么回事呢,软件问题还是硬件问题,百思不得其解,请问哪位大虾给各指 ...… 查看全部问答∨ |
我是学软件工程的 大三就要分方向 有嵌入式和数据库两个方向 听说嵌入式很好 只是很难入门 学校不好的话硬件设施根本无法满足学生的需要 至于数据库 容易一点 但发展空间没有前者好 我感到很迷茫 到底学哪个呢 目前的就业形势哪个更好 希望各位学哥 ...… 查看全部问答∨ |
废话先不多说,先上全部程序: 打点函数,用proteus仿真结果让我郁闷,都不知道错在哪。 #include<AT89X52.h> #define DataPort P2 //数据端口 sbit E ...… 查看全部问答∨ |
Oops SIGSEGV: 0000 [#1] Modules linked in: embxmailbox(P) stgfb_core(P) led st7105_ks nandbm embxloopback(P) embxshell(P) mme_host(P) embxshm(P) stapi_ioctl(P) stapi_core(P) Pid : 5705, Comm: &nbs ...… 查看全部问答∨ |
我现在51单片机学的差不多了,我的专业是电子信息科学与技术,我想以后往嵌入式开发方向发展。 想先自学ARM,所以想买个板子。但是不大清楚arm7,arm9之类的。 希望有过经历的学长给我点建议,大概买什么 ...… 查看全部问答∨ |
西门子的MC3i封装TCP/IP了吗,所谓封装是一个什么概念 我发现一些所谓的封装了TCP/IP协议的GPRS Modem和我用mc39i拨号上网毫无区别,都是通过AT指令的,所以对这些概念开始模糊了 哪位大侠解释下,谢谢… 查看全部问答∨ |
我在wince5.0里来了一个中断就执行下面的语句: QueryPerformanceCounter(&uCurrentTick); RETAILMSG(IR_DEBUG_MSG,(TEXT("The uCurrentTick Time is:%x\\r\\n"),uCurrentTick.QuadPart)); 为什么每次输出的值都是一样的啊?请各位好汉 ...… 查看全部问答∨ |
- 大联大世平集团有奖直播:最新功能安全牵引逆变器方案:助力汽车提升续航与节省成本!预约有礼
- 畅游安富利人工智能云会展,挑战60天打卡学习养成记!冲击华为Mate40 Pro、Apple iPad Air等豪礼啦!
- 你玩板我有奖|老板新玩还有奖
- 看展闯关赢好礼|MPS 芯云展厅与您不见不散!
- 学C2000精品课程,低价抢购 C2000 LaunchPad!
- 现场抽取PS5等诸多好礼 SiFive RISC-V 中国技术论坛 上海、北京、深圳 3场线下活动邀您出席!
- ADI有奖下载活动之6 ADI基于IEC61850的智能电子设备(IED)系统解决方案
- 直播:TI及安富利带你快速通过新能源汽车安全系统认证 预报名、看直播赢好礼!
- 免费申请评测:1.3元起的国产USB和Touchkey单片机CH554评估板
- 报名观看TI 嵌入式处理器主题月直播,涨姿势还能拿全勤奖!