历史上的今天

今天是:2024年10月07日(星期一)

正在发生

2019年10月07日 | 你的人脸数据都去了哪儿?

发布者:翠绿山水 来源: 镁客网作者: Lemontree 手机看文章 扫描二维码
随时随地手机看文章

在AI换脸软件ZAO和旷视校园人脸识别的风波后,17万人脸数据被公开挂在网上商城出售的消息“接踵而至”,人脸突然成了“危险品”。

无处不在的人脸识别,当采集人脸数据的渠道越来越广,很多人会疑惑,我们的人脸数据最终都流向了哪里?

在刷脸解锁手机,付款,进出入高铁站、机场的时代,你的脸可能在研究人员的数据集中,也可能在暗网的黑产交易中,也可能被Deepfake后换到了另一个身体上……

人脸数据都去了哪儿?数据集或成为隐患

AI时代下,科技公司会通过数十亿张人脸图片的训练来改进面部识别算法,你的脸很有可能就是“训练样本”之一,那么软件公司又通常从哪些渠道获取人脸图像“喂养”自家的算法呢?

早年,人脸识别还没有进入到深度学习的阶段,人脸数据收集还是打着隐私的烙印,研究人员需要获得志愿者同意,才能采集人脸数据纳入到数据库中。比如早期由耶鲁大学计算视觉与控制中心创建的Yale人脸数据库,只包含了15位志愿者的165张图片。

但是到了后期,尤其是深度学习技术的快速应用普及,几百张志愿者的人脸对于数据训练来说只是杯水车薪,人脸数据的收集也开始走向不可控。

人脸数据集通常情况下是为图像识别赛事准备的,比如微软的MS Celeb 1M,这个由微软在2016年发布,包含了10万个名人,近1000万张面部图片的数据库,就是用来服务当时最高水平图像识别赛事之一的MSR IRC。

同样还有业界“黄金标准”之称的人脸识别算法测试FRVT,其背后由美国国家标准与技术研究院(NIST)提供人脸数据集支持。

此时以学术研究为目的的人脸数据集还处在可控范围内,但是到了后期,谁也无法控制这些人脸数据到底被用作什么,数据训练之外,它又流向了哪里?

如果我们在搜索引擎里键入关键词“人脸数据集”,会发现海量的人脸数据库可以被下载获取,就像在网上下载资源一样,轻点一下,跳转到下载软件,几个G的人脸数据包就“属于”你了。

成千上万张被标记的人脸数据,如此轻易被获得,细思极恐。问题随之而来,数据集中的人脸到底从何而来?

镁客网粗略统计了几个包含人脸数据较多,且常用的人脸数据集,从发布机构来看,多为科技公司和高校,获取渠道有三个:1、爬取互联网数据;2、源自雅虎旗下网络相册Flickr;3、新闻机构、商业公司等。

这些人脸数据集有的已经做好标注,囊括了人脸关键点检测、人脸表情、人脸年龄和性别、人脸姿态等信息。

多数数据集在开放的时候,都会写上不可商用的补充协议,强调是在知识共享许可(CC协议)下抓取和搜索图像,根据CC协议中:照片可以重新用于学术研究,但照片中的人物并不一定授权许可,而是版权所有者授权。然而数据集公布后,发布机构也无法掌管它的使用。

不然,微软也不会在被媒体大面积曝光后,悄悄地删除了这个世界上最大的公开人脸识别数据库。之后另外两个学术单位也删除了相关的数据集:分别是杜克大学的Duke MTMC监控数据集,和斯坦福大学的Brainwash数据集。

当初衷是为了推动学术研究的人脸数据集,都有被商用以及滥用的风险,更何况那些源自其他渠道的人脸数据。

以人脸数据买卖为例,早在2016年,知乎上就出现了网友在淘宝买人脸数据的话题。除了网上商城之外,人脸数据也可以从售卖面部数据的商业公司处获得,比如一家名为Vigilant Solutions的公司就提供1500万张面孔,可以用来“解决”人脸识别软件训练的难题。

至于这些人脸又源自哪里,恐怕和上述几个渠道脱不了干系,也有可能是直接下载的公开数据集进行转卖。

人脸数据被卖了也好,流向人脸数据集也罢,归根结底,后续的应用是完全失控的。

“裸奔”的人脸数据,防不胜防的风险

如果早期我们收集人脸数据还是在志愿者的知情同意下获取,后期就完全摒弃个人隐私,直接通过爬虫程序,美其名曰要遵守共享知识协议,但很多人在上传自己的照片到社交平台、互联网相册的时候,压根不知道这些图片已经被纳入了这个协议下。

就像前阵子掀起轩然大波的ZAO,在密密麻麻的用户协议中,一排不起眼的条款提到“同意授予ZAO及其关联公司以及ZAO用户全球范围内完全免费、不可撤销、永久、可转授权和可再许可的权利”,如果没有后续的风波,你的人脸数据悄然无息间就被“卖”了。

当前,收集人脸的途径非常多,除了政府部门的安保需要,很多商业场景也都要求使用面部识别。比如参加某个大型会议,主办方需要提供个人照片提前录入到人脸识别系统;比如住酒店,需要面部识别确认;再比如一些社交APP,自动识别标记上传图片中的人脸;还有一些披着相册应用外衣,实际是收集人脸信息的软件程序……

之前Facebook因“未经用户同意,非法收集并存储数百万用户的生物识别数据”被集体起诉,在今年9月,压力之下的Facebook选择停止在用户的照片和标签建议中默认使用面部识别功能。

当你把包含自己人脸的照片上传到云端,没有人确保最终这些人脸数据可以被妥善保管。上传到平台,必然涉及到会不会保存到云端,如果在云端,数据最终流向何处呢?带来的风险是什么?

其实从人脸数据集的来源渠道也能了解到上传面部照片到网上的风险是非常高的。

此前有媒体曝光,国内一家人脸识别公司发生大规模数据泄露事件,超过250万人的数据可被获取,其中包括姓名、身份证号码以及照片。

今年年初,美国海关和边境保护局收集的旅客照片和车牌照片让一个外包公司泄露,而流出的数据已经被人挂在暗网上,可以免费下载。

类似新闻层出不穷,所以人脸数据引发的风险也非常高,当隐私信息被出售或者可被公开获取后,人脸可以用于金融领域的诈骗、亦或是在换脸软件下,被用在一些不当的场合下,比如将你的脸成小视频的女主角。除此之外,围绕人脸识别系统的种族歧视和偏见争议,也引发了巨大争议。

人脸保卫战,收集容易监管难

有的时候,技术和应用会处在相悖的一个状态,一方面,算法需要大量的人脸数据去优化,从而带来更准确、安全、高效的识别,避免可能会发生的欺骗性行为,另一方面,在优化算法的过程中又难以保证人脸数据的安全和不滥用,算法应用到场景中又会再次无限制收集更多的人脸数据,最终陷入两难的局面。

研究人脸识别的技术公司非常多,从CV四小龙到谷歌、微软、亚马逊、阿里巴巴这样的科技巨头,它们借助技术提高社会效率的同时,也会掉入舆论的旋涡中。

就在最近,继支付宝要在三年投入30亿推动刷脸支付后,有消息称微信也将拿出100亿补贴刷脸硬件设备的推广,当人脸作为常态的身份认证方式,保卫人脸安全也愈加重要。

但人脸数据收集容易,监管却是难上加难,无论是国外还是国内,在人脸数据安全上都显得忧心忡忡,美国的旧金山和萨默维尔已经通过立法的方式禁止在公共场所使用面部识别技术,其中旧金山是禁止警察和其他政府机构使用面部识别技术。这种一刀切的管理方式,虽然一定程度上规避了风险,但治标不治本。

国内的话,因为人脸识别走进教室以及换脸软件ZAO的病毒式传播,不少人开始注意到人脸数据安全的问题。近日有消息,有关部门将发布人脸识别领域相关金融标准,以明确人脸信息采集、传输、存储、利用等环节的安全管理要求。

其实,谈到如何保护我们的人脸数据,无外乎三个方面。除了个人提高安全意识之外,采集人脸数据的商业公司也需要通过技术手段保护数据的安全,监管部门则从制度层面加快相关法规标准的落地。

悲观的想,技术是双刃剑,虽然我们通过规则约束可以减少一定的风险,但有买卖,就有伤害,只要技术需要,你的人脸数据去哪儿了,被用作什么,可能谁也不知道。

引用地址:你的人脸数据都去了哪儿?

上一篇:WiMi微美全息、商汤科技等公司欲用机器视觉AI化构筑智慧城市新蓝图
下一篇:视比特机器人完成数千万元战略融资

推荐阅读

        自从苹果与高通交恶并转用英特尔的基带芯片,用户们关于“英特尔的基带芯片不如高通”的抱怨就没有停止过。今年英特尔抢走了高通的全部 iPhone 基带芯片订单,消费者对最新款 iPhone XS、XS Max 信号差的抱怨也达到了一个高潮。  苹果官方支持论坛、MacRumors 社区和 Reddit 上出现了一大批吐槽新 iPhone 4G 信号差、Wi-Fi...
随着人工智能技术兴起以及边缘设备算力的提升,机器视觉的应用场景不断扩展,并催生了巨大的市场。根据美国领先的调查机构Grand View Research的分析,预计到2025年全球机器视觉市场规模将达到182.4亿美元,复合年增长率为7.7%。在智能制造的浪潮下,生产线对工业设备有了新的要求,对质量检验和生产的需求不断增加。而新一代机器视觉系统能够在短短...
据悉,我国机器人研究开始于八十年代,在技术上晚于其它的发达国家。但是目前我国机器人水平已经实现了跨越性的进步,且来看看2021中国科技机器人企业排行榜TOP10: 1、美的集团:工业机器人、物流自动化系统 2、埃斯顿:工业机器人及智能制造系统 3、创新:与飞行器控制系统 4、汇川技术:工业机器人核心部件与整机 5、航天科技:航天工业机器人研...

史海拾趣

问答坊 | AI 解惑

西门子S7-300 150个问题解答之一(转载)

1:使用CPU 315F和ET 200S时应如何避免出现“通讯故障”消息? 使用CPU S7 315F, ET 200S以及故障安全DI/DO模块,那么您将调用OB35 的故障安全程序。而且,您已经接受所有监控时间的默认设置值,并且愿意接收“通讯故障”消息。 OB 35 默认设置为 ...…

查看全部问答∨

PROTEUS中文教程

网上 down到的, 拿来 分享 哈!…

查看全部问答∨

简析网络摄像机的几个优点

  关键字:网络摄像机   随着人民生活水平的提升以及对安防要求的提高,传统意义上的模拟本地化监控已经远远不能满足市场需求。而网络系统的飞速发展,使得依靠网络进行远程视频监控成为可能。目前,随着互联网的大范围普及,远程监控已经渗透 ...…

查看全部问答∨

单片机系列选型?

现在市面上的单片机,实在是太多了。。。 而高校的教材呢,学的都是老古董了。。。 不知道怎么选择单片机,从系列来比比吧? 恳请大侠赐教。。。。…

查看全部问答∨

rtems 应用程序

请问各位大牛,有没有人开发过rtems下应用程序,希望能给我一个.c 文件让我看看。。…

查看全部问答∨

【转帖】飞凌2010人才招聘信息——希望对大家有帮助

飞凌2010人才招聘信息 嵌入式系统硬件研发工程师职位 岗位职责:           1、负责嵌入式系统硬件开发工作;     2、负责ARM相关产品的硬件开发工作;     3、负责定制型项目的硬件开 ...…

查看全部问答∨

wince6 还需要virtualcopy干撒?

探讨一下: wince6下,应用程序已经不能用virtualcopy来做映射了, 而驱动一般运行于内核态,内核态是可以随意访问所有空间的, 只要oemaddresstable中有了映射(每段基地址+长度),知道了物理地址对应的虚拟地址了(具体寄存器可以用基地址+偏 ...…

查看全部问答∨

有没有人用SJF2440烧录过K9F4G08\K9F8G08的弟兄?

好像没有发现现成的支持烧录K9F4G08\\K9F8G08的SJF2440 ?哪位弟兄能提供一下 ?多谢!…

查看全部问答∨

以太网信号质量问题之收发器偏置电阻的处理

本文主要讨论了以太网物理层收发器驱动偏置电阻处理对于网口信号质量的影响。通过一个测试案例展开了对DAC驱动偏置机理的探讨,对后续加强对基准参考类元器件处理的有一定的参考意义…

查看全部问答∨
小广播
最新机器人文章

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关:

词云: 1 2 3 4 5 6 7 8 9 10

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved