描述
疫情下口罩成为标配,相关科技企业找到现实痛点并迅速推出解决方案,实现了戴口罩情况下的人脸识别/测温、打卡/通行等解决方案。但与此同时,一些用于打卡考勤或在社交平台发布的戴口罩的面部照片,正在被偷偷搜集并在网上进行兜售。
日前有媒体爆料,有卖家声称其手中有几十万张戴着口罩的人脸照片,2毛钱一张,十万张以上有优惠!这些照片来源,“一半是从网络上爬(虫)的,一半来自于现实世界。”对于来自于现实世界的照片,该卖家表示“就是打卡获取保存下来的,而且都是年后(拍)的,时间很新,你肯定在网上找不到。”
这些大量照片的潜在买家是谁或是可能被用于何种用途?据追溯,“这些戴口罩人脸图片被买走大多是用作训练算法的精准度,做戴口罩人脸识别的算法模型,肯定需要海量的戴口罩的人脸信息不断训练”,该卖家称,“口罩佩戴识别算法源码加上数据集一共1000元,单要人脸数据集的话也是1000元,都在网盘里,随时可发链接。”
细思极恐。
人脸识别高速普及背后的隐忧
从2015开始,人脸识别技术经历了从快速落地到多领域应用的井喷式发展,可以说是人工智能领域最为成熟的技术应用(没有之一)。随着在高铁票务、门禁与安防、智能手机、金融与移动支付等方面对人脸识别的规模化使用,人脸识别技术正在向更多行业渗透,业内人士评估在中国市场一年已近30亿规模。
但是,一方面是快速普及应用,另一方面是时有发生的安全漏洞及相关信息泄露事件。
去年,国内安防领域某人工智能企业被曝发生大规模数据泄露事件,超过250万人的数据被获取,有680万条数据疑似泄露,包括身份证信息、人脸识别图像及图像拍摄地点等。
同样引起关注的还有红极一时的AI换脸短视频应用软件“ZAO”,从走红到“凉凉”只经历了短短几天。还有杭州市的“中国人脸识别第一案”,将具体技术应用场景拉到法律框架下进行审视。
此外,还有照片“骗”开人脸识别的智能快递柜和小区门禁系统,甚至,还有某国外AI公司声称使用3D面具突破了手机APP中的人脸支付……
这些事件,从不同层面折射出快速普及化的人脸识别背后的多种隐忧。
人脸识别安全如何保障?
<电子发烧友>日前在一场以“口罩人脸识别、智能测温,AI助力抗疫装备升级”为主题的直播活动中,就“人脸识别落地主要挑战”发起了一项调研,根据调研结果来看,36%认为是个人隐私问题,33%表示对数据安全隐患存在担忧,27%认为技术本身有待继续提升,4%则对人脸识别使用的必要性存有疑问。
国内人脸识别应用火热的背后,隐私和安全的担忧其实一直存在。由于人脸识别系统存在多种被攻击的可能,例如早期被照片、合成视频仿冒攻击,以及近来引起关注的3D面具攻击方式。同时,人们担心数据遭到泄露,会被别有用心的人所利用。
就像一把双刃剑,人脸识别技术的使用成本、应用边界以及整体系统/网络的安全性都决定了它能否真正发挥出该有的价值。比如在实际的应用中,一些商家限于成本制约,采用了低成本、抗攻击能力弱的方案,就很容易被破解。或者,在落地应用中,如何恰到好处地应用人脸识别技术,既不过度采集,又不过度使用,需要在隐私、安全、便捷三者中找到恰当的平衡。这些都是人脸识别技术进一步普及中需要考虑到的因素,要得到人们的认可和信任,还需多措并举。
在<电子发烧友>的这场直播活动中,与会嘉宾就人脸识别的安全性分别发表了各自观点。
OPEN AI LAB产品总经理孙健峰提到,隐私保护和数据安全是他所看到的人脸识别落地的挑战之一。从技术的维度,他认为采用联邦学习进行算法训练是当前的一个解决思路。即:无需把前端隐私数据传到后端,而是基于这些数据在前端的算力上训练出小的参数模型,并且把这个模型贡献到集群中心,通过成千上万的小的终端获取到足够好的综合算法,再把这个算法下发到前端,这样既保证了足够好的准确性,同时保障了隐私和数据安全,这将是未来的一个发展趋势。
百度AI技术生态部高级产品经理吴延宇谈到了人脸识别技术未来需要提高活体检测的能力。针对高仿模具、高仿面具,还有一些成本很高的硅胶做出来的人像,对于这种级别的攻击,人脸识别如何去抵御,或是如何辅助硬件和一些策略去抵御攻击,这方面还有待提升。
智慧眼公共安全技术部经理/公共安全产品总监王飞认为,现阶段最需要立法的支持,规范在商业公司或是非政府行业的应用,相对高涉密的还需要在安全方面探讨技术以外的挑战。吴延宇也呼吁相应行业标准规范的陆续出台,包括软硬件规范、接口规范、架构规范、交付标准规范等等,这样才能保证整个行业进一步蓬勃发展。
当然,除了对抗攻击的技术升级、算法方面的优化等,方案中硬件平台的有力保障是根本。Arm中国安全技术市场总监王骏超告诉<电子发烧友>,根据人脸在本地设备还是服务器端比对验证,分为本地人脸识别和远程人脸识别两种,远程人脸识别认证系统主要由客户端、服务器端、安全传输通道组成,需要解决从人脸特征采集、数据加密存储、数据传输到比对验证环节的安全。本地人脸识别要求人脸特征采集和加密存储及比对需要在可信执行环境(TEE)中完成,远程人脸识别需要在TEE中对人脸特征数据加密后传输到服务器进行比对。
他认为,人脸特征采集阶段,需要提供摄像头传感器到TEE的安全通道以防止采集阶段人脸信息泄露,采集到人脸特征后在TEE中进行加密存储到本地或者传输到服务器端。本地比对时需要在TEE中进行,3D人脸识别需要CPU多核TEE或者CPU+专用计算单元(一般是DSP或者AIPU)实现,需要保障CPU和计算单元之间交互的安全性以及计算单元使用的内存与非安全应用内存隔离。在构建安全的人脸识别解决方案方面,Arm中国可提供包括支持人工智能安全的AIPU IP,以及基于TEE的一栈式方案。
结语
之所以出现人脸照片被泄露的事件,究其根本原因,还是AI现阶段在深度学习基础上对于数据的极度依赖性。正因为这些照片信息对于算法优化升级的价值所在,才吸引了买卖双方不惜冒险进行交易。
中国科学院院士、清华大学人工智能研究院院长张钹在谈到人工智能崛起的三大因素(数据、算法、算力)时曾表示,深度学习兴起之后,学界将目标转移至数据,提出“让数据说话”。这种(对数据的)强调对深度学习的发展起到积极的作用,但也有“很大的不足”:过分强调数量的重要性,会导致按照大数据建起来的人工智能系统面临不可信、不可靠、不安全、不易推广的挑战。他鼓励人工智能研究者,学习人类神经网络的结构,结合脑科学以改进深度学习模型,同时将知识驱动与数据驱动结合起来克服现有的一些不足。
根据前瞻产业研究院报告,预计未来4-5年人脸识别市场规模将保持年均25%的增速,2022年市场规模将达到约67亿元。
在欢呼声与质疑声中成长的人脸识别技术,在可以预知的很长一段时间内,可能都将在这样的冰火两重天中前进。这既是当前人脸识别技术所处的发展阶段所决定,同时也说明,人工智能离真正的普及、普惠,还有相当长的路需要跋涉。
注:文中所提到的戴口罩人脸照片被交易事件来源于中新经纬,张钹院士观点引自澎湃新闻。
本文由电子发烧友网原创,未经授权禁止转载。如需转载,请添加微信号elecfans999.
打开APP阅读更多精彩内容