解密面部识别技术，AI如何识别人脸

独爱72H 2020-04-07 4397

电子说

1.2w人已加入

描述

（文章来源：神小无）

自从人工智能诞生之初，计算机科学家就一直梦想着能制造出可以像人类一样看到和理解世界的机器。这些努力导致了计算机视觉的出现。计算机视觉是AI和计算机科学的领域，致力于处理视觉数据的内容。近年来，由于深度学习和人工神经网络的进步，计算机视觉取得了巨大飞跃。深度学习是AI的一个分支，特别擅长处理图像和视频等非结构化数据。这些技术上的进步，在现有领域中极大促进了计算机视觉的应用，并将其引入新领域。现如今，计算机视觉算法已成为我们每天使用的应用中非常重要的组成部分。

关于计算机视觉，尽管它已经取得了巨大的进步，但它暂时还不能完全像人类一样理解照片和视频。深层神经网络是计算机视觉系统的基础，非常擅长在像素级别匹配模式。它们在分类图像和定位图像中的对象方面特别有效。但是，当要理解视觉数据的上下文，并描述不同对象之间的关系时，它们却效果惨淡。

计算机视觉取得巨大进步的领域之一是图像分类和物体检测。经过足够多的标记数据训练而出的神经网络，将能够以惊人的精度检测并标记出各种物体。很少有公司能与Google庞大的用户数据存储相匹配。该公司一直在使用其几乎无限多（并且正在不断增长）的用户数据存储库来开发一些最高效的AI模型。当用户在Google相册中上传照片时，它会使用其计算机视觉算法对场景，物体和人物的内容信息进行注释。然后，用户可以根据此信息搜索照片。例如，如果用户搜索“狗”，则Google会自动返回相簿中包含狗的所有照片。

但是，Google的图像识别效果并不理想。在一次事件中，计算机视觉算法错误地将两张皮肤黝黑的人的照片标记为``大猩猩''，这给该公司带来了极大的尴尬。

现在，有很多公司正在使用机器学习来自动增强照片的质量，例如白平衡并添加效果，模糊背景等等。智能计算机变焦是计算机视觉技术的一大进步。传统的缩放功能通常会使图像模糊，因为它们通过在像素之间进行插值来填充放大的区域。基于计算机视觉的缩放不是放大像素，而是着重于边缘，图案等功能。这种方法可产生清晰的图像。许多初创公司和历史悠久的图形公司已转向深度学习来增强图像和视频。

直到不久前，面部识别技术还是一项笨拙且昂贵的技术。但是近年来，由于计算机视觉算法的进步，面部识别已进入各种智能计算设备。智能手机引入了FaceID，这是一种身份验证系统，该系统使用设备上的神经网络在看到拥有者的脸部时将手机解锁。

在设置过程中，FaceID在所有者的脸上训练其AI模型，并在不同的光照条件，面部毛发，理发，帽子和眼镜下正常工作。在我国，许多商店现在都在使用面部识别技术为顾客提供更顺畅的付款体验。客户无需使用信用卡或移动支付应用程序，而只需要向配备了计算机视觉的相机展示自己的脸即可。

随着物联网（IoT）的蓬勃发展，连接互联网的家庭安全摄像头日益普及。现在，用户可以随时轻松地安装监控摄像头并在线监视房屋。每个摄像头都会向云端发送大量数据。但是安全摄像机记录的大多数镜头都是无关紧要的信息，从而导致大量的网络、存储和电力资源浪费。

计算机视觉算法可以使家庭安全摄像头在使用这些资源时变得更加高效。通常情况下，智能摄像头会保持空闲状态，直到它们在视频源中检测到物体或物体移动，然后它们才开始将数据发送到云端或向摄像头所有者发送警报。但是目前，计算机视觉仍然不能很好地理解上下文环境。因此，不要指望它能在良性运动（例如，球在房间内滚动）和需要注意的事物（例如，小偷闯入房屋）之间区分开来。

在过去的几年中，增强现实已经成为一个不断增长的市场。AR的大部分扩展归功于计算机视觉算法的发展。AR应用程序使用机器学习来检测和跟踪目标位置和放置虚拟对象。你可以在很多应用中看到AR和计算机视觉的结合。

利用计算机视觉，你可以通过手机摄像头从现实世界中提取信息。它可以使用计算机视觉算法执行各种任务，例如读取名片，检测家具和衣服的风格，翻译路牌以及将手机连接到基于路由器的wi-fi网络。由于深度学习的进步，计算机视觉现在可以解决以前很难解决甚至计算机无法解决的问题。在某些情况下，训练有素的计算机视觉算法可以与经验丰富的工作人员相媲美。

在深度学习之前，创建可以处理医学图像的计算机视觉算法需要软件工程师和相关专家付出大量的努力。他们必须合作开发从放射影像中提取相关特征的代码，然后对其进行检查以进行诊断。深度学习算法提供了端到端的解决方案，使该过程变得非常容易。计算机视觉已进入许多医学领域，包括癌症检测和预测、放射学、糖尿病性视网膜病变。一些AI研究人员甚至说深度学习将很快取代放射科医生。不过，不要忘了深度学习是从像素中提取信息的，所以它不能复制人类医生的所有功能。

教计算机玩游戏一直是AI研究的热门领域。大多数游戏程序都使用强化学习，这是一种AI技术，可以通过反复试验来发展其行为。计算机视觉算法在帮助这些程序解析游戏图形内容方面发挥着重要作用。但是要注意的一件事是，在许多情况下，图形会被“简化”或简化，以使神经网络更容易理解它们。此外，目前AI算法需要大量数据才能学习游戏。例如，OpenAI玩Dota的AI必须经历45,000年的游戏时间才能达到冠军水平。

2016年，亚马逊推出了Go，这是一家无人商店，顾客可以走进商店，拿起想要的东西，然后走出去。Go使用各种人工智能系统来消除对收银员的需求。当顾客在商店中走动时，配备了高级计算机视觉算法的摄像头会监控他们的行为，并跟踪他们拾取或返回货架的物品。当他们离开商店时，他们的购物车会自动从他们的Amazon帐户中结账。

在没有人类驾驶员的情况下可以在道路上行驶的汽车，一直是AI社区最长的梦想和最大的挑战之一。在今天，我们距离能在各种光照和天气条件下，在道路上任意行驶的自动驾驶汽车这个梦想还很遥远。但是，由于深度神经网络的进步，我们取得了许多进步。打造无人驾驶汽车的最大挑战之一是使他们能够了解周围的环境。

尽管不同的公司以各种方式解决该问题，但它们之间不变的一件事是计算机视觉技术。车辆周围安装的摄像头可监控汽车的环境。深度神经网络解析镜头并提取有关周围物体和人物的信息。该信息与来自其他设备（如激光雷达）的数据相结合，以创建该区域的地图，并帮助汽车在道路上行驶并避免碰撞。

随着“新基建”风口的到来，在5G、物联网传感器、具有AI功能的智能摄像头和边缘计算的推动下，计算机视觉领域将迎来快速爆发。钛灵AI市场是由Google AI技术推广伙伴Gravitylink打造的全球化AI算法和解决方案交易市场，致力于帮助来自全球的优秀AI解决方案与需求方建立更加高效的直接连接，加速AI技术在各个领域的落地和应用。
（责任编辑：fqj）

打开APP阅读更多精彩内容