HSE研发出从单张照片识别人脸的新型神经网络

EdXK_AI_News 2018-07-24 2796

电子说

1.4w人已加入

描述

借助于深度神经网络，俄罗斯国立高等经济大学的人研究人员已经提出了一种新方法，能够从视频中识别出人的身份。该方法不需要大量的照片，并且与现有方法相比具有明显更高的识别准确度——即使只有某个人的一张照片可用。

面部识别技术在过去几年中发展迅速。作为验证和识别个人身份的工具，这些技术被用于各种领域，从打击恐怖主义的执法机构到社交网络和移动应用。许多国际公司和世界领先大学的研究小组正在不断对数据和仪器本身进行试验，以提高识别的准确率。

识别可以通过多种方式进行，但最近在高精度神经网络的帮助下获得了最好结果。神经网络获得的训练图像越多，该过程就越有效。网络可以提取出关键面部特征，然后在识别未知图像时使用该知识。

现在，可以更容易地访问越来越多的照片数据集，并将这些数据集用于训练神经网络。对于受限的观察环境（具有相同的面部方向、照明等因素的照片），算法的准确性早已达到人类面部识别的能力水平。然而，在识别不受约束的条件下，收集到的视频数据具有可变的照明、角度和大小，实现高精度识别对研究人员来说是一个更大挑战。

国立高等经济大学信息系统与技术部教授Savchenko解释说：“网络能够以100％的准确度识别知名演员，因为演员的可用图像数量可能有数百万张。然而，随着神经网络中积累的知识的变化，这并不意味着它可以适应只有一张照片用作训练样本的情况并识别出人的身份。”

为了解决这个问题，国立高等经济大学的研究人员利用模糊集和概率理论来开发视频识别算法。在利用少量图像进行视频实时面部识别的实验中，该算法显著提高了若干众所周知的神经网络架构的准确度（比早期实验高2-6％），如VGGFace、VGGFace2、ResFace和LightCNN。

作为测试数据库，国立高等经济大学的研究人员使用以下传统数据集来对视频面部识别方法进行评估：IJB-A（IARPA Janus Benchmark A）和YTF（YouTube Faces）。这些数据集包含了著名人物（演员、政治家、公众人物）的免费图像，而这些图像是在不受约束的环境中和不同时间点从开放源头收集的。在最复杂的实验中，研究人员使用上述算法和来自于另一个具有更好分辨率的LFW（Labeled Faces in the Wild）数据集的相同人物的几张照片来识别来自YouTube视频中的人。而这些照片本身是在不同的时间（从20世纪70年代到21世纪10年代）和不同的地点拍摄的。

这种新方法的实质是利用参考照片的相关性信息，即它们之间的距离或差距。相似个体之间的联系（即数学模型中的距离）较小，而不相似个体之间的联系则较大。了解人与人之间的差异程度可以帮助系统在识别视频帧的过程中纠正错误。

Savchenko教授解释说：“算法估计一帧与一个人的接近程度，以及另一帧与另一个人的接近程度。然后，它比较这两个人的训练静态照片之间的相似程度。接下来，它将第三人添加进来并评估他与哪个人的相似度更高——第一个人或第二个人。然后它会纠正识别错误。”

该算法已经用针对固定计算机的Python语言实现，能够帮助用户在照片/视频专辑中查找和分组不同人的面部，并估计一个人的出生年份、性别和其他参数。研究人员还开发了一个Android应用程序原型，用于确定照片和视频中人物的年龄和性别。对照片库的分析能够实现对用户社交活动程度的自动评估，并识别用户的亲密朋友和亲戚。对于现代智能手机，该应用程序原型每秒能够处理15帧。据研究人员称，有了他们的方法，面部识别可以获得更高的准确率。

打开APP阅读更多精彩内容