使用事件相机来进行隐私保护的视觉定位新方式

3D视觉工坊 2023-02-21 797

描述

主要内容：

文章主要强调隐私保护下的视觉定位，这是近年来被很多研究者重视的一个研究方向，即在不伤害用户隐私的情况下进行算法的研究。

文章以此提出了一种使用事件摄像机的鲁棒、隐私保护的视觉定位算法，事件相机由于其高动态范围和小的运动模糊比传统相机有一定的优势，但是缺点在于事件相机存在很大的域间隙，难以直接应用传统的基于图像的定位算法，针对存在的问题，文章提出了一种策略，即在定位之前，把事件相机捕获的数据转换为传统图像形式，从隐私角度来看与普通摄像机相比，事件摄像机只捕捉到一小部分视觉信息，因此可以自然隐藏敏感的视觉细节，为了进一步加强隐私保护，还在两个级别上引入了隐私保护，即传感器和网络级别，传感器级保护旨在通过轻量级过滤来隐藏面部细节，而网络级保护则使用神经网络来隐藏私人场景应用中的整个用户视图，这两种级别的保护都涉及轻量计算，只会导致少量性能损失。

什么是事件相机？

我们大多数人对传统相机以及其拍摄的RGB图像很熟悉，但是对于事件相机应该是很少使用了解的。

早期的图像处理（其实现在更多也是）都是基于传统相机来做的，然而传统相机在应用中有两个很明显的问题，如下图，一个是运动模糊（当场景中的运动速度超过相机的采样速率之后就会产生运动模糊），虽然可以通过算法弥补运动模糊，但是计算开销很大，不满足实时需求；另一个问题是由于光线的问题造成曝光不足或者过曝的动态范围问题，强烈的阳光可能会使传统相机无法看清视野物体。

Event camera则从传感器层面解决传统相机的缺点，同传统相机不同，事件相机只观测场景中的“运动”，确切地说是观察场景中的“亮度的变化”，它只会在有亮度变化时输出对应pixel的亮度变化（1或0），具有响应快、动态范围宽、无运动模糊等优势。

对于传统的相机，从某种程度上是捕获一个静态/静止的空间，而Event Camera的目的是捕捉运动的物体。对于单个像素点，Event Camera只有接收的光强产生变化时，该像素点才会输出。比如亮度增加并超过的一个阈值，那么对应像素点将输出一个亮度增加的事件。Event Camera没有帧的概念，当场景变化时，就产生一系列的像素级（pixel-level）的输出。事件相机的每个像素点是独立异步工作的，所以动态范围很大。总结就是，传统相机以固定的帧率对场景进行全帧拍摄，所有像素同步工作。事件相机是每个像素独立异步工作，采样率高且仅对亮度变化（event）进行输出，一个事件（event，亮度变化）包括发生的时刻、发生的像素坐标和事件发生的极性。所谓事件发生的极性表示的是亮度相比于前一次采样是增加还是减少。

Contributions：

（1）使用事件摄像机在具有挑战性的条件下进行鲁棒定位

（2）传感器级隐私保护以缓解观察到的人的担忧

（3）网络级隐私保护以减轻用户的担忧

为什么要在隐私保护下进行算法研究？

如图1所示，定位应用的使用者可能会担心和提供商共享同样的视图，毕竟这在具有有限计算量的边缘设备，比如手机、AR眼镜等中是不可避免的，而且被观察的人也会出现担忧，被别人不知不觉就拍摄了照片。所以隐私保护下的视觉算法研究近年来被越来越多的研究者所关注研究。

Pipeline：

给定事件相机记录的事件流，算法输出在3D地图中找到的查询事件相机的6自由度姿态，如图1所示。

定位过程中的隐私保护：

提出了两个级别的隐私保护以防止信息共享过程中可能发生的违规行为。

（1）传感器级隐私保护，其专注于隐藏面部细节。

（2）网络级隐私保护，目标是在私人场景中进行定位，其用户可能希望完全隐藏他们正在查看的内容

传感器级隐私保护：

传感器级隐私保护在一致或弯曲的区域暂时移除，并将结果与原始体素混合，这种低级操作保留了静态结构，同时模糊了动态或面部信息，通过沿时间轴的中值滤波来过滤时间上不一致的区域，如图2a所示。

对于累积量不足的体素网格区域，由于信噪比较低，滤波过程可能会产生伪影。因此使用图2b所示的二进制阈值将过滤后的体素与原始事件体素混合。

网络级别隐私保护：

网络级隐私保护将用户的视图完全隐藏在私有空间中，不让服务提供商看到，同时节省了用户端的计算。在服务提供商和用户之间分割事件到图像的转换过程，其中推断是使用私人重新训练的重建网络完成的

但是考虑到服务提供商可能会攻击，如图3b所示，有三种可能的攻击：交换层推断、通用网络重新训练和目标网络重新训练。首先，在交换层推断中，采用的中间推断结果，并使用原始网络参数Θ运行其余的重建。另外两种攻击涉及使用服务提供商可能可用的大量事件数据重新训练一组新的网络。通用网络再训练使用与私人训练相同的训练目标训练随机初始化的神经网络。目标网络重新训练类似地使用相同的目标训练神经网络，但使用的共享参数值初始化网络的中间部分。使用重新训练的网络，服务提供商可以尝试交换层推断，如图3b所示。