眼动追踪——人机交互的新形式

今日头条

1142人已加入

描述

作者:Christoph Goeltner欧司朗光电半导体产品经理

强大的计算机芯片、高效的红外 LED 和现代相机传感器现在使以前复杂的眼动追踪系统能够适应消费者应用。这些系统使设备能够检测用户的眼球运动并识别用户下一步想要做什么。结合已建立的输入法,眼动追踪开辟了人机之间大量新的直观交互。

几十年来,键盘和鼠标一直是我们操作计算机的传统工具。随着智能手机和平板电脑等移动设备的到来,需要新技术来与这些既没有键盘也没有鼠标的微型计算机进行有效的通信。触摸屏成为使这些电子伴侣易于使用的关键技术。语音识别的加入让一切变得更加直观。

预期的设备

随着物联网变得司空见惯,我们想要与之通信的电子设备的数量将进一步增加。一个很好的例子是智能家居,已经可以使用语音控制恒温器。未来我们还将与机器人互动。除了交互式工业机器人外,还有用于家庭和医疗保健领域的机器人助手已经在开发中。今天,设备可以通过触摸屏接收命令,并通过内置麦克风听到用户想要的东西。在眼动追踪系统的帮助下,他们还能够检测到用户正在看什么,并预测他们接下来想要做什么。这将为人机之间的直观交互开辟一系列新的可能性。

在许多情况下,用于眼动追踪的硬件已经可用

眼动追踪系统检测一个人的眼球运动和他们注视的方向。最初,它们是为市场研究、行为分析和可用性研究而开发的。而且它们也已经使用了一段时间,以帮助不再使用双手操作计算机的人。其中许多系统使用红外光照亮用户的眼睛,用相机拍照并根据图像数据计算眼球运动。这样的系统需要特殊的高质量相机、光源和软件。有时会添加硬件加速器来处理大量图形数据。如今,极其强大的芯片、紧凑型相机传感器和现代大功率 LED 使眼动追踪功能能够集成到智能手机等消费设备中。更重要的是,在许多设备中,摄像头传感器和红外光源已经被用于其他功能,例如面部识别或虹膜识别。所需要的只是一个合适的软件来集成眼动追踪作为附加功能。

目前的发展

目前正在各个领域开发能够将眼动追踪用作新的附加人机界面的概念。已经展示了具有眼动追踪功能的智能手机和平板电脑,其中目光接触用于激活图标或移动屏幕上的角色。具有眼动追踪功能的游戏电脑让游戏玩家有一种更多地参与到行动中的感觉。已经提出了一些系统,其中游戏玩家可以使用眼球运动来控制屏幕上角色的视点,而不是使用鼠标或触控板。眼动追踪可以以与计算机大致相同的方式使用——例如,使用眼睛滚动浏览文档。在智能家居领域,也有使用眼神接触与各种设备进行交流的方法。例如,已经展示了具有眼动追踪功能的智能电视。在汽车领域也提出了这些系统的可能应用。一个很好的例子是驾驶员活动助手,它监控驾驶员的眼睛以检测疲劳迹象。眼球追踪功能还可用于检测驾驶员注视的方向,并确定他是在关注前方道路还是分心。这些信息将有助于避免道路上的危急情况。

消费领域的眼动追踪系统

用于上述应用的现代眼动追踪系统基于用于照亮眼睛的红外 LED (IRED) 和记录眼睛反射光的高分辨率相机传感器。图像处理算法获取这些原始数据并计算瞳孔的位置(图 2)。使用有关参考对象(例如屏幕)位置的信息,特殊软件能够确定用户正在查看的确切位置。红外照明保证虹膜和瞳孔之间必要的对比度,无论眼睛是什么颜色,尤其是在黑暗中或屏幕背景非常明亮的情况下。

这种系统目前的射程可达一米。智能手机和平板电脑的典型工作距离约为 30 厘米,台式电脑约为 60 厘米。屏幕上的分辨率对应于眼睛的光栅大小,平板电脑约为 1 厘米,电脑约为 2 厘米。使用的 IRED 数量以及发射器和摄像头的具体布置取决于应用类型,即工作距离和要覆盖的区域大小。设置也可能因所使用的眼动追踪软件而异,因为设计的几何形状还取决于算法可靠检测瞳孔方向的能力。通常来说,一般来说,发射器和相机传感器必须以一定的角度和相对于彼此的一定距离布置,以避免来自眼镜的眩光或从眼睛直接反射到传感器。该距离越大,信号质量越好,用户与设备之间最佳距离的选择也就越灵活。

用于眼动追踪系统的红外 LED

例如,与虹膜扫描仪不同,虹膜扫描仪大多需要特定波长,眼动追踪系统在宽光谱范围内运行。这些系统通常利用现有的虹膜扫描或面部识别系统以及波长为 850 或 810 nm 的现有 IRED。人眼将波长为 850 nm 的 IRED 感知为微弱的红光。许多眼动追踪解决方案制造商更喜欢 940 nm,因为这种光几乎是肉眼看不见的。然而,目前,940 nm 设计的缺点是目前普遍使用的相机传感器针对可见光进行了优化,并且在红外光谱中的灵敏度较低。在 940 nm 处,这种减少非常显着(图 3) 必须增强红外照明才能达到与 850 nm 光源相同的信号强度。然而,鉴于基于红外照明的大量不同应用,相机制造商正在开发具有良好红外灵敏度的新版本。

人机交互

图 3:针对可见光优化的标准相机传感器的灵敏度在 850 nm 和 940 nm 之间显着下降。具有 940 nm IRED 的眼动追踪系统具有人眼几乎无法察觉的优势。在大多数情况下,它们必须用更高的工作电流来补偿降低的信号电平。资料来源:欧司朗

理想情况下,两只眼睛都应该在相机传感器的捕捉区域内。均匀照亮整个眼睛很重要。所需的红外光量取决于工作距离,可能是几瓦,即使对于移动设备也是如此。为了尽可能降低由于高工作电流导致的热输出,发射器以脉冲模式工作。尽管如此,热管理是设计的一个重要方面,尤其是在更轻、更薄的智能手机和平板电脑中。在这方面,除了光输出之外,IRED 的效率是一个主要因素。效率越高,产生的热量就越少。

针对此类应用,欧司朗开发了 Oslon Black 系列,并通过 SFH 4715A 实现了 48% 的创纪录效率。850 nm 发射器通常在 1 A 时提供 770 mW 的光输出,目前它是该工作电流下最高效的 IRED。借助纳米堆栈技术,每个芯片提供两个发射中心的堆栈版本可以实现更高的输出。SFH 4715AS 通常在 1 A 的电流下产生 1340 mW 的光。发射角为 90 度和 150 度的两个版本涵盖了广泛的不同设计。Oslon Black 版本在 1 A 时具有 990 mW 的光输出,是 940 nm 光源的理想选择。

人机交互

图 4:Oslon Black SFH 4715AS 是目前可用的最强大的 IRED 之一,波长为 850 nm。它以 1 A 的电流提供 1340 mW 的光。由于其低高度,它不仅适用于当今的智能手机,而且适用于下一代设备。资料来源:欧司朗

Oslon Black 的一个特点是组件高度低,仅为 2.3 毫米。因此,该 IRED 不仅适用于当今的智能手机,而且适用于下一代设备,尽管设备趋于更薄。

与任何具有红外光源的应用程序一样,眼动追踪系统必须符合眼部安全标准。到达普通用户的红外辐射量相对较低。但是,对于技术人员可能有近距离观察红外光源的风险的情况,必须采取预防措施。连接到眼动追踪系统的接近传感器确保在这种情况下 IRED 被关闭。有关光学系统安全设计的更多信息,请参见欧司朗眼睛安全应用说明等。 

我们被如此多复杂的电子设备所包围,因此需要新的附加技术来实现人机之间的直观交互。红外照明和摄像头传感器的结合为各种交互技术提供了基础,在这些技术中,设备可以看到用户并解释他们的意图。眼动追踪的例子展示了如何在这种硬件的基础上,以软件解决方案的形式实现新型交互。硬件组件的创新也在推动这一发展。例如,有一种趋势是使用波长为 940 nm 的光源。因此,欧司朗正在扩展其用于面部识别、眼动追踪和类似应用的红外发射器产品组合。

审核编辑 黄昊宇

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分