利用人工智能,科学家现在甚至可以在智能手机上快速生成照片级真实感彩色3D全息图。根据一项新的研究显示,这项新技术可以在虚拟现实(VR)和增强现实(AR)耳机以及其他应用中得到应用。
全息图能够出色地展现3D世界,而且它的呈现效果非常漂亮。全息图可以根据观看者的位置提供变化的视角,并允许眼睛调整焦深以交替聚焦在前景和背景上。
提起三维场景可视化,虚拟现实(VR)是最常见的一种技术。虽然用户实际上是注视着 2D 显示器,但 VR 会产生 3D 观看的错觉,从而使人视觉疲劳和感到头晕恶心。更好的 3D 可视化解决方案可能在于一种诞生了六十年的技术:全息图。
然而,尽管像三星这样的公司最近在开发能够显示全息视频的硬件方面取得了长足的进步,但实际生成全息数据以供此类设备显示仍然是一个重大挑战。
长期以来,研究者们一直在试图制造出计算机生成的全息图,但传统上,该过程需要一台超级计算机来进行物理模拟,这非常耗时,并且产生的效果真实感不高。
为了把全息影像带给大众,科学家们尝试了许多不同的策略来减少所需的计算量——例如,用简单的查找表代替复杂的物理模拟。然而,这些往往以牺牲图像质量为代价。
现在麻省理工学院(MIT)的研究人员已经开发出一种新的方法,几乎可以瞬间产生全息图——这种基于深度学习的方法非常有效,它可以在笔记本电脑上一眨眼就产生全息图。他们在近日的《自然》杂志上详细介绍了他们的研究结果,该研究部分由索尼公司资助。
麻省理工学院计算机科学家Liang Shi说:“一切都神奇地完成了,这真的超出了我们的预期。”
Shi指出,利用物理模拟计算全息图涉及到计算全息图中许多块的外观,然后将它们结合起来得到最终的全息图。他说,使用查找表就像记忆一组常用的全息图块,但这牺牲了准确性,仍然需要组合步骤。
在某种程度上,计算机生成的全息图有点像计算如何切蛋糕,Shi说。使用物理模拟来计算空间中每个点的外观是一个耗时的过程,类似于使用八次精确切割来生产八片蛋糕。使用计算机生成全息图的查找表就像在切割前标记每个切片的边界一样。虽然这样做省去了计算切割位置的步骤,节省了一点时间,但执行所有八次切割仍然需要大量时间。
相比之下,新技术利用深度学习,从根本上解决了如何只切三次蛋糕就把蛋糕切成八片的问题,Shi说。卷积神经网络——一个大致模拟人脑如何处理视觉数据的系统——学习“捷径”来生成一个完整的全息图,而不需要单独计算每一块全息图的显示方式,“这将使总运算量减少几个数量级,”他说。
研究人员首先建立了一个由4000张计算机生成的图像组成的自定义数据库,每个图像都包含每个像素的颜色和深度信息。该数据库还包括对应于每个图像的三维全息图。接下来,算法开始发挥作用。卷积神经网络学习如何生成新的全息图,通过多摄像头设置或激光雷达传感器进行计算。
新系统需要不到620 kilobytes的内存,并且可以在单个消费级GPU上每秒生成60幅分辨率为1920×1080像素的彩色3D全息图。研究人员可以在iPhone11Pro上以每秒1.1个全息图的速度运行它,在Google Edge TPU上以每秒2个全息图的速度运行它,这意味着有朝一日它可以在未来的虚拟现实(VR)和增强现实(AR)移动耳机上实时生成全息图。
实时 3D 全息技术还有助于 VR、3D 打印等系统的发展。研究团队表示,新系统可以帮助 VR 观众沉浸在更真实的场景中,同时消除眼睛疲劳和长期使用 VR 的其他副作用。这项技术可以很容易地应用在调制光波相位的显示器上。目前,大多数价格合理的消费级显示器只调节亮度,但如果广泛采用 3D 全息技术,相位调制显示器的成本会下降。
未来的研究可能会增加眼睛跟踪技术,通过创建只有眼睛看的地方才有高分辨率的全息图来加速系统的速度,Shi说。另外,他补充,另一个方向是根据人的视觉敏锐度来制作全息图。
原文标题:研究人员推出3D全息图生成新方法 可在智能手机上实时运行
文章出处:【微信公众号:IEEE电气电子工程师学会】欢迎添加关注!文章转载请注明出处。
责任编辑:haq
全部0条评论
快来发表一下你的评论吧 !