电子说
(文章来源:中国光学工程学会)
人类所处的物理世界空间是三维的,对三维信息的获取和处理技术体现了人类对客观世界的把握能力,因而从某种程度上来说它是体现人类智慧的一个重要标志。传统光探测器仅对被测场景的二维强度敏感而无法感知其三维形貌与深度信息。人类虽可通过自己的双眼来感知三维的世界,但无法对客观事物的三维形貌进行准确量化的描述。
三维成像与传感技术作为感知真实三维世界的重要信息获取手段,为重构物体真实几何形貌及后续的三维建模、检测、识别等方面提供数据基础。近年来,随着计算机技术、光学和光电技术的发展,以光信号为载体的光学三维传感技术,融合光电子学、图像处理、计算机视觉与现代信号处理等多学科为一体,已发展成为光学计量和信息光学的最重要的研究领域和研究方向之一。
互联网技术的蓬勃发展指引着大数据时代的来临,以数据为推动的深度学习技术无疑是大数据时代的算法利器。相比于传统的机器学习技术,深度学习技术首先可利用不断增多的数据不断提升其性能,而传统机器学习技术无法做到这一点。其次,有别于传统方法需要手动提取特征,深度学习技术是一项全自动的技术,它可以从海量数据中直接抽取特征。并且,对于不同的任务,不再需要设计独特的特征提取器,所有工作都是深度学习自动完成。这是智能机器逐渐代替人工操作的一个显著体现,因此深度学习已成为大数据时代的一项热点技术,无论学术界还是工业界都对这项技术产生了浓厚的兴趣。
深度学习技术已在光学成像、计算成像、全息显微等诸多领域逐步渗透,并展现了巨大的潜力。条纹投影三维成像因其非接触、高精度、全场测量、点云重建效率高等优点,目前已成为一种主流的三维传感技术。在深度学习技术的辅助下,条纹投影三维成像的相位测量效率、相位测量精度与三维成像稳定性得到进一步提升。基于人工智能的新型条纹投影三维成像将有望为高端制造、在线检测、生物医疗等领域提供“即快又准”的三维数据。
作者首先简要回顾条纹投影三维成像的基本原理,包括条纹分析、相位展开以及三维重建。随后,列举了深度学习技术在条纹投影三维成像中的典型应用,包括基于深度学习的条纹分析、条纹图像去噪、相位展开、系统标定、三维重建以及超快三维成像。最后,作者从以下5个方面分析与总结了利用深度学习技术实现高性能条纹投影三维成像面临的挑战和未来的走向:
深度学习到底学到了什么?作者认为当前研究人员正尝试着用深度学习技术替代传统方法以实现条纹投影三维成像的某一基本过程,或者全部内容(端对端的策略)。然而对于大多数研究人员而言,深度学习方法预测最终结果的过程仍是一个“黑箱子”——只能通过最终的测试结果来判断神经网络的优劣。由于难以把握神经网络的推演机理,使得优化和提升神经网络性能的目标沦为了大量的试错。
深度神经网络的架构设计与优化。针对具体的条纹投影应用(如计算包裹相位、相位展开、高动态范围成像等),到底什么样的神经网络合适?尽管从前人相似工作中能找到网络结构设计的灵感,但是在神经网络后期的调试与优化过程中,如何调整超参数(如神经网络的类型、卷积神经网络中滤波器的尺寸、抽取特征的数量等)使得能够在自己的应用上表现出色仍是一个难以回答的问题。
训练数据的获取与标注成本高。对于条纹投影技术领域,训练数据的大规模获取与正确标注仍需要耗费大量的人力和物力成本。加之公开的数据集稀少,这都增加了深度学习技术的实施难度。尽管采用仿真的方式获取数据集可在一定程度上降低训练数据采集过程中的成本。但是仿真数据受制于有限的预设参数,它并不能完全等于真实数据。而深度学习的强大能力就在于学习与发掘输入数据与输出数据之间的潜在联系。因此,如何快速获得准确可靠的训练数据是提高深度学习技术在条纹投影技术领域应用效率的一个重要问题。
(责任编辑:fqj)
全部0条评论
快来发表一下你的评论吧 !