近日,国际著名AI学术机构CCF-A类顶尖会议IJCAI (International Joint Conference on Artificial Intelligence)发布了其2024年度论文名单,西安电子科技大学通信工程学院何刚教授带领的研究团队发表了名为“Beyond Alignment: Blind Video Face Restoration via Parsing-Guided Temporal-Coherent Transformer”的优秀科研成果,这项研究致力于开发先进的视频人脸修复算法,以应对低质量视频下人脸特征不清晰的问题。
人脸恢复是一项通过提升图像质量来使面部特征更加清晰的技术,主要包括去模糊、去噪、恢复等步骤。而视频人脸恢复则是将此技术应用到视频序列中,除了要处理每一帧的图像质量外,还需保持时间上的连续性和自然过渡,以确保视频中人脸的动态表现和质量的一致性。
因此,算法必须能有效地处理视频中的运动模糊、压缩损失等问题。近年来,人脸恢复技术得到了广泛关注与研究,并已在工业界得到了广泛应用。
本次研究首次提出了一种全新的盲视频人脸恢复方法——解析引导的时间一致性变换器(PGTFormer),旨在解决现有技术在处理低质量视频人脸时面临的难题。
该方法无需预对齐即可恢复高保真的人脸细节,同时增强视频中不同姿态变化的时间连贯性。此外,研究团队还引入了时间空间矢量量化自编码器(TS-VQGAN)的预训练模型及时间解析引导的码本预测器(TPCP),这些创新技术极大地提升了人脸恢复的效率和准确性。
全部0条评论
快来发表一下你的评论吧 !