人工智能
(文章来源:科技大兔子)
1895年的默片《抵达西奥塔火车站》引起了轰动效应,据报道,当时的观众第一次看到电影,当他们看到列车迎面驶来的时候,为了安全而疯狂奔跑躲避,因为他们认为火车会从银幕当中冲出来,考虑到早期的电影制作水平,那低分辨率的模糊影像,很难想象如果那些惊慌失措的电影爱好者看到丹尼斯·雪里亚夫(Denis Shiryaev)发布的人工智能增强升级版,会是什么表现。
雪里亚夫利用了两个公开提供的增强程序:DAIN和Topaz实验室的Gigapixel AI,将原始视频转换为4K 60FPS的片段。根据Topaz实验室的网站描述,Gigapixel AI使用了一种专有的插值算法,该算法“分析图像,识别细节和结构,并‘填充’图像”。实际上,Topaz是在教人工智能精确地锐化让图像变得更清晰,即使图像被放大了6倍。另一方面,DAIN在现有视频剪辑的关键帧之间使用插帧技术,这和4K电视上的动作平滑功能是同一个概念,通过插帧技术将视频的帧速率增加到60 FPS。
这两个技术方案都是通过技术手段提升视频分辨率的方式,自1998年第一台高清电视上市以来,视频技术就成为了电视节目制作的重要组成部分,旧式标清电视的分辨率为720*480,一帧画面显示的像素总计为345600个,高清电视的显示分辨率为1920×1080像素总数2073600个,是标准清晰度的六倍,而4K电视机的分辨率为3840x2160,需要8294400像素。
高清分辨率图像变成4K分辨率还需要再补充600万个像素,所以结束解决方案都是在想办法让这额外的像素得以在原始画面中进行显示,根据周围像素点显示的内容来预估新增像素的显示内容,这也就是插值技术的原理。
临近插值法,简单的填充与最接近的像素相同颜色的空白像素,这种方法简单有效,但是会产生锯齿状,像素化明显的图像。双线性插值法需要更强的处理能力,它能分析两个最邻近像素,并在它们中间形成梯度,从而锐化图像,双三次插值法是从16个最邻近点采样,结果是着色最精准,但是图像变得模糊。通过结合双线性和双三次插值法,电视可以解析每个方法的优缺点,并最终生成与原始图像相比具有最小的光学质量损失的放大图像。
插值的过程本身是一个计算过程,那么人工智能就有了用武之地,通过使用深度神经卷积网络,像DAIN这样的程序可以分析和映射视频剪辑,然后在现有帧之间插入生成的填充图像。
这种效果还不能称得上完美,在处理过的图像中仔细检查还是能够看到一些视觉的虚影,而到大银幕上去看,前景对象和对象的内部表现都很不错,但是如果看对象的边缘或者背景连接处会感觉有些撕裂。不过,尽管还有缺陷,但是这些技术也让我们看到了诱人的前景,那些老电影能够因此而实现复兴吗?
(责任编辑:fqj)
全部0条评论
快来发表一下你的评论吧 !