作为一名编辑,除了文字工作等主要工作外,往往还需要考虑一个非常重要的问题:插图。
全是文字的文章肯定不如图片形式的文章那么吸引眼球,更何况是在这个视频时代。因此,我每次写文章时,都要从无版权的图片网站中精挑细选,使图片和文章的图像契合主题,最好是高分辨率的。
但总有惊喜。有时候遇到分辨率不够但最合适的图像是很苦恼的。直接在文章中插入低分辨率的图片显然会造成视觉上的不适。舒服的。虽然现在PS甚至Windows自带的绘图工具都可以修改图像分辨率,但是强制拉伸的结果只会是:图像非常模糊。
可以看到,拉伸图像后,图像边缘出现了明显的毛刺。
那么有没有什么方法可以无损放大图片呢?
别告诉我,它确实存在。 GitHub 上的这个项目“waifu2x”可以做到。
项目地址为https://github.com/nagadomi/waifu2x。有兴趣的朋友可以研究一下。网页版地址为http://waifu2x.udp.jp/。
废话不多说,这里是使用waifu2x和普通拉伸图像的对比(左边是拉伸,右边是使用waifu2x的效果)。
可以看到,使用waifu2x放大图片后,“5G”边缘的毛刺感不再明显。虽然有些地方还存在噪音问题,但总体来说,效果比直接拉伸要好很多。
那么waifu2x为什么可以无损放大图像呢?这是因为waifu2x 使用了一种称为SRCNN 的卷积算法。传统上,图像超分辨率问题研究如何在输入低分辨率图像(LR)时获得高分辨率图像(HR)。 )。传统的图像插值算法在一定程度上可以实现这种效果,例如最近邻插值、双线性插值、双三次插值等,但这些算法获得的高分辨率图像效果并不理想。
SRCNN是第一个采用CNN结构(即基于深度学习)的端到端超分辨率算法。它利用深度学习方法实现了整个算法过程,效果优于传统的多模块集成方法。 SRCNN流程如下:首先对输入进行预处理。使用双三次算法将输入的低分辨率LR图像放大到目标尺寸。那么接下来算法的目标就是通过卷积网络对输入的模糊LR图像进行处理,得到超分辨率的SR图像,使其尽可能与原始图像的高分辨率HR图像相似。
与Bicubic、SC、NE+LLE、KK、ANR、A+等超分辨率算法相比,SRCNN在大部分指标上表现最好,恢复速度也名列前茅,RGB通道的联合训练效果也是最好的。最好的。这就是说,相比于照片,waifu2x在放大插画(你最喜欢的二维图片)时会更有优势。
关于SRCNN卷积算法,可以前往https://arxiv.org/abs/1501.00092了解更多详情。
那么既然图片可以无损放大,那么视频呢?
结果当然是可行的,不过这次使用的工具叫做Topaz Gigapixel AI for Video。该软件经过数千个视频的训练,并结合多个输入视频帧的信息,以实现真正的细节和运动一致性。高清视频达到8K 分辨率。
作为一个人工智能软件,它需要一台快速的计算机。推荐的系统配置是32 GB RAM 加上具有6GB 或更大显存的NVIDIA 显卡。虽然在旧电脑上勉强可以运行,但速度会很慢。
那么Topaz Gigapixel AI for Video是如何放大视频的呢?事实上,在安装过程中,你会发现这个软件会安装TensorFlow库和cuDNN库,所以很明显,该软件使用了基于深度学习的卷积神经网络来处理每一帧,并在整个过程中运行CUDA单元(不然不会这么慢)。
熟悉显卡的朋友都知道,显卡作为电脑主机的重要组成部分,是进行数模信号转换的设备,负责图形的输出和显示。显卡连接到计算机主板。它将计算机的数字信号转换为模拟信号以显示在显示器上。同时,显卡还具有图像处理能力,可以辅助CPU工作,提高整体运行速度。显卡对于从事专业图形设计的人来说非常重要。民用和军用显卡的图形芯片供应商主要包括AMD和NVIDIA(英特尔今年也将加入竞争)。
GPU的组成比较简单。它拥有大量的计算单元和超长的流水线。特别适合处理大量统一类型的数据,例如矩阵乘法和加法。因此,显卡在AI领域的应用变得非常广泛。 CUDA是NVIDIA推出的并行计算框架,只能在自家的GPU上使用。只有安装这个框架才能进行复杂的并行计算。主流深度学习框架也是基于CUDA进行GPU并行加速,Tensorflow也不例外。
不幸的是,Topaz Gigapixel AI for Video 仍然相对昂贵。近200美元的价格可以让很多人望而却步,但是对于修复或者修复一些古代影视作品来说还是相当有用的。现在B站上搜索到的不少【4K修复】视频都是基于这款软件制作的。
现在想想,AI的出现确实解决了生活中的很多实际问题。如果没有卷积神经网络的快速发展,看到古代影视作品的高清翻拍可能只存在于想象中。
(7855060)