本系列主要介绍图像信号处理器 (ISP, image signal processor) 中各核心算法模块的设计以及相关的前沿研究,以典型的相机成像系统为基础,涉及的内容包括各类缺陷校正,去马赛克,去噪,3A算法(自动对焦,自动曝光,自动白平衡),超分,HDR,风格迁移等主题。
本文将介绍一种生活中常见的计算机视觉话题,风格迁移。
背景介绍
人类通过视觉系统观察到一幅图像时,可以从图像中整合出高级的语义信息,将信息转化为知识,用知识处理更多的复杂任务。而对于计算机,可以采用深度学习的方法,用大量的数据使其学习出图片的高级语义信息,然后就可以借助高级语义信息处理复杂的任务。风格迁移是计算机视觉的一个重要的课题,风格迁移简单的说就是对于两张输入图片,实现生成的图片具有一张的内容另一张的风格。
应用简介
风格迁移有着诸多应用,比如可以实现把著名的艺术作品的风格迁移到普通的图像上,得到一幅新的具有特定艺术风格的图片,如下图所示。
还可以利用风格迁移实现模拟一张图片中场景由白天到黑夜、晴天到阴天的变换,来模拟实现场景的天气变化,如下图所示。
同时风格迁移技术在日常生活中的应用也随处可见。例如,日常生活中拍照时用到的美颜相机中的滤镜某种程度上是一种妆容迁移,如下图所示;最近很火的AI换脸,将两张明星的脸结合生成一张新的脸也与风格迁移的原理有关。
常用算法
非参数的方法:通常用数学模型和公式归纳生成纹理,纹理是图像中重复存在的视觉图案。纹理合成是在源纹理图像中增加相似纹理的过程。该方法耗时耗力,且灵活性不高,往往只能实现对特定风格的迁移。
基于笔触渲染的方法:在原内容图片的基础上逐步增加笔触至收敛,得到保留原图内容的具有新的风格的图像,优点是对于某些特定的风格迁移效果很好,比如素描、油画等,缺点是灵活性差。
采用类比的思想:通过类比图像之间的映射关系实现风格迁移,此方法需要大量成对的风格图片和相应的迁移后的图片作为训练数据集。优点是可以实现多种风格的迁移,缺点是难以找到合适的数据集,且由于捕捉的是低层次的特征信息,迁移效果不好。
基于图像滤波的方法:考虑到图像风格迁移实际上是一个图像简化和抽象的过程,图像滤波方法采用一些组合的图像滤波器(如双边和高斯滤波器等)来渲染给定的图片。优点是一定程度上达到了实时的效果,缺点是受限制于特定风格的迁移。
如今还有许多基于深度学习的方法,比如Gatys[1]提出的神经网络风格迁移算法,将神经网络引入风格迁移领域,取得了不错的效果,但是迭代周期过长,难以实际应用。后续也出现了一些其他的基于深度学习的算法,在图像风格迁移质量,速度,应用性各方面都有了相应的提升。
参考文献:
[1].Leon A. Gatys; Alexander S. Ecker;Matthias Bethge, "Image Style Transfer Using Convolutional NeuralNetworks," 2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR), Las Vegas, NV, 2016, pp. 2414-2423, doi: 10.1109/CVPR.2016.265.
[2].https://blog.csdn.net/dcrmg/article/details/81949849

 关 注 我 们 
实验室网站:http://viplab.fudan.edu.cn/
OpenASIC官方网站:www.openasic.org
知乎专栏:http://zhuanlan.zhihu.com/viplab
微信公众号:OpenASIC
继续阅读
阅读原文