欢迎光临散文网 会员登陆 & 注册

【本科启蒙论文】基于图像修复浅谈数字图像处理技术的发展

2022-09-25 16:42 作者:当心山药  | 我要投稿

前言:因为不想在本科期间认真写的文章,只是给课程评个分就消失,所以在专栏投一下稿。

这个系列就叫【本科启蒙论文】 


摘要:图像修复技术近二十年来有了巨大的发展和变化。图像修复技术与计算机视觉深度学习的发展进程有一定的相似之处。通过介绍图像修复技术引出通过计算机自动计算修复图像的新方案,并介绍最新的计算机视觉技术来概括数字图像处理技术的发展。

关键词:图像修复、CVPR、计算机视觉、图像识别、计算机深度学习

        网红经济的发展吸引了大量的游客前往网红景点“打卡”。门庭若市的网红店却让其他顾客的身影作为照片的背景。实在是不讨人欢喜,快速去掉背景中不想要的图像,填补上原本的风景,是一项十分实用的技术。

        抠图本质是就是计算机对图片进行计算学习,对不需要的部分进行自动填补的图像修复技术。这项技术还能够应用到老旧照片的修复和还原上。对于年久破损和氧化明显的老照片来讲,数字化方法是挽救这些照片的最好手段[1]。在沈铭先生的文章中我了解到,在20年前的时候,图像处理技术值能够实现对颜色的调整后,设置选区羽化值,实现颜色的弥合过渡,来实现颜色尽量接近自然的颜色。经过Photoshop3.0到2021的版本迭代,如今的Photoshop已经拥有了内容识别,液化等自动计算的效果,能够最真实还原图像缺失的部分。

        所谓数字图像处理技术,就是计算机实现了对图像进行增强、分割、复原、编码以及压缩的处理过程。它们在遥感航空航天领域、医药医学领域,通信工程领域都得到了广泛的应用。这些过程并不是计算机系统或者图像处理软件与生俱来的能力,是在人类一次又一次对于图像处理技术的算法进行优化升级的过程中,计算机不断学习而来的成果。

        传统的两种图像修复算法有两种。一种是扩散修复。对图像比边缘进行一个微分运算。向空缺内部进行修复填补;一种是补丁修复。选取一个范围作为补丁,再选取其他与之相似的区域,对其进行填补。二者在图像修补的过程中都有一定的局限性。前者对于一些狭小的间隙缺失处有很好的修补效果。后者无法完美修复一些包含语义的图像。

        为了更好的了解图像修复技术。我们应该了解计算机是如何分析图像和学习新的算法的。首先我们从人的视觉出发。当我们肉眼看到一片图像内容缺失的时候,我们会先设想空白处缺失部分的结构和边缘,再根据包含内容的部分对缺失部分进行纹理和色彩的填充。而计算机要处理图片,它需要学会分类,学会分割,学会实例检测然后学会可以用于图像修复的缺失部分的内容进行填补[3]。所谓的图像修复技术,就是对需要的图像区域进行修复使得视觉上看不到偏差图像处理技术[3]。传统的图像修复技术各有各的弊端,而深度深层模型的出现给图像修复技术带来了更多的可能性。

        目前用于图像修复的深度深层模型主要有三个方面。

        首先是对于图像网络结构的设置方面。网络如何如何提取并且建立确实区域内外之间的联系与long·term之间的关系对于确实区域生成好的结构是十分重要的。在ContextEncoders[4]中提到了一种实现效果优于传统图像修复算法的修复方式。为了对缺失部分的内容进行预测,设置一个fc层的结构去编码图像上下文计算出缺失部分的内容。缺点是使用这种方式只能对固定大小的图像进行修复,结果也比较模糊。在TOG 2017的一篇论文中,提到了使用FCN加dilate卷积的网络来获得随机输入大小,使用global和局部判别器来获得更清晰的结果以达到优于fc层网络算法修补结果的效果。

        针对训练过程中masks的生成方面。在2018年的ECCV上,有团队提出了对于不规则图形修复masks的重复训练和深度学习的概念[7] 。他们提供了相关的数据集,并被主流的文章认可和引用。

        最后,是对于深层深度模型整体框架设计方面。先将图片用比较粗糙的结果将图片补充完整,在进一步优化,生成清晰的结构图和匹配的纹理以达到修复图像的效果。

        传统的Image级的方法不能处理还有强语言的图像,而深度学习级的方法通过编解码的方式修复图像,会丢失一部分信息。于是,兼具二者优点的图像处理技术孕育而生。

        基于金字塔式注意力机制的图像修复技术[3]基本框架包含encoder,decoder,attention和discrminator四个步骤。在encoder部分,由深到浅,多次补全,经过多次attention逐级补全之后交由decoder进行RGB的色彩和纹理的处理。最终能够在图像修复中达到对人脸细节进行修复的效果。同时新的网络结构也能让图像处理技术能够接受更大规格的图像输入。也能够做到对于video进行信息提取,进行逐帧画面的内容修复与补全。

        CVPR、ICCV和ECCV是世界顶级的计算机视觉会议。CVPR是一年一度的国际计算机视觉与模式识别学术性会议。每年收录的论文约在300篇左右。每一年都有固定的研讨主题。在各种学术会议统计中,CVPR被认为有着很强的影响力和很高的排名。目前在中国计算机学会推荐国际学术会议的排名中,CVPR为人工智能领域的A类会议[8]。在巴西教育部的排名中排名为A1。基于微软学术搜索(Microsoft Academic Search)2014年的统计,CVPR中的论文总共被引用了169,936次.这样一些基于交流新技术和想法的组织和聚会,无疑是给图像视觉领域开放了高速公路。今年三大顶会也有从理论偏向实际应用的重心转移,使得跟多的研究人员有了更多的机会走上这样的舞台。

        香港中文大学教授汤晓鸥率领的团队在全球范围内做出了大量深度学习原创技术突破:2012年国际计算视觉与模式识别会议上仅有的两篇深度学习文章均出自其实验室;2011—2013年间在计算机视觉领域两大顶级会议ICCV和CVPR上发表了14篇深度学习论文,占据全世界在这两个会议上深度学习论文总数的近一半。他在2009年获得计算机视觉领域两大最顶尖的国际学术会议之一CVPR最佳论文奖,这是CVPR历史上来自亚洲的论文首次获奖[9]。

         2021年CVCR最佳论文奖,是马克思·普朗克智能系统研究所和蒂宾根大学团队的Michael Niemeyer,Andreas Geiger。他们的论文主要研究方向是:将组合式三维场景表示纳入生成模型,可以使图像合成更加可控。将场景表示为生成神经特征场,是我们能够从背景中分理处一个或者多个物体。最佳学生论文提名的三篇之一Real-Time High-Resolution Background Matting[11] ,致力于实现实时高分辨率的背景消除研究。这都是在图像处理和修复领域的最新技术。在这次CVCR中,也有国人的名字出现在获奖名单中。何恺明与陈鑫雷研究的连体网络主要研究的是连体结构在无监督表征学习中的作用。对于计算机图象识别学习有着巨大的作用。

         据CVPR2021官网数据,2021年在收录的全部学术论文中,有关3D电脑视觉领域的论文有44篇,占据收录总论文的六分之一。论文数量今次于它的是关于计算机深度学习技术的,有29篇。可以根据这个列表看出未来图像处理技术和计算机视觉领域未来的发展方向是3D视觉领域,计算机深度学习的方向上仍然有“宝藏”值得我们去深挖。详看3D电脑视觉领域的论文目录,我们又能看到有关全景图像拼接、处理、识别、分割、计算学习的论文占了大多数。相信其中必然会有能够改变我们日常生活的,不仅仅是存在于理论中的“宝石”。

        近年来,在CVPR等诸多论坛上,来自中国的身影越来越多。来自中国科学院院士谭铁牛更是担任 CVPR 2021 四个大会主席之一,此外,CVPR 2021 程序委员会中还有多位华人学者,包括美国肯塔基大学教授杨睿刚、上海科技大学教授虞晶怡、中山大学副教授梁小丹等。这显示出我国的数字信息技术得到了迅速的发展,但在软件技术方面,还是落后于别人的。在华为等龙头企业的带领下,我国一马当先进入了5G时代。极快的网速和带宽给了人机交互无限的可能,在硬件上远超他人的优势,也给了图像处理技术广阔的发展空间。无论是人工智能、自动驾驶、AR等新兴领域,相信在未来几年都会是一片蓝海。而图像处理技术必须在计算机视觉呈现进行进一步的研究与发展[2]。在三维应力研究上,尤其是对于军事、商用勘察作业、全景图像处理等方面进行研究。总而言之,人们对于图像处理技术的质量和速度要求越来越高,图像处理和修复技术也随着美图等操作简单的图像处理软件被更多的运用于人们的生活当中。通过不断地提升数字图像处理技术,可以使人们的工作生活更加便利,因此,必须要加强对数字图像处理技术的研究,促使数字图像处理技术更加科学、先进、更好的满足人们的应用需求[2] 。而作为相关技术的研究和从业人员,更应该关注世界上的图像处理技术发展趋势和进度,互相学习合作共赢,也在互相较量的同时,引领更多技术的爆发和进步。

参考文献

[1] 沈  铭. 用数字技术处理传统照片——兼谈老照片的修复[J]. 摄影与摄像. 2000(12):50-51.

[2] 景学红. 数字图像处理技术发展的趋势分析[J]. 数字通信世界.2019(06):129.

[3] 曾艳红. 基于金字塔式注意力机制的图像修复技术[R]. CVPR. 2020.

[4] Deepak Pathak. Context Encoders: Feature Learning by Inpainting[R]. CVPR. 2016.

[5] Satoshi Iizuka. Globally and Locally Consistent Image Completion[R].TOG. 2017.

[6] Yu. Generajive image inpainting with contextual attention[R].CVPR.2018.

[7] Lie. Image Inpainting for irregular Holes Using Partial Convolutions[R].ECCV.2018.

[8] Conference Rank.CVPR[N].2019-04-23.

[9] 刘传书.  AI“论剑”就要到“华山”[N]. 科技日报.2017-05-04.

[10] 小  匀. CVPR 2021大奖公布!何恺明获最佳论文提名,代码已开源[N].新智元.2021-06-22.

[11] Shanchuan Lin. Real-Time High-Resolution Background Matting[R].CVPR.2021.


【本科启蒙论文】基于图像修复浅谈数字图像处理技术的发展的评论 (共 条)

分享到微博请遵守国家法律