2022年5月7日至13日,ICASSP 2022(IEEE International Conference on Acoustics, Speech and Signal Processing)线上虚拟会议如期进行。我院教师张娟副教授指导研究生杨坤的研究论文(“Multiple Patch-aware Network For Faster Real-world Image Dehazing”,Kun Yang,Juan Zhang*,Xiaoqi Lang)被ICASSP 2022录用并进行了展示。
ICASSP会议即国际声学、语音与信号处理会议,是全世界最大的,也是最全面的信号处理及其应用方面的顶级会议,涵盖了音频和声学信号处理,图像、视频和多维信号处理等多个方向,是中国计算机学会(CCF)推荐国际学术会议中的B类会议。此类会议论文的发表证明了我院科研团队的研究工作得到了国际同行的认可。
尽管基于深度学习的去雾算法取得了很好的效果,但是最近提出的模型结构都比较复杂。过多的参数会导致模型效率不高且运行速度缓慢,使其很难与许多强调实时性的高级计算机视觉任务交互。并且,驱动网络模型的数据多数是合成的,导致所训练的模型往往仅在合成的有雾图像上取得良好的性能。由于实际生活中往往雾气并不均匀,因此在真实的有雾图像上去雾效果并不理想。
针对上述问题,研究生杨坤对真实场景下的快速非均匀图像去雾算法,进行了深入研究,其最新工作以国际会议论文形式呈现和交流。文章中,提出了一种多补丁块感知去雾网络结构(Multiple Patch-aware Dehazing Network,MPADN),设计了一种多补丁块感知模块(Multiple Patch-aware Module,MPAM),该模块利用多补丁块感知的联合决策来获得更稳定的局部特征。在使用单一模块取代了多个层级后,极大地压缩了模型的大小,可以实现相当快速的真实场景下图像去雾。此外,还提出了一种基于雾气浓度采样的数据增强算法。该算法基于模糊图像和清晰图像,通过两者的线性组合,获取不同雾气浓度下的训练数据。在不引入额外计算开销的基础之上,该算法可以有效提升相关模型的性能。


