【SSconv:全色锐化:显式频谱-空间卷积】

SSconv: Explicit Spectral-to-Spatial Convolution for Pansharpening

(SSconv:用于全色锐化的显式频谱-空间卷积)

全色锐化的目的是融合高空间分辨率的全色(PAN)图像和低分辨率的多光谱(LR-MS)图像,以获得与PAN图像具有相同空间分辨率的多光谱图像。由于卷积神经网络(CNN)的灵活结构,它们已成功地应用于泛锐化问题。然而,大多数现有方法仅简单地将上采样的LR-MS馈送到CNN中,并且忽略了由直接上采样引起的空间失真。本文提出了一种显式谱-空卷积(SSConv)算法,该算法将光谱特征聚集到空间域进行上采样操作,可以获得比直接上采样更好的性能。此外,SSconv被嵌入到一个多尺度U形卷积神经网络(MUCNN),充分利用所涉及的图像的多光谱信息。特别是,多尺度注入分支和混合损失的跨尺度水平融合逐像素的图像信息。受益于SSconv的无失真特性,所提出的MUCNN可以在从WorldView-3和GaoFen-2获得的降低分辨率和全分辨率数据集上以简单的结构产生最先进的性能。

介绍

随着光谱成像技术的发展,多光谱图像在医学、地质、农业等领域的应用越来越重要。MS图像通常由部署在卫星上的传感器获取。但由于硬件限制,传感器无法同时保证拍摄图像的光谱和空间分辨率。传感器通常获取高分辨率(HR)PAN图像或低分辨率(LR)MS图像。2006年的竞赛和许多最近的评论论文证明了pansharpening的流行。为了充分利用LR-MS图像中丰富的光谱信息和HR-PAN图像中的空间信息,研究人员提出了全色锐化的思想,试图将HR-PAN图像和LR-MS图像融合得到HR-MS图像。全色锐化的主要挑战是在避免失真的基础上实现光谱和空间信息之间的平衡。因此,有必要充分掌握HR-PAN图像和LR-MS图像的特征,以及它们之间的潜在关系,特别是它们的光谱和空间分辨率之间的差异。
最新的锐化策略可以分为四类:1)基于组分替代(CS)的方法;2)基于多分辨率分析的方法;3)基于变分模型的方法;4)基于深度学习(DL)的方法。前三类可以归类为传统方法,而最近基于卷积神经网络(CNN)的深度学习在广泛的视觉任务中取得了巨大成功,如图像识别,目标检测和单幅图像超分辨率。受LR-MS图像、HR-PAN图像和期望的HR-MS图像之间的关系的映射需求的驱动,已经提出了各种基于DL的方法来改善全色锐化的融合结果,因为它们可以在大量现有数据集上训练后生成更多细节。基于DL的方法能够取得先进结果的原因在于CNN强大的非线性拟合和特征提取能力。
全色锐化的一个不可避免的问题是减轻HR-PAN图像和LR-MS图像的空间分辨率之间差距。上采样作为一种提高空间分辨率的操作,在信息融合过程中具有重要的作用。现有的上采样方法包括线性内插、去卷积和去池化。直接线性插值上采样是最常见的一种,它基于相邻像素的平均值粗略地补充图像。虽然它简单而快速,但其结果往往会出现意想不到的平滑。与预定义的插值方法不同,具有可学习参数的反卷积已广泛用于分割任务,并取得了良好的效果。然而,在卷积运算之前,特征图需要用零填充,因此大量的信息是相当无用的,并且其计算过程在计算上是昂贵的。另一种方法,unpooling,通过直接零填充来升级特征图的分辨率,因此无法探索像素及其相邻像素之间的潜在信息。值得一提的是,上采样对于单个图像超分辨率任务同样至关重要。提出了一种用于单通道特征图的高效且有效的上采样方法。在他们的工作中,原始LR图像通过卷积和周期性shuffling重建为HR图像。受此启发,我们认为,通过类似的像素重排操作,可以在卷积的帮助下学习光谱到空间特征的映射,这非常适合于处理多光谱图像,如全色锐化。
除了上采样方法的具体操作之外,我们还考虑上采样与LR-MS的比率。大多数现有的基于DL的方法将原始LR-MS图像直接上采样到与HR-PAN图像相同的分辨率,这可能导致光谱失真和信息丢失。本文提出了一种新的具有多尺度注入分支的U形网络,充分利用了原始LR-MS图像和HR-PAN图像提供的信息。特别地,我们设计了一个频谱到空间卷积(SSconv)的上采样在泛锐化中,以避免由传统的上采样方法所造成的失真。在U型网络和多尺度注入分支的基础上,我们在网络的过程中产生了不同尺度的特征图。为了监督网络学习过程中的中间产物,提出了一种混合损失策略。最后,所提出的方法在从两颗卫星获得的多个数据集上进行了验证,即,WorldView-3和GaoFen-2。通过对降低的分辨率和全分辨率进行的实验分析,证实了所提出的多尺度U形卷积神经网络(MUCNN)能够优于各种竞争方法。

贡献

1)我们设计了一个Spectral-to-Spacial卷积来将光谱特征聚合到空间域。除了通过充分利用光谱信息来提高特征图的空间分辨率外,SSconv还有助于构建MUCNN中的特征图。
2)我们提出了一个U形卷积神经网络与多尺度注入分支融合的信息在空间和光谱域。
3)采用混合损失策略来监督具有三种不同尺度的输出MS图像,并通过反向传播进行训练,这可以利用丰富的特征层次结构。此外,我们的方法显着超过了现有的最先进的方法与一个简单的结构。

注释和相关工作

Notations

为了清楚和方便,有必要介绍本文中使用的符号。MS ∈ R w × h × b R^{w×h×b} Rw×h×b表示观察到的LR-MS图像,其中w、h和b分别表示图像的宽度、高度和光谱带。P ∈ R W × H × 1 R^{W×H×1} RW×H×1表示观察到的PAN图像,其中H = 4h,W = 4w,GT ∈ R W × H × b R^{W×H×b} RW×H×b是地面实况图像。所需的HR-MS图像定义为^MS R W × H × b R^{W×H×b} RW×H×b。除此之外,我们通过SSconv对MS进行上采样,以获得2 ↑和4 ↑ MS图像,定义为MS2↑ R 2 w × 2 h × b R^{2w×2h×b} R2w×2h×b和MS4↑ R W × H × b R^{W×H×b} RW×H×b。我们使用步长为2的2 × 2卷积和步长为4的4 × 4卷积对P进行下采样,从而获得2 ↓和4 ↓ P图像,定义为P2↓ R 2 w × 2 h × 1 R^{2w×2h×1} R2w×2h×1和P4↓ ∈ R w × h × 1 R^{w×h×1} Rw×h×1

CNNs for pansharpening

正如在引言中提到的,近年来在全色锐化领域出现的大多数基于DL的方法都是基于CNN的。Masi等人提出了第一种基于DL的泛锐化方法,将其命名为PNN,它只是简单地堆叠三个卷积层并取得了显着的结果。从那时起,已经提出了越来越多的基于DL的方法。一项名为PanNet的值得注意的工作提出了一种具有一定程度的物理可解释性的简单结构,其重点是光谱和空间保存。后续工作,例如:DMDNet和FusionNet进一步探索了神经网络的潜力,并取得了令人鼓舞的结果。总体而言,CNN在全色锐化中的应用的主要框架可以被描述为非线性映射fΘFS,其中ΘFS表示CNN的参数。并且它们的损失函数可以统一为如下:在这里插入图片描述
然而,现有的方法可能无法捕获由尺度和分辨率变化引起的复杂特征。他们的大多数网络结构提取和学习与HR-PAN图像相同大小的上采样LRMS图像的特征。并且只关注最终输出而不考虑中间卷积层的产物。

U-Net

U-Net 是一种为逐像素分割设计的经典网络架构,已被证明具有良好的性能。特别是,它学习不同级别的语义特征,并通过几个下采样步骤来减小特征图的大小。然后通过上采样步骤逐渐恢复特征图的大小,并成功地使用所提取的语义特征来完成最终的分割任务。在我们工作的同时,有几个原因促使我们选择它作为我们的骨干。首先,全色锐化也是一个逐像素的任务,需要细化到每个像素的特征以及与其邻域的关系。因此,我们认为U型网络强大的目标定位和描绘能力可以应用于锐化任务。其次,金字塔功能满足我们的期望,克服LR-MS和HR-PAN图像之间的空间分辨率差距。U形网络提供了通过阶段跨尺度融合图像的可能性。第三,在U-Net的结构中,特征图被渐进地传播,这与全色锐化任务的目的一致,因为可以在特征图中恢复更详细的信息。

方法

该模型采用多尺度输入和U型CNN来研究空间、光谱特征及其相互关系。所提出的MUCNN由四个部分组成,它们是:(1)SSconv用于多光谱图像的上采样操作,(2)多尺度注入分支,其将MS图像和PAN图像渐进地馈送到网络,(3)U形整体网络结构,在像素级问题上表现优异,(4)混合多尺度损失,起到加速网络反向传播的作用,并对融合结果进行分阶段检验。

Spectral-to-Spatial Convolution

由于LR-MS图像包含同一场景的不同光谱波段,可以将其视为多图像超分辨率问题。我们相信,不同光谱波段的信息聚合将有助于空间信息的重建。因此,我们提出了一种新的频谱到空间卷积来执行上采样操作。操作过程如图2所示,我们使用r2b卷积(3×3)来整合空间和光谱特征,其中r是上采样的比率。请添加图片描述
通过对每个r2b波段的像素映射,生成上采样LR-MS图像。例如,第i个特征图Oi R w × h R^{w×h} Rw×h通过对X ∈ R w × h × b R^{w×h×b} Rw×h×b进行以下运算获得:在这里插入图片描述
其中Ki ∈ R1×3×3×b表示第i个卷积核,⊕表示传统CNN中的卷积运算。然后,我们可以通过映射(如图2所示)获得上采样的X:

请添加图片描述
其中SSconv(X)~ri+ cl,ri +c2,k~表示上采样图像的像素,SSconv(·)是SSconv操作。当谱带数b = 1时,问题退化为单图像超分辨率问题.此外,SSconv也退化为像素混洗。更多细节请参见图2。

Multiscale injection branch

P和MS之间的空间分辨率的比率是4。为了充分挖掘图像的潜在信息并建立P、MS和^MS之间的关系模型。我们打算采用已知图像,即P、MS作为多尺度金字塔形式的输入。在这里插入图片描述
如图3所示,通过SSconv对MS进行两次上采样,获得MS2↑ R 2 w × 2 h × b R^{2w×2h×b} R2w×2h×b和MS4↑ R 4 w × 4 h × b R^{4w×4h×b} R4w×4h×b,如下所示:在这里插入图片描述
均匀尺寸的卷积,即,2×2和4×4用于下采样图像,其有效性已得到验证。我们得到P2↓ R 2 w × 2 h × 1 R^{2w×2h×1} R2w×2h×1和P4↓ R w × h × 1 R^{w×h×1} Rw×h×1在这里插入图片描述
最后,我们以相同的分辨率连接图像,以获得以下三个输入:在这里插入图片描述
所有这些输入都以其相应的尺度馈送到U形网络中。

MUCNN

网络架构如图4所示。它由特征提取路径(左侧)和重构路径(右侧)组成。提取路径有两个步骤,每个步骤包含一个3 × 3卷积,一个整流线性单元(ReLU)和一个最大池化操作。在每个步骤之间,在最大池化之后连接新的输入。对于重建路径,它由三个步骤组成,每个步骤包含一个SSconv操作和一个3×3卷积。重建路径通过两个跳过连接和网络底部的3 × 3卷积与提取路径连接,更多细节请参见图4。在这里插入图片描述
为了加速反向传播并促进网络学习丰富的特征层次,我们设置了三个3 × 3卷积以获得三个输出^MS R w × h × b R^{w×h×b} Rw×h×b,^MS R 2 w × 2 h × b R^{2w×2h×b} R2w×2h×b和^MS R 4 w × 4 h × b R^{4 w × 4h ×b} R4w×4h×b,而^MS是所需的HR-MS图像。总体而言,MUCNN可以总结如下:在这里插入图片描述

Mixed multiscale loss

提出了混合损失策略,以充分利用丰富的特征层次。在保证还原图像可靠的前提下,将三个输出与相应尺度的GT图像进行比较,形成最终的损失函数。通过线性插值得到低分辨率GT(GT2↓)和中分辨率GT(GT4↓)。最后,MUCNN的混合损失函数定义如下:在这里插入图片描述

结论

本文提出了带有SSconv的MUCNN,SSconv是专门为全色锐化而设计的。与现有技术的关键区别在于我们通过SSconv将光谱特征映射到空间域,使得MUCNN的特征提取更适合HR-PAN和LR-MS图像的融合。此外,引入多尺度注入分支,以消除LR-MS图像上采样引起的失真。我们选择U-Net作为构建MUCNN的骨干。此外,混合损耗策略用于分级控制输出。大量的实验表明,我们提出的方法不仅可以捕捉HR-PAN和LR-MS图像的底层细节,而且还具有强大的能力,以平衡空间恢复和光谱保存。
当然,我们的方法仍然存在一些缺点,特别是对于图像上的极端亮点。例如,来自车顶朝向传感器的太阳反射有时会像一群分散的星星一样变得尖锐,并失去车顶的原始轮廓。除此之外,有时像素噪声点将出现在实心区域中。通过实验,我们发现几乎所有基于DL的方法都存在类似的边缘不均匀问题,而传统方法没有。这个缺点提醒我们寻找传统方法的特点,并将它们与基于DL的方法相结合。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.kler.cn/a/4063.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【周末闲谈】畅想AR,AR领域迎来新风口

个人主页:【😊个人主页】 系列专栏:【❤️周末闲谈】 周末闲谈 ✨第一周 二进制VS三进制 ✨第二周 文心一言,模仿还是超越? 文章目录周末闲谈前言AR?🤔🤔🤔AR的发展👣&…

是面试官放水,还是企业实在是缺人?这都没挂,字节原来这么容易进...

“字节是大企业,是不是很难进去啊?”“在字节做软件测试,能得到很好的发展吗?一进去就有9.5K,其实也没有想的那么难”直到现在,心情都还是无比激动! 本人211非科班,之前在字节和腾讯…

【云原生之企业级容器技术 Docker实战一】Docker 介绍

目录一、Docker 介绍1.1 容器历史1.2 Docker 是什么1.3 Docker 和虚拟机,物理主机1.4 Docker 的组成1.5 Namespace1.6 Control groups1.7 容器管理工具1.8 Docker 的优势1.9 Docker 的缺点1.10 容器的相关技术1.10.1 容器规范1.10.2 容器 runtime1.10.3 容器管理工具…

图书管理系统(考试样品)

一、执行下面的sql CREATE DATABASE bms CHARACTER SET utf8mb4;USE bms;DROP TABLE IF EXISTS tb_book;CREATE TABLE tb_book (id INT NOT NULL AUTO_INCREMENT,name VARCHAR(20) NOT NULL,desc TEXT ,type_id INT DEFAULT NULL,PRIMARY KEY (id) ) ; INSERT INTO tb_book VA…

域权限维持(ACL滥用)

文章目录本次介绍利用ACL简述写入成员-member(bf9679c0-0de6-11d0-a285-00aa003049e2)写入成员-Members(bf9679c0-0de6-11d0-a285-00aa003049e2)手动配置RBCD-msDS-AllowedToActOnBehalfOfOtherldentity(3f78c3e5-f79a-46bd-a0b8-9d18116ddc79)重置密码-User-Force-Change-Pass…

浏览器前进与后退的秘密——栈 (栈的理解与实现)

文章目录前言:浏览器与栈的纠缠如何理解“栈”?如何实现一个“栈”?基于数组的顺序栈基于链表的链式栈解答开篇🐱‍🐉作者简介:大家好,我是黑洞晓威,一名大二学生,希望和…

后端Springboot框架搭建APi接口开发(第二章)

上一章我讲述了如何使用Mybatis操作数据库。这一章我讲述如何利用Sptring框架搭建API接口 第一节:封装SqlSessionFactory工具类 在API操作数据库大量调用SqlSessionFactory,因此应将SqlSessionFactory封装成工具类供方法随时调用 在文件结构中的util文…

TC275-点亮属于AutoSAR的灯之Davinci Cfg配置

前面 上一步建立配置好了MCAL层,生成了arxml文件 这一步进行Davinci Cfg里面的配置,主要是OS 新建工程 这一步没什么好说的基本操作 导入DBC文件 导入EB生成的arxml文件 这是出现了一个问题: 通过import方式导入的文件,模块是…

react项目路由组件懒加载和路由传值方式

项目实战 使用useRoutes配置路由&#xff0c;结合插槽配置用户登录检测。 用户登录成功进入login 直接系统主界面 路由模块抽离 整体代码外移 { path: "/admin", element: ( <Author name"admin"> <Index /> </Author> ), }, { path:…

【Mybatis源码分析】TypeAliasRegistry源码分析

TypeAliasRegistry源码分析一、引入类型别名二、typeAlias 的三种配置方式三、TypeAliasRegistry源码分析三种配置方式源码解析校验过程Mybatis默认的别名配置四、总结一、引入类型别名 当配置 XML 文件&#xff0c;需要指明Java类型时&#xff0c;类型别名可替代Java类型的全…

几种常见的校验算法

目录 一、校验和 二、异或校验 三、CRC校验 四、MD5算法 五、SM3算法 六、SHA算法 UART有一个奇偶校验&#xff0c;CAN通信有CRC校验。Modbus、USB等通信协议也有校验信息。在自定义数据存储时&#xff0c;有经验的工程师一般都会添加一定校验信息。 一、校验和 校验和…

Maven项目导入本地依赖

今天在打包一个javafx项目时&#xff0c;因为有一个jar包在mvn本地仓库和网上仓库都没有&#xff0c;所以打包后程序功能不完整&#xff0c;CSDN上看了一堆&#xff0c;都是介绍了一堆方法但每个方法都不太详细&#xff0c;唉...还是自己来吧 1. 在IDEA内执行mvn install语句将…

【STM32学习】实时时钟 —— RTC

【STM32学习】实时时钟 —— RTC零、参考一、工作原理1、RTC介绍2、工作过程二、相关寄存器三、代码说明1、rtc初始化2、关于中断3、中断配置代码&#xff08;仅供参考&#xff09;3.1 秒中断普通闹钟功能3.2 待机模式唤醒3.3 停机模式唤醒零、参考 STM32RTC实时时钟实验讲解&…

复杂度和简单排序算法【左程云:Java】

目录 1.常见的常数时间操作 2.选择排序 3.冒泡排序 ​编辑 4.位运算----异或运算【相同为0&#xff0c;不同为1无进位相加】 ​编辑 异或的性质 使用异或前的条件&#xff1a;【a&#xff0c;b在内存独立】 异或&#xff1a;可以用于交换两个变量的值 练习1&#xff1a; …

MySQL-用户与权限

目录 &#x1f341;DB权限表 &#x1f341;新建普通用户 &#x1f342;创建新用户(create user) &#x1f342;创建新用户(grant) &#x1f341;删除普通用户 &#x1f341;修改用户密码 &#x1f342;Root用户修改自己的密码 &#x1f342;Root用户修改普通用户密码 &#x1f…

新手学SpringCloud前需知道的5点

目录 第一点&#xff1a; 什么是微服务架构 第二点&#xff1a;为什么需要学习Spring Cloud 第三点&#xff1a; Spring Cloud 是什么 第四点&#xff1a; SpringCloud的优缺点 1、SpringCloud优点 2、SpringCloud缺点 第五点&#xff1a; SpringCloud由什么组成 1&…

现代卷积神经网络(GoogleNet),并使用GoogleNet进行实战CIFAR10分类

专栏&#xff1a;神经网络复现目录 本章介绍的是现代神经网络的结构和复现&#xff0c;包括深度卷积神经网络&#xff08;AlexNet&#xff09;&#xff0c;VGG&#xff0c;NiN&#xff0c;GoogleNet&#xff0c;残差网络&#xff08;ResNet&#xff09;&#xff0c;稠密连接网络…

react插槽和HOC高阶组件

react组件插槽写法方式&#xff1a;<Table>内容</Table> //react插槽在自定义组件的内容位置。使用插槽完成&#xff1a;封装简单组件&#xff1a;在内容区域使用插槽 <Tab num{11} content"待收费数据&#xff08;条&#xff09;"><i classNam…

【SSM】SpringMVC中的@RequestMapping注解(含源码解析)

RequestMapping注解推荐文献Request Mapping源码分析&#xff0c;探索这些子注解的作用RequestMapping注解的位置Ant 风格的路径匹配推荐文献 一文掌握RequestMapping注解 SpringMVC请求参数和路径变量 SpringMVC官方文档 路径匹配工具&#xff08;AntPathMatcher vs PathP…

WireShark如何抓包,各种协议(HTTP、ARP、ICMP)的过滤或分析,用WireShark实现TCP三次握手和四次挥手

WireShark一、开启WireShark的大门二、如何抓包 搜索关键字2.1 协议过滤2.2 IP过滤2.3 过滤端口2.4 过滤MAC地址2.5 过滤包长度2.6 HTTP模式过滤三、ARP协议分析四、WireShark之ICMP协议五、TCP三次握手与四次挥手5.1 TCP三次握手实验5.2 可视化看TCP三次握手5.3 TCP四次挥手5.…
最新文章