宋冬梅, 王 斌, 王海起, 樊彦国
(中国石油大学(华东)海洋与空间信息学院,山东 青岛 266580)
海上溢油事故大多是由管道破裂、油轮碰撞和钻井平台倾覆等原因引起[1],为制定有效的溢油事故应急处置方案,快速准确地获取事故中溢油空间分布以及不同油膜厚度的分布位置信息显得尤为重要。在已投入的监测系统中,卫星遥感是最重要和最有效的手段之一,在海上溢油监测和应急响应中发挥着不可替代的作用。高光谱以其“图谱”合一、光谱分辨率高、光谱信息范围广的优势在溢油检测领域中应用前景广阔。目前的高光谱溢油检测算法大致分为基于光谱指数等光谱特征的溢油检测算法[2-4]、基于传统机器学习的溢油检测算法以及基于深度学习的溢油检测算法3 类。Liu等[5]提出参考光谱特征选择方法并采用传统的自适应余弦估计(Adaptive Cosine Estimator,ACE)算法实现溢油检测。Liu 等[6]提出基于最小噪声分离变换的决策树分类方法以实现溢油信息的快速提取,不仅可以了解油膜的相对厚度分布,而且可以了解不同厚度油膜的比例。包萌等[7]将选取的纹理特征与最优光谱组合构成的多波段数据输入支持向量机(Support Vector Machine,SVM)中检测溢油,获得了较好的检测结果。然而,这些传统方法分类的准确性取决于人工特征提取的质量,而人工提取特征复杂且耗时,同时不同的分类器对于不同的特征或特征组合也存在一定的性能差异。近年来的研究表明,深度学习能够自动提取判别特征,可应用于高光谱图像的溢油检测。董士伟等[8]提出基于经验模态分解的特征提取方法,并通过神经网络识别油膜和海水。Liu 等[9]提出基于光谱指数的波段选择算法和一维卷积神经网络(Convolutional Neural Networks,CNN)相结合的分类模型,实现了油膜的自动分类。Zhu 等[10]提出空间信息与堆栈式自编码(Stacked Auto Encoder,SAE)网络相结合的油膜检测方法,实现了海面溢油信息的提取。Wang等[11]提出了一种空谱特征联合的端对端的高光谱溢油检测框架(Spectral-Spatial Features Integrated Network,SSFIN),用以同时提取高光谱数据的光谱特征和空间特征。
尽管基于深度学习的溢油高光谱检测方法已取得了较好的结果,但检测精度仍有待进一步提高,检测方法仍存在着较大的发展空间。而近年来发展起来的生成对抗网络(Generative Adversarial Network,GAN)[12]因具有能够通过不断的对抗学习以优化模型的优点,在图像分类和目标检测领域越来越多地受到关注,其在提升海洋溢油高光谱图像检测精度方面潜力巨大。为进一步提高溢油检测精度,降低虚警率,本文设计了一种基于GAN的溢油检测实验方案,包括对图像进行预处理、建立模型及样本训练等操作。并通过对高光谱影像的溢油检测实验结果的分析评价,以证实所提方法的有效性。
本文的实验方案包括图像预处理和模型训练两部分,其具体步骤:①利用光谱归一化和主成分分析(Principal Component Analysis,PCA)进行预处理,提取前3 个主成分后,对图像进行裁剪,取每个像素的9 ×9 邻域作为训练样本,并将像素类别作为标签;
②构建一个基于GAN的端到端的溢油检测模型,生成器生成溢油影像,判别器输出每个样本对应的类别;
③基于训练后的判别器实现对整幅高光谱影像的溢油检测,并对分类结果进行分析评价。
GAN的思想基础是博弈论中的2 人零和博弈问题。基于此,提出了一个通过对抗学习来优化模型的新框架,框架由1 个生成器(Generator,G)和1 个判别器(Discriminator,D)构成,如图1 所示。生成器的目的是生成拟合真实数据的概率分布;
而判别器的目的是衡量生成的概率分布与真实数据分布之间的损失。生成器的输入是随机噪声z,输出是生成数据G(z);
判别器的输入是真实数据x和生成数据G(z),并以其输入来自真实数据的概率作为输出。判别器的目的是尽可能提升判别准确率;
而生成器的目的是生成“以假乱真”的数据骗过判别器,最小化判别准确率。在训练过程中,当一个模型的参数进行更新时,此时另一个模型的参数被固定。通过不断的网络训练,最终使得生成器与判别器两个模型的能力达到平衡。
图1 GAN模型框架
GAN的目标函数定义如下:
式中:E代表期望;
Pdata代表真实数据分布;
Pz(z)代表噪声的分布;
G(z)、D(x)分别代表生成器和判别器的输出。在训练过程中,D的目标是使得式(1)值最大,而G 的目标恰恰相反。它们交替优化目标,这种相反的目标形成了对抗的训练体系。随着训练的进行,PG(x)会逐渐趋近Pdata(x),PG(x)代表G 生成的数据分布,当Pdata(x)=PG(x)时达到全局最优。
油膜和海水的光谱反射率数值差异较大,其中海水和厚油膜的光谱反射率之间的差值可以达到200 以上,因此进行光谱归一化便于计算和综合评判分析。此外,高光谱数据具有波段多、波段间相关性高的特点,采用一种简单有效的数据降维方法是很有必要的。本实验在数据预处理时通过使用PCA 方法实现数据降维,保留了前3 个主成分。另外,考虑到空间信息在特征提取中的重要作用,本文选择构建大小为9 ×9 的空间邻域作为模型的输入。
近些年来,GAN在计算机视觉领域引起了研究热潮,在图像修复、风格迁移、图像生成等方面有很好的应用。一些学者将GAN应用到高光谱图像分类领域,取得了较好的效果,这为海洋溢油检测提供了一种新思路。
(1)构建GAN 模型。本实验方案设计的生成器的输入是噪声向量和类别标签,能够让生成器在训练过程中学习类别专属特征,减小模型崩溃的可能[13]。判别器的输入是真实数据和生成器生成的假数据,目的是为输入的样本指定明确的地物类别。此外,为了在特征提取过程中自适应学习上采样和下采样,本实验方案中用步长卷积代替了经典CNN 中固定的池化层,分别基于全转置卷积网络和全卷积网络搭建生成器和判别器。其中,生成器由1 个全连接层、4 个转置卷积层组成,每个卷积核的大小为3 ×3。除了最后的输出层,生成器中的每一层都采取修正线性单元(Rectified Linear Unit,ReLU)作为非线性激活函数和批正则化处理,输出层则采取双曲正切函数(tanh)作为激活函数。需要说明的是,生成器所生成的样本不属于标签中的任何一类,将其设为第n +1 类(n 为数据集类别数)。判别器则是通过4 个转置卷积层提取特征,然后接入1 个softmax 层得到最终的分类结果。所有卷积层都采用泄露修正线性单元(Leaky Rectified Linear Unit,Leaky-ReLU)作为激活函数,另外,除了输入层和输出层,判别器的每一层都进行了批正则化处理。
(2)模型训练策略。传统的GAN 中的判别器是一个二分类器,只判别输入的来源是真是假,如果要完成多分类任务,通常会加入1 个辅助分类器(Auxiliary Classifier GAN,ACGAN)[14]。ACGAN 判别器的最后一层不再只是1 个sigmoid 层,而是并列排放sigmoid和softmax的2 个层。生成器和判别器的目标都是尽可能地使多分类结果正确,而对于二分类结果的优化目标与传统GAN 相同,也即,ACGAN 只是在sigmoid这一分支上做对抗训练。本实验方案采用了文献[15]中设计的多类对抗目标,即利用softmax 层同时完成判断来源和多分类任务。生成器和判别器的目标函数定义如下:
式中:LG和LD分别代表生成器G 和判别器D 的目标函数;
l(·)代表交叉熵;
yi是真实样本的标签,假定n为数据集类别数,yfake=(1/n,1/n,1/n,…)n为生成的第n +1 类样本制作的伪标签。生成器的优化目标是使判别器尽可能将生成的假样本判别为数据集中的某一类yi,而判别器的优化目标是尽可能提升输入的真实样本多分类精度,并将输入的假样本判别为第n +1类,如图2 所示。
图2 GAN对抗训练过程
本实验中使用的数据来自大连海上溢油监测实验,获取于2010 年7 月24 日的航空高光谱数据。传感器由SPECIM 公司生产的轻便机载光谱成像仪AISA eagle,波长为400 ~970 nm,含有258 个光谱波段(2.4 nm,FWHM),空间分辨率为1.41 m。数据已做过系统的几何校正和辐射校正。由于数据量较大,实验中将截取2 幅大小分别为350 ×360 和180 ×400的矩形区域,分别取名为数据集1 和数据集2。根据溢油图像在RGB 波段(R:645.13 nm,G:554.44 nm,B:469.05 nm)所表现出的颜色及Bonn 协议,实验中将图像分为厚油膜、薄油膜和海水3 类。
在2 个数据集中,分别将10%和90%的标记数据随机分配到训练集和测试集。其中,根据总数据集的比例在每个数据集中的每种类型的像素中随机选择。表1 列出了2 个数据集用于训练和测试的每个类的可用样本分布情况。
表1 数据集1 和2 的样本分布情况 个
本文选用总体分类精度(Overall Accuracy,OA)、平均分类精度(Average Accuracy,AA)、Kappa 系数以及每个类别的分类精度作为检验不同方法性能的评价指标,并通过10 次训练和测试的平均值和标准差来计算结果。
总体分类精度指被正确分类的测试样本数与测试样本总数之比。正常情况下OA值能较好地表征分类精度,但是当样本数量极度不平衡时容易受到样本数据较多的类别的影响,导致其不能代表每个类别。鉴于总体分类精度在处理样本不平衡数据时的缺陷,需要计算每个类别的分类精度。平均分类精度即数据中所有类别的平均精度的均值,又称为平均精度均值AA,其计算式如下:
式中:AccuracyC表示类别C 的分类精度;
N 表示样本类别总数。可见,它也可能会存在某些类别分类精度很高,而另一些类别的分类精度很低(样本数量少或数据问题)时,出现平均分类精度较高的情况。为此,实验对于分类结果还保留了每个类别的分类精度。
Kappa系数是一种比例,衡量的是真实数据与最终分类结果之间的一致性,其计算式如下:
式中:C为类别数;
mi为第i 个类别的正确样本数;
ki为分类器预测得到的第i 类样本数量。Kappa 系数的计算结果通常位于0 ~1 区间,值越大,分类结果的一致性越高。
为评估本实验方案的检测效果,将提出的GAN模型与两种较为成熟且应用广泛的模型进行了对比,包括随机森林模型(Random Forest,RF)和SVM 模型。表2 从上到下分别记录了2 个数据集上每种方法运行10 次后的各类分类精度、AA、OA 和Kappa 系数的均值。数据集1、2 的检测结果如图3 和4 所示。
表2 3 种不同方法在数据集1、2 上的溢油检测结果比较%
图3 数据集1的高光谱溢油检测结果
图4 数据集2的高光谱溢油检测结果
从表2 可以看出,与其他方案相比,本实验方案在2 个数据集上均取得了最佳分类结果,各评价指标明显高于其他方案。在数据集1 上,GAN 相对于RF 和SVM的两种方案,总体分类精度分别提升了2.33%和0.77%;
在数据集2 上,GAN 达到了最高的每类分类精度。实验结果表明,设计的方案不仅能得到较高的溢油检测精度,而且分类结果具有较高的稳定性。
由图3 ~4 可知,本实验方案相较于其他方法误将海水错分为溢油的现象大幅度减少,即有效地降低了溢油检测的虚警率。这是由于GAN 模型通过生成对抗训练得到的判别器更优,具有更好的边缘检测能力和抗噪声能力,因此,分类结果中的离群值更少,使得预测图更接近于真实类别标签,这进一步证明了GAN模型用于溢油检测的有效性。
本文利用生成对抗网络方以看出法设计了高光谱溢油图像检测实验方案,并通过大连新港溢油事故中所获得的高光谱数据开展的实验证实了本方法的有效性,结果表明:①光谱归一化处理和PCA 变换可以有效地提高模型的计算效率并能够实现特征优选;
②生成器和判别器的对抗训练过程能够显著提升GAN 模型的分类性能,并有效降低了溢油检测虚警率;
③通过在模型中引入多类对抗目标的损失函数,能够更好地完成多分类任务。实验中对薄油膜的检测均存在一定的不足,未来可通过模型的进一步优化以及扩大训练样本库来提升薄油膜的检测精度。
扩展阅读文章
推荐阅读文章
老骥秘书网 https://www.round-online.com
Copyright © 2002-2018 . 老骥秘书网 版权所有