孙茜童,付芸,韩春晓,范宇华,王天枢
(长春理工大学 光电工程学院,长春 130022)
中国是世界上番茄种植面积最大、产量最高的国家。然而,番茄病害严重抑制了果实的产量,晚疫病是常见的番茄病害之一。在成株期发病,病害多从叶尖或叶缘开始感染,病斑最初呈近圆形,水浸状,后来变为不定形的浅绿色,不断扩展而占据整个单叶的大部分面积,病斑逐渐变为褐色[1]。发病严重时造成茎部腐烂、植株萎蔫和果实变成褐色,严重影响产量。随着种植面积的不断扩大,传统的人工检测病害的方法无法做到及早发现、及时治疗。近年来,国内外高光谱成像技术的发展十分迅速,广泛应用于遥感地物观测、农作物成熟度判别、病虫害监测等农业生产领域。
高光谱图像(Hyperspectral Image,HSI)是一个三维的数据立方体,由二维图像和一维光谱数据组成,包含几十甚至几百个连续的光谱波段,这些光谱信息表征了物质的内在属性,因而成为图像分类的依据。支持向量机是一种常用的二元分类器,采用核函数方法进行非线性分类,在人脸识别、文本分类等模式识别中得到了应用,也被用于建立高光谱植物病害的分类模型。李鑫星[2]基于 SVM(Support Vector Machine,SVM)分类器建立黄瓜叶部病害的识别预测模型,对霜霉病、白粉病、褐斑病的平均识别正确率达到92%。
此外,随着深度学习理论的提出和数值计算设备的改进,卷积神经网络得到了快速发展,并被用在计算机视觉、自然语言处理等领域[3]。在解析遥感图像的几何、纹理和空间分布特征时,卷积神经网络在计算效率和分类准确度等方面具有优势[4]。对相同的数据集提取特征,二维卷积神经网络模型会丢失关键信息,而三维卷积神经网络模型能更好地提取特征,在图像分类和特征提取方面具有较强的优势。吴叶兰等人[5]建立了基于卷积神经网络的柑橘病叶分类模型,对溃疡病、草甘膦病等患病叶片的识别准确率达到98.75%。此外,在水稻穗瘟病检测[6]和大豆花叶病害初期的快速检测[7]中,卷积神经网络都取得了很好的效果。
上述研究表明高光谱成像技术在农作物的病害检测中是可行的,但是,如何实现病害的早期检测,以及实现准确定性、定量分析还需要深入研究。因此,本文以番茄的晚疫病为研究对象,将支持向量机、二维和三维卷积神经网络用于图像分类,通过算法的融合和参数的优化来建立分类模型,提高分类精度,能够为农作物病害的早期诊断提供研究基础。
实验中所使用的番茄晚疫病样本来自于吉林省农业科学院经济植物研究所(位于:北纬43°05",东经 125°27")。全部样本经过病理检验分析,证实叶片已感染番茄晚疫病。2019年9月采集患病叶片97片及健康叶片21片。选取染病区域明显的样本进行图像采集。
整个系统由线扫描光谱仪(ImSpector N10E,400~1 000 nm)(Spectral Imaging Ltd.,芬兰奥卢)、14 bits的 1 600×1 200像素的 CCD相机(BCi4-USB-M40LP,美国弗洛里达)、双侧150 W卤素灯线性光源(EKE-ER,Illumination Technologies,美国)、一维位移台(IRCP0076,Isuzu Optics Corp.,中国台湾)和计算机组成,图1为高光谱图像采集系统。整个高光谱成像系统放置在一个黑色的光学暗箱内,光学暗箱中的载物台可自由升降,平台上有漫反射涂层,光学暗箱能够避免环境光对图片采集造成的干扰[5]。由于暗室里卤素灯线性光源的强度分布不均匀和设备暗电流噪声的影响,需要进行明暗场校正。明暗场校正的公式为:
图1 高光谱图像采集系统
式中,R为明暗场校正后的数据;
Rl为直接采集的数据;
Rd为暗场数据;
Rw为明场数据。
1.3.1 支持向量机
支持向量机是Vapnik等人[8]开发出来的一种监督学习的模型,与一些相关的算法相结合可用于分类与回归分析。利用带有标签的训练集样本,使用支持向量机能构建出一个非概率的二元线性分类器。在选择核函数时,通常采用三种方法:(1)利用先验知识;
(2)Cross-Validation方法,逐个核函数试用,选取效果最好的核函数;
(3)混合核函数,将不同核函数结合起来。
1.3.2 2D卷积神经网络
卷积神经网络[3](Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络。图2是一种典型的卷积神经网络[11],它由输入层、若干个卷积层和池化层、全连接层以及输出层等构成。当数据量不是非常庞大时,也可以不添加池化层。Dropout层可以防止过拟合,提升模型泛化能力。
图2 CNN结构
本文搭建的二维卷积神经网络共有8层,最后一层采用Softmax函数,网络中其他各层的激活函数均采用Relu函数。迭代次数均设为100次、学习率设为0.001、patience设为15。二维卷积网络结构如图3所示。
图3 二维卷积部分结构
省略数据前期的预处理过程,直接将原始图像输入卷积神经网络中进行分类。假设高光谱图像有n个波段,包含N种标签,那么其原始样本集X为,为了充分利用高光谱图像数据的空间相似性,对于图像上的每一个像素,都取其周围l像素×l像素范围内的数据作为一个训练样本,此时输入样本集Y为实验结果表明,l取 5 时可以得到较好的分类结果;
当l取7或9时,分类效果稍差,但差别不大,总体准确率在1%以内浮动。其主要原因是高光谱图像的空间分辨率有限,邻域区间取得过大可能会包含与中心像素标签不同的地物,而太小又不能充分利用邻域的空间信息。
1.3.3 3D卷积神经网络
高光谱图像是一个数据立方体,在立方体中使用三维卷积核,卷积层中每一个特征都会与上一层中多个邻近的连续帧相关联,因此能捕捉到连续且有效的信息。相比于二维卷积,三维卷积多了一个深度通道,更适合于高光谱数据的三维特性。因此,本文构建一个三维卷积神经网络。三维卷积神经网络共有13层,如图4所示。网络中的激活函数均采用Relu函数,在本文中各层使用不同激活函数对结果的影响不大。迭代次数均设为100次、学习率设为0.001、patience设为15。
图4 三维卷积部分结构
三维卷积神经网络能够得到样本的空间信息和光谱信息,从中同时提取数据的空谱特征。在CNN结构中,深度越深、特征面数目越多,则网络能够表示的特征空间也就越大、网络学习能力也越强,然而也会使网络的计算更复杂,极易出现过拟合的现象。因而,实际上应适当选取网络深度、特征面数目、卷积核的大小及卷积的步长,以保证训练出一个好的模型且能减少训练时间[9]。
本文使用的深度学习框架是以Tensorflow为后端的Keras框架、Python3.6。图5为番茄晚疫病的识别结果,图中不同颜色的定义:黑色为背景、红色为健康部分、绿色为病害部分。
图5 RBF分类结果图
选取径向基核函数(Radial Basis Function,RBF)再对数据进行降维后运算速度明显提高,能更快获取分类结果。由于LDA最多能够降到k-1维,而本文中k=2,所以LDA只能降到1维。实验表明,经PCA降维后取特征值为30时,可以在很大程度上保留原始数据的特征,减小降维的损失。选取Sigmoid核函数时,病害的识别效果较差,部分叶脉被误判为病害区域。
图6及图7是2D-CNN和3D-CNN算法的分类结果图。
图6 2D卷积神经网络分类结果图
图7 3D卷积神经网络分类结果图
从分类结果看,卷积神经网络对于病害部位的识别效果和支持向量机的识别效果差别不大,原因是卷积神经网络依赖海量训练数据,在数据量较小的情况下,支持向量机略占优势,但是一旦数据量提升,卷积神经网络将表现出更大的优势。
混淆矩阵(Confusion Matrix)也称误差矩阵,是表示精度评价的一种标准格式,用w行w列的矩阵形式来表示。由于混淆矩阵并不能直接看出分类精度的好坏。为此,从混淆矩阵衍生出许多分类精度指标,本文采用总体分类精度(Overall Accuracy,OA)、平均分类精度(Average Accuracy,AA)和Kappa系数作为评价指标来对分类结果进行评判。
总体分类精度是指对每一个随机样本所分类的结果与检验数据类型相一致的概率[10]。总体分类精度按照公式(2)计算。
式中,t为测试集的数据总数;
a为正确分类的个数。
平均分类精度也是分类问题中常用的评价指标之一,计算公式如下:
式中,m为某一类的分类精度;
N为类别数。
Kappa系数是一种衡量分类精度的指标,公式如下:
式中,po=总体分类精度;
用上述三种评价指标对不同算法的分类效果进行评价,结果如表1—表3所示。
表1 RBF核函数结合不同预处理方法的训练结果
表2 2D-CNN结合不同预处理方法的训练结果
表3 3D-CNN结合不同预处理方法的训练结果
从表中看出,使用RBF核函数加PCA预处理的分类效果最优,总体分类精度达到98.6%,平均分类精度为98.4%,Kappa系数为0.970。
上述评价结果表明,三维卷积神经网络结合PCA和LDA的识别效果比二维卷积神经网络表现得更好。在迭代次数为100次、学习率为0.001时,该模型在测试集上的总体分类精度为96.7%,平均分类精度为96.5%,Kappa系数为0.925,略低于支持向量机。支持向量机的优点是训练时间短,但是没有成熟的核函数的选取方法。卷积神经网络具有网络结构的多样性、可调整的参数多等特点,这意味着提升其分类效果的潜力更大,由此带来的缺点是训练和调节参数耗时长。
本文以番茄晚疫病患病叶片为研究对象,采集380~960 nm波段范围内的高光谱图像,建立基于支持向量机、二维和三维卷积神经网络模型对样本进行分类与识别,取得了较好的效果。
(1)在CNN模型中,卷积层的操作能够实现图像去噪,通常情况下分类效果会优于支持向量机。由于CNN依赖大量数据来提取特征,所以,在较小数据集上的表现反而不占优势。
(2)人工制作标签的数量和准确度对结果有很大的影响。同时,由于叶片不平整,采集数据时叶片边缘的阴影部分也会对结果造成影响。因此,如何将叶片边缘、叶脉与健康和病害区域准确地区分开,也是后续优化时需要考虑的问题。
猜你喜欢光谱向量卷积基于三维Saab变换的高光谱图像压缩方法北京航空航天大学学报(2022年8期)2022-08-31向量的分解新高考·高一数学(2022年3期)2022-04-28基于3D-CNN的高光谱遥感图像分类算法黑龙江大学自然科学学报(2022年1期)2022-03-29基于3D-Winograd的快速卷积算法设计及FPGA实现北京航空航天大学学报(2021年9期)2021-11-02高光谱遥感成像技术的发展与展望空间科学学报(2021年1期)2021-05-22聚焦“向量与三角”创新题中学生数理化(高中版.高考数学)(2021年1期)2021-03-19卷积神经网络的分析与设计电子制作(2019年13期)2020-01-14从滤波器理解卷积电子制作(2019年11期)2019-07-04基于傅里叶域卷积表示的目标跟踪算法北京航空航天大学学报(2018年1期)2018-04-20向量垂直在解析几何中的应用高中生学习·高三版(2016年9期)2016-05-14扩展阅读文章
推荐阅读文章
老骥秘书网 https://www.round-online.com
Copyright © 2002-2018 . 老骥秘书网 版权所有