Ⅰ 遥感图像地质信息增强处理
地质信息遥感图像增强处理目的是通过选择合理的图像处理方法,改善图像的视觉效果,突出遥感地质调查所需要的有用信息。
4.3.1 常用的图像增强处理方法
在遥感地质应用方面,图像增强处理方法按照主要增强的信息内容可分为波(光)谱特征增强和空间特征增强两大类。
4.3.1.1 图像波(光)谱特征增强处理
图像波(光)谱特征增强处理是基于多波段数据,对每个像元的灰度进行变换达到图像增强的目的。其图像增强结果便于识别不同性质的地质体、岩石类型、地质异常(如蚀变带、热异常等)、规模较大的线性和圆形构造。
(1)灰度变换方法
当原始图像的直方图比较窄,灰度分布较集中,图像层次较少时,进行灰度变换是最基本的要求。对于灰度接近正态分布的图像通常进行线性拉伸就可达到改善图像视觉效果的目的。对于直方图呈多峰状、部分地物过亮或过暗的图像,应针对图像的特点采用不同的灰度变换方法,包括分段线性拉伸、直方图调整和高斯变换等非线性拉伸等。
分段线性拉伸是为了有效利用有限个灰度级,将整个灰度范围划分为几个区间,分区间进行线性扩展,达到最大限度增强图像中有用信息的目的。常用的非线性变换有指数变换法(增强原始图像的高亮度值部分)、对数变换法(增强图像的低亮度值部分)、高斯变换(增强图像中间灰度范围)及正切变换(可对图像的暗、亮区进行增强)。
直方图调整是通过改善图像的直方图形态来达到图像增强的目的。其原理是用一种变换函数作用于原始图像的直方图,使之变成具有某种特定亮度分布形态的直方图。这种方法着重于扩展高频数亮度值之间的间隔,使直方图中部所包含的地物反差得到增强,有利于地质体的区分。常用的直方图调整方法有直方图均衡化和直方图正态化等。
(2)比值增强
比值增强是通过不同波段的同名像元亮度值之间的除法运算,生成新的比值图像来实现的。比值处理对地质信息尤为敏感,成为遥感地质图像处理中广为应用的方法之一。其基本作用为:
1)可以扩大岩石和土壤的波谱差异,有利于这些地物的区分。
2)消除或减弱地形等环境因素对同类岩性的影响。
3)提取与矿化蚀变有关的信息。
4)比值彩色合成图像能够增强岩性和蚀变岩信息。
(3)主成分变换
主成分变换是多波段遥感图像增强常用的一种方法。它是一种基于图像统计特征的多维正交线性变换,变换后的新组分图像反映了地物总的辐射差异和某些波谱特征,同时还具有分离信息、减少相关、突出不同地物的作用。利用不同新组分图像进行彩色合成,可显着提高彩色增强效果,有助于岩性的区分。在实际应用中,也常用比值或差值图像与原始图像一起进行主成分变换,会有利于某些专题信息的提取。
(4)IHS变换
在色度学中,把彩色图像的RGB变换成亮度(I)、色度(H)、饱和度(S)称为IHS变换,而IHS变换成RGB称为反变换。利用IHS变换和反变换,可以进行多源遥感图像之间的信息融合、高度相关图像数据的色彩增强、图像的特征增强,以及改善图像空间分辨率等融合处理。如图4.1所示,对研究区内的环形构造、岩体和地层都起到了一定的增强作用。
图4.4 多波段相关性比值增强处理对比
图4.5 图像增强处理对比
(3)基于地物纹理的岩性识别
当岩性组成复杂,且分布尺度大于传感器的空间分辨率时,遥感图像就可能记录到地物的结构组成信息,其影像就存在着明显的纹理特征。当存在着有别于背景地物的纹理结构特征时,就可利用地物的光谱特征与纹理特征提取岩性信息。利用纹理识别岩性的方法步骤如下。
1)选择一定大小的移动窗口,计算不同地物的纹理特征,对待研究岩石类型的纹理特征与周围地物的纹理特征进行比较分析。主要纹理特征计算有:对数变差函数、平均欧式距法(一阶)、方差法(二阶)、斜度(三阶)、峰度(四阶)和共生矩阵法。从灰度共生矩阵中可以产生8种纹理测度,它们分别是局部平稳、对比度、相异性测度、均值测度、标准差、熵、角二阶矩及相关等。
2)分析研究岩石裸露区和背景地物之间的纹理指数和图像,寻找岩石类型与纹理特征的关联规律,采用合适的阈值,识别和提取岩石信息。
(4)基于形状知识识别岩性信息
1)增强地物之间的边界,提取出边界信息。进行形状指数的计算。主要测定基于周长和面积的指数、基于面积的指数以及基于面积和区域长度的指数。
2)根据岩石的形状知识指数值,对不同形状指数的岩性进行定性定位识别和提取,结合不同岩性的形状特征赋予一定的地质属性信息。
(5)主成分变换多层次信息分析识别岩性信息
基于主成分分析的多层次信息分解技术是增强地质岩性弱信息的一种常用方法,在岩性增强和识别中的实施过程如下。
1)多波段图像的统计特征分析。对多波段图像数据进行统计特征分析,计算波谱图像的灰度动态范围、均值与中值、波段图像的相关系数矩阵、波段图像的协方差阵。
2)求出多波段图像的协方差阵的特征值与特征向量,用特征向量构成KL变换的系数矩阵A。
3)主成分变换后处理。根据岩性识别目的和各主分量与矩阵向量间的关系分析,选择包含特定岩性信息的组分图像、包含专题信息组分图像的增强处理、组分图像的彩色合成处理以及组分图像与其他处理结果或波段图像的信息复合分析。
4)根据各主分量的分析结果,对主分量图像的各种后处理结果与单元结果对照进行影像目视解译,确定能够较好反映工作区岩性信息的主分量图像,选取它们做彩色合成或信息复合,增强影像上的地质岩性弱信息。
(6)IHS变换法增强岩性信息
对多波段图像选择适当的代数运算后所产生的新图像进行IHS变换,可起到突出岩性的目的。例如,利用TM波段比值进行IHS变换,可以识别火山岩地区的岩性和与矿化有关的蚀变特征。
1)用TM5/TM7,TM3/TM4,TM3/TM2比值分别赋红、绿、蓝进行IHS变换。
2)在变换处理后的图像上,Fe2O3含量高的玄武岩分布区呈醒目的褐色或红色色调,不同岩性的火山岩类有不同的色调,可以相互区分;含黏土类矿物和三价铁氧化物的矿化蚀变岩石分布区呈独特的黄色。
(7)对遥感图像进行最优多级密度分割提取岩性信息
目的是在植被稀少、基岩广泛裸露的干旱地区通过选择最佳遥感识别图像,通过最优多级密度分割,提取和识别岩石信息。
1)利用费歇尔准则对图像进行密度分割,通过直方图统计,找到使各分割段的段内离差总和最小、段间离差总和最大的分割法,称为图像的最优多级密度分割法。
2)对分割图像按灰度级由高到低分别赋以不同的颜色,对照区域地质图确定不同颜色的地质岩性属性信息。
(8)岩性的自动分类识别
在干旱、半干旱地区,利用遥感图像的光谱信息,使用非监督分类方法,可起到岩性自动识别和填图的目的。
以TM或ETM+数据为例,说明非监督分类方法主要实施过程:
1)从TM或ETM+多波段图像中选择3个三波段组合,使波段间相关性小且重复利用的波段最少。
2)对所有波段组图像用均衡反差增强技术进行反差增强,以优化每个波段的反差,消除彩色合成中可能出现的色彩偏差。
3)对每个三波段组合用RGB-IHS变换产生一个色度图像,然后分别进行合成,产生色度合成图像。
4)用三维特征空间交互集群技术对色度合成图像进行非监督集群分类。
5)用模板直方图匹配分类技术对分类图像进行空间再分类,以检测感兴趣类的结构和模式。
6)对分类图像用空间滤波法和小类别合并技术进行平滑处理和空间简化处理。
7)根据野外检查与类别的波谱曲线形态,参照地质图,将类别赋以岩性或按其他地物类型术语进行识别和描述。
8)进行交互式类别编辑。用类别区域编辑法将代表不同地带的不同岩性按位置进行分解,用类别分组法将相同岩性或地物类型一致的类别归入一组。
9)用边缘检测技术,检测地物类别边缘。
10)对调整后的分类图像进行交互式着色,并将反映地形背景的强度图像叠加到岩性分类图中,形成岩性影像图。
(9)基于岩块分类的岩石类型识别
适用于干旱、半干旱基岩裸露区岩石类的识别。以TM数据为例具体说明主要实施过程:
1)对TM图像进行地形校正,生成数字视反射率图像R1、R2、R3、R4、R5、R7。
2)用TM6与R1~R7进行空间集群法非监督分类,编制平面分类图。
3)用TM6与R1~R7数据进行监督分类,首先用已知样本作为训练区,训练区样本为厚层单岩性岩块、简单岩性组合岩块,复杂岩性组合岩块和标志性薄层岩块,然后逐个像元提取同类目标并编制平面图。
4)对分类图像中的各类别进行均值、最小、最大值,标准差、协方差等参量统计。
5)进行纹理分析及分类,编制纹理类型平面图。
6)对非监督分类、监督分类及纹理分类平面图进行叠合,通过人机交互目视解译归并整理,编制岩石遥感类型平面图。
7)岩石填图。将已知岩石属性信息填绘于同类的空白区域中,未知空白区域待野外检查确定岩性属性后填入。
(10)用高光谱资料来识别岩性
利用成像光谱资料,定量检测岩石和单种或多种矿物的波谱特征,提取和识别岩性和矿物信息,编制专题岩性和矿物图件。主要实施方法是:
1)确定工作区岩性和矿物的一些标志性波谱特征。
2)利用高光谱成像数据提取地物的波谱曲线,与岩石的野外光谱曲线和某些标志性矿物的实验室实测典型曲线对比,半定量地确定岩性和标志性矿物的存在。
3)通过岩性和标志性矿物的检测,达到找矿和编制岩性分布图的目的。
4.3.2.2 断裂构造及地质界线图像增强处理
主要利用空间滤波、自动线性提取等方法增强或提取断裂构造信息。
(1)空间方向滤波方法
对原始图像进行方向滤波,突出某一方向的纹理信息,增强地质体的空间结构。
1)按其所需要的方向信息确定滤波算子见表4.1。
2)对多波段图像进行主成分变换,利用定向滤波法对第一主分量图像进行边缘梯度增强。
3)增强图像的局部边缘梯度,压制整个图像的反差,再结合一些平滑处理方法对构造蚀变带和环形构造进行增强。
4)图像反差扩展。采用拉伸、直方图变换、比值、滤波等,突出图像中的线、边缘、纹理结构特征,增强岩性、线形构造和环形构造影像特征。
5)高通滤波增强空间频率高的地表形迹,提取几十到几百米的线性体(如节理、裂隙和断裂等一些地质构造形迹);低通滤波增强空间频率低的地表形迹,提取延伸长、规模大的断裂带和蚀变带等地质形迹。
6)用高斯卷积滤波突出地质体边界轮廓细节,区分纹理差异大的岩体。
(2)傅里叶功率谱纹理增强法
1)取一定大小的窗口图像,分别作行、列傅氏变换。
2)求功率谱矩阵,作对数变换。
3)计算纹理测度,形成纹理图像。
4)纹理图像解译,提取线性体信息和岩性地质界线。
(3)图像纹理统计法
通过纹理特征变化推测断裂活动的差异、岩石成分的变化等,圈定活动断裂带范围,解释断裂活动方式。
(4)线、环状影像特征法
1)对图像进行高通滤波和线状影像增强
2)从22.5°~67.5°、67.5°~112.5°、292.5°~337.5°及337.5°~22.5°四个方向进行方向滤波。
3)计算单位面积(2.5km×2.5km)线状影像密度及等密度图。
4)对线、环状影像平面图进行目视分析,筛除非地质边缘点,并进行叠合与归并,划分线状影像区、带和等级,环状影像之间的空间结构及其组合关系。
5)进行线、环状影像地质属性解译。
(5)线性体自动提取法
1)采用定向滤波法对多波段图像的KL变换第一分量进行边缘梯度增强。
2)对梯度图像进行二值化处理,提取边缘点图像。
3)人机交互去掉干扰和孤立的边缘点。
4)利用Hough变换进行线性体的连接和统计,输出线性体分布图和密度图。
5)线性构造提取与地质分析。
(6)图像亮温法
选择适当季节和时间的热红外遥感图像,以热红外波段图像的亮温分布的极值线为标志,提取构造信息。
(7)多重主成分分析方法
首先应用各种方法,包括一般主成分分析、选择主成分分析(特征主成分选择)、波段比值等,尽可能提取图像中较弱的地质构造信息,然后提取显示最好或较好的专题信息,进行二次处理。处理方法包括两种:一是进行不同的彩色组合或叠加,以突出专题信息;二是选取对专题信息提取最有利的结果和原始波段再次进行主成分分析,进行地质信息的二次提取和增强。
(8)基于融合处理的构造信息提取方法
不同传感器获取同一地区的图像,由于其波长范围不同、几何特性不同、分辨率不同等因素而具有不同的应用特点,基于不同传感器图像的融合处理,可以综合不同传感器图像的优点,提高对构造信息的识别能力。下面以TM和SAR图像融合处理为例进行说明。
1)首先,对SAR图像滤波,进行噪声消除。
2)其次,把单波段SAR图像和多光谱TM图像进行几何配准和融合,TM3、4、5进行IHS变换,用滤波后的SAR图像代替I分量,做IHS反变换,再用TM3、4、5与SAR图像作主成分变换,最后将IHS反变换得到的G分量、TM4波段和主成分变换的第一主分量图像进行彩色合成,作为地质解译图像。
3)融合后的图像可以直观地提取断裂构造信息,利用SAR图像一定的穿透性,可以提取隐伏断裂构造信息。
4.3.2.3 区域地质稳定性的综合处理与遥感信息的辅助提取
1)获取多时相多平台遥感卫星数据,收集地面控制点数据和区域地质环境资料。
2)进行图像几何精校正和配准处理。首先,对地形图进行高精度扫描,形成数字图像;然后,对数字地形图进行投影变换、配准和镶嵌,进行区域图像的合成与镶嵌;最后,建立地质活动区域的DEM和三维地形地貌可视化影像。
进行人机交互解译。以精校正的数字卫星图像为基础,一方面进行增强构造活动带、滑坡及其发育环境信息的各种图像处理;一方面进行目视解译,确定区域地质稳定性信息,在计算机上定位,划分边界、制作图形。获取遥感解译信息,综合其他环境资料和综合处理进行分析、比较和修改。
4.3.2.4 隐伏地质信息提取与增强
利用重磁资料与不同类型的遥感图像复合处理技术提取隐伏地质信息。
1)利用重磁网格数据和三维欧拉反褶积方法确定地下构造位置(边界)和深度。
2)利用遥感图像解译地表的构造特征,将重磁数据提取的相应位置的构造信息叠加到遥感构造图像上,把不同深度的构造在图像上分别表现出来,利用图像上构造的不同深度信息,辅助进行隐伏地质体和构造带信息提取。
4.3.3 遥感地质信息自动提取方法
计算机自动信息提取的目的是把地质专家用于目视解译的知识定量化表达,从根本上实现知识参与的自动提取。现有的计算机自动信息提取方法主要包括:光谱特征模型法、计算机自动分类法和基于空间数据挖掘与知识发现信息提取方法。
4.3.3.1 光谱特征模型法
一般利用统计回归建立一个遥感信息模型,根据具体图像的实际情况不断对模型参数进行调整,最终使模型适用于该影像。遥感信息模型是在现有地面实验基础上提炼出来的地物的反演模型,由于图像数据影响因素很多,因此地物在卫星图像上的反映并非与地面实测数据一一对应,把遥感信息理论和实际图幅影像有效结合在一起来进行专题信息自动提取,应用范围和精度都很有限。岩石地层单元建模技术就是一种光谱特征模型法。具体步骤如下。
1)把一些具有特殊影像特征的矿源层、赋矿地层以及诸如含多元素黑色炭质页岩、蛇绿岩带、混杂岩带和超基性岩体等岩石地层作为一种基本单元,它们的多波段遥感像元灰度值是波段的函数,不同单元具有不同的函数曲线。
2)对有一定地质意义的单元进行光谱特征统计,确定特定单元在各波段的亮度范围和同一单元类别在多维空间的聚集性。
3)根据单元类别的变差参数(均值和标准差),建立基于遥感图像亮度值区间的岩石地层单元模型,输入的阈值参数和多波段遥感数据,自动提取岩石地层单元信息。
4.3.3.2 分类方法
在遥感信息自动提取方面,分类方法占有重要地位。其核心是对遥感图像进行自动分割。现有的计算机自动分类方法,主要利用的是遥感图像数据,虽然有时可以自动加入其他方面的地学知识,但远没有充分利用人脑在分析图像时所应用的知识,因此很难达到很高的精度。利用分类方法进行岩性自动填图是遥感图像处理中最复杂、最难的一个问题,而对于像植被、水体、土地和冰雪等一些大面积分布均匀的特定目标信息的提取,自动分类可起到良好的应用目的。
4.3.3.3 基于数据挖掘和知识发现技术
基于数据挖掘和知识发现技术理论的遥感专题信息自动提取,其基本内容包括知识的发现、应用知识建立提取模型,利用遥感数据和模型提取遥感专题信息。在知识发现方面包括从单一遥感图像上发现有关地物的光谱特征知识、空间结构与形态知识、地物之间的空间关系知识;从多时相遥感图像中,除了可发现以上知识外,还可以进一步发现地物的动态变化过程知识;从GIS数据库中发现各种相关知识。利用所发现的某种知识、某些知识或所有知识建立相应的遥感专题信息提取模型,利用遥感数据实现从单知识、单模型的应用到多知识、多模型的集成应用,从单数据的使用到多数据的综合使用的自动信息提取。
Ⅱ 各种遥感数据分类方法比较
常用的遥感数据的专题分类方法有多种,从分类判别决策方法的角度可以分为统计分类器、神经网络分类器、专家系统分类器等;从是否需要训练数据方面,又可以分为监督分类器和非监督分类器。
一、统计分类方法
统计分类方法分为非监督分类方法和监督分类方法。非监督分类方法不需要通过选取已知类别的像元进行分类器训练,而监督分类方法则需要选取一定数量的已知类别的像元对分类器进行训练,以估计分类器中的参数。非监督分类方法不需要任何先验知识,也不会因训练样本选取而引入认为误差,但非监督分类得到的自然类别常常和研究感兴趣的类别不匹配。相应地,监督分类一般需要预先定义分类类别,训练数据的选取可能会缺少代表性,但也可能在训练过程中发现严重的分类错误。
1.非监督分类器
非监督分类方法一般为聚类算法。最常用的聚类非监督分类方法是 K-均值(K-Means Algorithm)聚类方法(Duda and Hart,1973)和迭代自组织数据分析算法(ISODATA)。其算法描述可见于一般的统计模式识别文献中。
一般通过简单的聚类方法得到的分类结果精度较低,因此很少单独使用聚类方法进行遥感数据专题分类。但是,通过对遥感数据进行聚类分析,可以初步了解各类别的分布,获取最大似然监督分类中各类别的先验概率。聚类分析最终的类别的均值矢量和协方差矩阵可以用于最大似然分类过程(Schowengerdt,1997)。
2.监督分类器
监督分类器是遥感数据专题分类中最常用的一种分类器。和非监督分类器相比,监督分类器需要选取一定数量的训练数据对分类器进行训练,估计分类器中的关键参数,然后用训练后的分类器将像元划分到各类别。监督分类过程一般包括定义分类类别、选择训练数据、训练分类器和最终像元分类四个步骤(Richards,1997)。每一步都对最终分类的不确定性有显着影响。
监督分类器又分为参数分类器和非参数分类器两种。参数分类器要求待分类数据满足一定的概率分布,而非参数分类器对数据的概率分布没有要求。
遥感数据分类中常用的分类器有最大似然分类器、最小距离分类器、马氏距离分类器、K-最近邻分类器(K-Nearest neighborhood classifier,K-NN)以及平行六面体分类器(parallelepiped classifier)。最大似然、最小距离和马氏距离分类器在第三章已经详细介绍。这里简要介绍 K-NN 分类器和平行六面体分类器。
K-NN分类器是一种非参数分类器。该分类器的决策规则是:将像元划分到在特征空间中与其特征矢量最近的训练数据特征矢量所代表的类别(Schowengerdt,1997)。当分类器中 K=1时,称为1-NN分类器,这时以离待分类像元最近的训练数据的类别作为该像元的类别;当 K >1 时,以待分类像元的 K 个最近的训练数据中像元数量最多的类别作为该像元的类别,也可以计算待分类像元与其 K 个近邻像元特征矢量的欧氏距离的倒数作为权重,以权重值最大的训练数据的类别作为待分类像元的类别。Hardin,(1994)对 K-NN分类器进行了深入的讨论。
平行六面体分类方法是一个简单的非参数分类算法。该方法通过计算训练数据各波段直方图的上限和下限确定各类别像元亮度值的范围。对每一类别来说,其每个波段的上下限一起就形成了一个多维的盒子(box)或平行六面体(parallelepiped)。因此 M 个类别就有M 个平行六面体。当待分类像元的亮度值落在某一类别的平行六面体内时,该像元就被划分为该平行六面体代表的类别。平行六面体分类器可以用图5-1中两波段的遥感数据分类问题来表示。图中的椭圆表示从训练数据估计的各类别亮度值分布,矩形表示各类别的亮度值范围。像元的亮度落在哪个类别的亮度范围内,就被划分为哪个类别。
图5-1 平行六面体分类方法示意图
3.统计分类器的评价
各种统计分类器在遥感数据分类中的表现各不相同,这既与分类算法有关,又与数据的统计分布特征、训练样本的选取等因素有关。
非监督聚类算法对分类数据的统计特征没有要求,但由于非监督分类方法没有考虑任何先验知识,一般分类精度比较低。更多情况下,聚类分析被作为非监督分类前的一个探索性分析,用于了解分类数据中各类别的分布和统计特征,为监督分类中类别定义、训练数据的选取以及最终的分类过程提供先验知识。在实际应用中,一般用监督分类方法进行遥感数据分类。
最大似然分类方法是遥感数据分类中最常用的分类方法。最大似然分类属于参数分类方法。在有足够多的训练样本、一定的类别先验概率分布的知识,且数据接近正态分布的条件下,最大似然分类被认为是分类精度最高的分类方法。但是当训练数据较少时,均值和协方差参数估计的偏差会严重影响分类精度。Swain and Davis(1978)认为,在N维光谱空间的最大似然分类中,每一类别的训练数据样本至少应该达到10×N个,在可能的条件下,最好能达到100×N以上。而且,在许多情况下,遥感数据的统计分布不满足正态分布的假设,也难以确定各类别的先验概率。
最小距离分类器可以认为是在不考虑协方差矩阵时的最大似然分类方法。当训练样本较少时,对均值的估计精度一般要高于对协方差矩阵的估计。因此,在有限的训练样本条件下,可以只估计训练样本的均值而不计算协方差矩阵。这样最大似然算法就退化为最小距离算法。由于没有考虑数据的协方差,类别的概率分布是对称的,而且各类别的光谱特征分布的方差被认为是相等的。很显然,当有足够训练样本保证协方差矩阵的精确估计时,最大似然分类结果精度要高于最小距离精度。然而,在训练数据较少时,最小距离分类精度可能比最大似然分类精度高(Richards,1993)。而且最小距离算法对数据概率分布特征没有要求。
马氏距离分类器可以认为是在各类别的协方差矩阵相等时的最大似然分类。由于假定各类别的协方差矩阵相等,和最大似然方法相比,它丢失了各类别之间协方差矩阵的差异的信息,但和最小距离法相比较,它通过协方差矩阵保持了一定的方向灵敏性(Richards,1993)。因此,马氏距离分类器可以认为是介于最大似然和最小距离分类器之间的一种分类器。与最大似然分类一样,马氏距离分类器要求数据服从正态分布。
K-NN分类器的一个主要问题是需要很大的训练数据集以保证分类算法收敛(Devijver and Kittler,1982)。K-NN分类器的另一个问题是,训练样本选取的误差对分类结果有很大的影响(Cortijo and Blanca,1997)。同时,K-NN分类器的计算复杂性随着最近邻范围的扩大而增加。但由于 K-NN分类器考虑了像元邻域上的空间关系,和其他光谱分类器相比,分类结果中“椒盐现象”较少。
平行六面体分类方法的优点在于简单,运算速度快,且不依赖于任何概率分布要求。它的缺陷在于:首先,落在所有类别亮度值范围之外的像元只能被分类为未知类别;其次,落在各类别亮度范围重叠区域内的像元难以区分其类别(如图5-1所示)。
各种统计分类方法的特点可以总结为表5-1。
二、神经网络分类器
神经网络用于遥感数据分类的最大优势在于它平等地对待多源输入数据的能力,即使这些输入数据具有完全不同的统计分布,但是由于神经网络内部各层大量的神经元之间连接的权重是不透明的,因此用户难以控制(Austin,Harding and Kanellopoulos et al.,1997)。
神经网络遥感数据分类被认为是遥感数据分类的热点研究领域之一(Wilkinson,1996;Kimes,1998)。神经网络分类器也可分为监督分类器和非监督分类器两种。由于神经网络分类器对分类数据的统计分布没有任何要求,因此神经网络分类器属于非参数分类器。
遥感数据分类中最常用的神经网络是多层感知器模型(multi-layer percep-tron,MLP)。该模型的网络结构如图5-2所示。该网络包括三层:输入层、隐层和输出层。输入层主要作为输入数据和神经网络输入界面,其本身没有处理功能;隐层和输出层的处理能力包含在各个结点中。输入的结构一般为待分类数据的特征矢量,一般情况下,为训练像元的多光谱矢量,每个结点代表一个光谱波段。当然,输入结点也可以为像元的空间上下文信息(如纹理)等,或多时段的光谱矢量(Paola and Schowengerdt,1995)。
表5-1 各种统计分类器比较
图5-2 多层感知器神经网络结构
对于隐层和输出层的结点来说,其处理过程是一个激励函数(activation function)。假设激励函数为f(S),对隐层结点来说,有:
遥感信息的不确定性研究
其中,pi为隐层结点的输入;hj为隐层结点的输出;w为联接各层神经之间的权重。
对输出层来说,有如下关系:
遥感信息的不确定性研究
其中,hj为输出层的输入;ok为输出层的输出。
激励函数一般表达为:
遥感信息的不确定性研究
确定了网络结构后,就要对网络进行训练,使网络具有根据新的输入数据预测输出结果的能力。最常用的是后向传播训练算法(Back-Propagation)。这一算法将训练数据从输入层进入网络,随机产生各结点连接权重,按式(5-1)(5-2)和(5-3)中的公式进行计算,将网络输出与预期的结果(训练数据的类别)相比较并计算误差。这个误差被后向传播的网络并用于调整结点间的连接权重。调整连接权重的方法一般为delta规则(Rumelhart,et al.,1986):
遥感信息的不确定性研究
其中,η为学习率(learning rate);δk为误差变化率;α为动量参数。
将这样的数据的前向和误差后向传播过程不断迭代,直到网络误差减小到预设的水平,网络训练结束。这时就可以将待分类数据输入神经网络进行分类。
除了多层感知器神经网络模型,其他结构的网络模型也被用于遥感数据分类。例如,Kohonen自组织网络被广泛用于遥感数据的非监督聚类分析(Yoshida et al.,1994;Schaale et al.,1995);自适应共振理论(Adaptive Resonance Theory)网络(Silva,S and Caetano,M.1997)、模糊ART图(Fuzzy ART Maps)(Fischer,M.M and Gopal,S,1997)、径向基函数(骆剑承,1999)等也被用于遥感数据分类。
许多因素影响神经网络的遥感数据分类精度。Foody and Arora(1997)认为神经网络结构、遥感数据的维数以及训练数据的大小是影响神经网络分类的重要因素。
神经网络结构,特别是网络的层数和各层神经元的数量是神经网络设计最关键的问题。网络结构不但影响分类精度,而且对网络训练时间有直接影响(Kavzoglu and Mather,1999)。对用于遥感数据分类的神经网络来说,由于输入层和输出层的神经元数目分别由遥感数据的特征维数和总的类别数决定的,因此网络结构的设计主要解决隐层的数目和隐层的神经元数目。一般过于复杂的网络结构在刻画训练数据方面较好,但分类精度较低,即“过度拟合”现象(over-fit)。而过于简单的网络结构由于不能很好的学习训练数据中的模式,因此分类精度低。
网络结构一般是通过实验的方法来确定。Hirose等(1991)提出了一种方法。该方法从一个小的网络结构开始训练,每次网络训练陷入局部最优时,增加一个隐层神经元,然后再训练,如此反复,直到网络训练收敛。这种方法可能导致网络结构过于复杂。一种解决办法是每当认为网络收敛时,减去最近一次加入的神经元,直到网络不再收敛,那么最后一次收敛的网络被认为是最优结构。这种方法的缺点是非常耗时。“剪枝法”(pruning)是另一种确定神经网络结构的方法。和Hirose等(1991)的方法不同,“剪枝法”从一个很大的网络结构开始,然后逐步去掉认为多余的神经元(Sietsma and Dow,1988)。从一个大的网络开始的优点是,网络学习速度快,对初始条件和学习参数不敏感。“剪枝”过程不断重复,直到网络不再收敛时,最后一次收敛的网络被认为最优(Castellano,Fanelli and Pelillo,1997)。
神经网络训练需要训练数据样本的多少随不同的网络结构、类别的多少等因素变化。但是,基本要求是训练数据能够充分描述代表性的类别。Foody等(1995)认为训练数据的大小对遥感分类精度有显着影响,但和统计分类器相比,神经网络的训练数据可以比较少。
分类变量的数据维对分类精度的影响是遥感数据分类中的普遍问题。许多研究表明,一般类别之间的可分性和最终的分类精度会随着数据维数的增大而增高,达到某一点后,分类精度会随数据维的继续增大而降低(Shahshahani and Landgrebe,1994)。这就是有名的Hughes 现象。一般需要通过特征选择去掉信息相关性高的波段或通过主成分分析方法去掉冗余信息。分类数据的维数对神经网络分类的精度同样有明显影响(Battiti,1994),但Hughes 现象没有传统统计分类器中严重(Foody and Arora,1997)。
Kanellopoulos(1997)通过长期的实践认为一个有效的ANN模型应考虑以下几点:合适的神经网络结构、优化学习算法、输入数据的预处理、避免振荡、采用混合分类方法。其中混合模型包括多种ANN模型的混合、ANN与传统分类器的混合、ANN与知识处理器的混合等。
三、其他分类器
除了上述统计分类器和神经网络分类器,还有多种分类器被用于遥感图像分类。例如模糊分类器,它是针对地面类别变化连续而没有明显边界情况下的一种分类器。它通过模糊推理机制确定像元属于每一个类别的模糊隶属度。一般的模糊分类器有模糊C均值聚类法、监督模糊分类方法(Wang,1990)、混合像元模型(Foody and Cox,1994;Settle and Drake,1993)以及各种人工神经网络方法等(Kanellopoulos et al.,1992;Paola and Schowengerdt,1995)。由于模糊分类的结果是像元属于每个类别的模糊隶属度,因此也称其为“软分类器”,而将传统的分类方法称为“硬分类器”。
另一类是上下文分类器(contextual classifier),它是一种综合考虑图像光谱和空间特征的分类器。一般的光谱分类器只是考虑像元的光谱特征。但是,在遥感图像中,相邻的像元之间一般具有空间自相关性。空间自相关程度强的像元一般更可能属于同一个类别。同时考虑像元的光谱特征和空间特征可以提高图像分类精度,并可以减少分类结果中的“椒盐现象”。当类别之间的光谱空间具有重叠时,这种现象会更明显(Cortijo et al.,1995)。这种“椒盐现象”可以通过分类的后处理滤波消除,也可以通过在分类过程中加入代表像元邻域关系的信息解决。
在分类过程中可以通过不同方式加入上下文信息。一是在分类特征中加入图像纹理信息;另一种是图像分割技术,包括区域增长/合并常用算法(Ketting and Landgrebe,1976)、边缘检测方法、马尔可夫随机场方法。Rignot and Chellappa(1992)用马尔可夫随机场方法进行SAR图像分类,取得了很好的效果,Paul Smits(1997)提出了保持边缘细节的马尔可夫随机场方法,并用于SAR图像的分类;Crawford(1998)将层次分类方法和马尔可夫随机场方法结合进行SAR图像分类,得到了更高的精度;Cortijo(1997)用非参数光谱分类对遥感图像分类,然后用ICM算法对初始分类进行上下文校正。
Ⅲ 几种分类方法的应用效果
(1)基于ISODATA算法的非监督分类实现与效果
ISODATA法的实质是以初始类别为“种子”施行自动迭代聚类的过程。迭代结束标志着分类所依据的基准类别已经确定,它们的分布参数也在不断的“聚类训练”中逐渐确定,并最终用于构建所需要的判决函数。从这个意义上讲,基准类别参数的确定过程,也是对判决函数的不断调整和“训练”过程。
此次实现过程是在基于 IDL 语言下的 ENVI4.0 环境下实现的。主要参数如下:拟分类个数(Number of Classes):6;最大迭代次数(Maximum Iterations):8;像元变化阈值(Change Thresh-old):5%;一类中的最小像元数(Minimum Pixel in Class):5;类的最大标准差(Maximum Class Stdv):1;最小距离(Minimum Class Distance):5;合并成对类别的最大值(Maximum Merge Pairs):2;我们想要计算所有像元的DN值,故距离类别均值得标准差(Maximum Stdev From Mean)和所允许的最大距离误差(Maximum Distance Error)均为缺省DN值。
图3-24是显示康恩纳德斑岩铜矿床周围的影像为处理数据源的ISODATA非监督分类图。
表3-17 康恩纳德矿点ETM+遥感影像分类后类别比重表
Ⅳ 什么是监督分类和非监督分类
监督分类又称训练场地法、训练分类法,是以建立统计识别函数为理论基础、依据典型样本训练方法进行分类的技术,即根据已知训练区提供的样本,通过选择特征参数,求出特征参数作为决策规则,建立判别函数以对各待分类影像进行的图像分类。
非监督分类是以不同影像地物在特征空间中类别特征的差别为依据的一种无先验类别标准的图像分类,是以集群为理论基础,通过计算机对图像进行集聚统计分析的方法。根据待分类样本特征参数的统计特征,建立决策规则来进行分类。
监督分类的主要优点如下:
(1)可根据应用目的和区域,充分利用先验知识,有选择地决定分类类别,避免出现不必要的类别;
(2)可控制训练样本的选择;
(3)可通过反复检验训练样本,来提高分类精度,避免分类严重错误;
(4)避免了非监督分类中对光谱集群组的重新归类。
缺点如下:
(1)其分类系统的确定、训练样本的选择,均人为主观因素较强,分析者定义的类别有可能并不是图像中存在的自然类别,导致各类别间可能出现重叠;分析者所选择的训练样本也可能并不代表图像中的真实情形;
(2)由于图像中同一类别的光谱差异,造成训练样本没有很好的代表性;
(3)训练样本的选取和评估需花费较多的人力、时间;
(4)只能识别训练样本中所定义的类别,若某类别由于训练者不知道或者其数量太少未被定义,则监督分类不能识别。
Ⅳ 遥感数字图像处理方法
1.直方图法
对于每幅图像都可作出其灰度直方图。根据直方图的形态可大致推断图像的质量。由于图像包含有大量的像元,其像元灰度值的分布应符合概率统计分布规律。假定像元的灰度值是随机分布的,那么其直方图应该是正态分布。图像的灰度值是离散变量,因此直方图表示的是离散的概率分布。若以各灰度级的像元数占总像元数的比例值为纵坐标作出图像的直方图,将直方图中各条形的最高点连成一条外轮廓线,纵坐标的比例值即为某灰度级出现的概率密度,轮廓线可近似看成图像相应的连续函数的概率分布曲线。一般来说,如果图像的直方图轮廓线越接近正态分布,则说明图像的亮度接近随机分布,适合用统计方法处理,这样的图像一般反差适中;如果直方图峰值位置偏向灰度值大的一边,则图像偏亮;如果峰值位置偏向灰度值小的一边,则图像偏暗;峰值变化过陡、过窄,则说明图像的灰度值过于集中,后3种情况均存在反差小、质量差的问题。直方图分析是图像分析的基本方法,通过有目的地改变直方图形态可改善图像的质量。
2.邻域法
对于图像中任一像元(i,j),把像元的集合{i+p,j+p}(j,p取任意整数)均称为像元的邻域,常用的邻域如图所示,分别表示中心像元的4-邻域和8-邻域。
在图像处理过程中,某一像元处理后的值g(i,j)由处理前该像元f(i,i)的小邻域N(i,j)中的像元值确定,这种处理称为局部处理,或称为邻域处理。一般图像处理中,可根据计算目的差异,设计不同的邻域分析函数。
3.卷积法
卷积运算是在空间域内对图像进行邻域检测的运算。选定一个卷积函数,又称为“模板”,实际上是一个M×N的小图像,例如3×3、5×7、7×7等。图像的卷积运算是运用模板来实现的。模板运算方法如图所示,选定运算模板φ(m,n),其大小为M×N,从图像的左上角开始,在图像上开一个与模板同样大小的活动窗口f(m,n),使图像窗口与模板像元的灰度值对应相乘再相加。计算结果g(m,n)作为窗口中心像元新的灰度值。模板运算的公式如下(若模板的和为0,则除以1):
4.频率域增强法
在图像中,像元的灰度值随位置变化的频繁程度可用频率予以表示,这是一种随位置变化的空间频率。对于边缘、线条、噪声等特征,如河流、湖泊的边界,道路,差异较大的地表覆盖交界处等具有高的空间频率,即在较短的像元距离内灰度值变化的频率大;而均匀分布的地物或大面积的稳定结构,如植被类型一致的平原,大面积的沙漠、海面等具有低的空间频率,即在较长的像元距离内灰度值逐渐变化。例如,在频率域增强技术中,平滑主要是保留图像的低频部分抑制高频部分,锐化则是保留图像的高频部分而削弱低频部分。
5.图像运算法
对于遥感多光谱图像和经过空间配准的两幅或多幅单波段遥感图像,可进行一系列的代数运算,以达到某种增强的目的。这与传统的空间叠置分析类似,具体运算包括加法运算、差值运算、比值运算、复合指数运算等。
6.非监督分类法
是指人们事先对分类过程不做任何的先验知识,仅根据遥感影像地物的光谱特征的分布规律,随其自然地进行分类。其分类的结果,只是对不同类别进行区分,并不能确定类别属性,其类别属性是事后对各类的光谱曲线进行分析,以及与实地调查相比较后确定的。
遥感图像上的同类地物在相同的表面结构特征、植被覆盖、光照等条件下,一般具有相同或相近的光谱特征,从而表现出某种内在的相似性,归属于同一个光谱空间区域;不同的地物,光谱信息特征不同,归属于不同的光谱空间区域。这就是非监督分类的理论基础。由于在一幅复杂的图像中,训练区有时不能包括所有地物的光谱样式,这就造成了一部分像元找不到归属。在实际工作中为了进行监督分类而确定类别和训练区的选取也是不易的,因而在开始分析图像时,用非监督分类方法来研究数据的本来结构及其自然点群的分布情况是很有价值的。
非监督分类主要采用聚类分析的方法,以此使得属于同一类别的像元之间的距离尽可能小而不同类别上像元间的距离尽可能地大。在进行聚类分析时,首先要确定基准类别的参量。然而非监督分类中并无基准类别的先验知识可利用,因而只能先假定初始的参量,并通过预分类处理来形成集群。再由集群的统计参数来调整预制的参量,接着再聚类、再调整。如此不断地迭代,直到有关参数达到允许的范围为止。
7.监督分类法
与非监督分类不同,监督分类的最基本特点是在分类前人们对遥感图像上某些抽样区中影像地物的类别属性已有了先验知识,即先要从图像中选取所有要区分的各类地物的样本,用于训练分类器(建立判别函数)。这里的先验知识可来自于野外的实地考察,也可参照相关的其他的文字资料或图件或者直接是图像处理者本人的经验等。训练区中,具体确定各类地物各波段的灰度值,从而可确定特征参数,建立判别函数。监督分类一般是在图像中选取具有代表性的区域作为训练区,由训练区得到各个类别的统计数据,然后根据这些统计数据对整个图像进行分类,其既可采用概率判别函数,也可采用距离判别函数。
8.图像分割法
它是数字图像处理中的关键技术之一。图像分割是将图像中有意义的特征部分提取出来,其有意义的特征有图像中的边缘、区域等,这是进一步进行图像识别、分析和理解的基础。虽然目前已研究出不少边缘提取、区域分割的方法,但还没有一种普遍适用于各种图像的有效方法。因此,对图像分割的研究有待不断深入。