‘壹’ 矿物识别方法和工作流程
目前,矿物识别制图的方法是特征谱带识别和基于相似性测度的识别:①利用岩石矿物的特征谱带构造识别技术,该方法相对直观,简单可行,但是单一的特征往往造成岩石矿物的错误识别,其精度难以达到工程化应用的需求,同时对成像光谱数据的信噪比、光谱重建的精度要求较高;②从岩石矿物光谱的整体特征出发,与成像光谱视反射率数据进行整体匹配、拟合或构造模型进行分解,这也是目前研究的重点,能有效地避免因岩石矿物光谱漂移或光谱变异而造成的单个光谱特征的不匹配,并能综合利用弱的光谱信息,避免局部性特征(如单一特征构建的识别方法)造成识别的混淆,识别的精度高。
对于成像光谱上百个波段而言,数据量非常之大,尤其在目前无论是航空成像光谱数据,如AVIRIS、CASI、HyMap等,还是在轨的航天成像光谱数据,如Hyperion航带都普遍比较窄,一般在3~10km,给大面积应用带来很多不便,增加了大面积数据处理的难度,并使工作量在目前微机配置的条件下成倍增加。因此,无论是从岩石矿物光谱的局域特征还是整体特征开展对矿物的识别,在保证识别精度要求的条件下进行工程化的处理,必须探索新的技术流程。
在对成像光谱数据特征与识别方法的比较研究中,结合工作实际以及进行工程化处理的初步要求,在确保识别精度的条件下,设计出标准数据库光谱+光谱-特征域转换+矿物识别方法的技术流程。该流程的主要作用:
(1)直接开展蚀变矿物的识别与信息提取:在对试验区岩石类型、构造、热液活动以及矿产综合研究的基础之上,提炼与矿化关系密切的蚀变矿物,利用标准库的光谱或野外实测光谱作为参考光谱。
(2)进行光谱域与特征域的转换,实现数据减维与数据压缩,降低工作量,提高工作效率:成像光谱数据波段上百,不同的航带宽度与记录长度使单次处理的数据量达1Gbytes,中间过渡文件单航带可达10Gbytes;在以前的处理中常常将航带分割成较小的区域进行处理后再进行拼接,利用MNF技术可以将整个光谱域空间转换到特征域空间,消除原有光谱向量间各分量之间的相关性,从而去掉信息量较少噪声较高的向量,使数据处理从成百的光谱域集中到去噪的特征域中进行,减低数据量,缩短数据处理时间,提高数据处理的效率。
(3)特征分离,增加不同矿物的可分性,提高矿物识别的精度:在成像光谱数据MNF变换并剔除噪声波段的特征域空间中,不同的波段被赋予了不同的物理或数学意义,地物的光谱特征在特征域发生分离,地物的细微特征得到放大,增加了数据的可分性。
4.4.2.1 光谱特征域转换
光谱分辨率的提高,一方面提高了数据的分类识别的精度以及应用能力,另一方面,增加了数据的容量,也使数据高冗余高相关。有效的数据压缩与特征提取势在必行。一般地,利用传统的主成分变换进行相应的变化,衍生出一系列的成像光谱数据压缩与特征提取方法,如MNF变换(Kruse,1996;Green et al.,1998),NAPC(Lee et al.,1990)、分块主成分变换(Jia et al.,1998)以及基于主成分的对应分析(Carr et al.,1999)等。空间自相关特征提取(Warner et al.,1997)、子空间投影(Harsanyi et al.,1994)和高维数据二阶特征分析(Lee et al.,1993;Haertel et al.,1999)也得到相应的重视。利用非线形的小波、分形特征(Qiu et al.,1999)也在研究之中。
主成分分析(PCA)是根据图像的统计特征确定变换矩阵对多维(多波段)图像进行正交线性变换,使变换后新的组分图像互不相关,并且把多个波段中有用信息尽可能地集中到少数几个组分图像中(图4-4-1)。一般地,随着主成分阶次的提高,信噪比逐渐减小。但在波段较多时并不完全符合这一规律。
为改善主成分在高光谱维中的数据处理能力,相应地利用最大噪声组分变换(MNF)的方法(甘甫平,2001;甘甫平等,2002~2003)。该方法是利用图像的噪声组分矩阵(ΣNΣ-1)的特征向量对图像进行变换,使按特征值由大到小排序的变换分量所包含的噪声成分逐渐减小,而图像质量顺次提高。Σ为图像的总协方差矩阵,ΣN为图像噪声的协方差矩阵。MNF相当于所有波段噪声方差都相等时的主成分分析,因此可分为两步实现,第一步先将图像变换到一个新的坐标系统,使变换后图像噪声的协方差矩阵为单位阵;第二步再对变换后的图像施行主成分变换。此改进的算法称为“噪声调节主成分变换(NAPC)”。
对P波段的高光谱图像
Zi(x),i=1,2,…,p (4-4-1)
可以假设
Z(x)=S(x)+N(x) (4-4-2)
这里,ZT(x)={Z1(x),…,Zp(x)},S(x)和N(x)分别为Z(x)中不相关的信息分量和噪声分量。因此,
Cov{Z(x)}=∑=∑S+∑N (4-4-3)
∑S和∑N分别为S(x)和N(x)的协方差矩阵。因此,可以定义第i波段噪声分量,
Var{Ni(x)}/Var{Zi(x)} (4-4-@4)
选择线形转换,MNF变换可以表示为
成像光谱岩矿识别方法技术研究和影响因素分析
在变换中,确保
成像光谱岩矿识别方法技术研究和影响因素分析
同时,为使噪声与信息分离,S(x)分别与Z(x)和N(x)正交。
图4-4-1 MNF变换的特征值曲线
MNF有两个重要的性质,一是对图像的任何波段作比例扩展,变换结果不变;二是变换使图像矢量、信息分量和加性噪声分量互相垂直。乘性噪声可通过对数变换转换为加性噪声。变换后可针对性地对各分量图像进行去噪,或舍弃噪声占优势的分量。MNF变换的特征值曲线如图4-4-1。
4.4.2.2 特征分离
在MNF变换后的特征域中不同波段具有不同物理与数学意义。比如变换后的第1波段表示地物的亮度信息,第7 波段或第8 波段表示地形信息。在MNF变换中,通过信号与噪声分离,使信息更加集中于有限的特征集中,一些微弱信息则在去噪转化中被增强。同时在MNF转换过程中,使光谱特征向量集汇聚,增强分类信息。
图4-4-2是一些矿物光谱通过MNF变换前后的曲线剖面图,从右图可见信息与噪声分别有序地集中在一些有限的波段内。通过舍弃噪声波段或其他处理,相应地降低或消除噪声的影响。同时信息也比原始数据更易区分。
4.4.2.3 矿物识别
矿物识别主要选用光谱相似性测度的方法。基于整个谱形特征的相似性概率的大小,能有效地避免因岩石矿物光谱漂移或光谱变异而造成的单个光谱特征的不匹配,并能综合利用弱的光谱信息。
图4-4-2 矿物光谱MNF变换前后特征比较
基于整个光谱形特征的识别方法主要有光谱角技术、光谱匹配滤波、光谱拟合与线形分解等。利用大气校正后的重建光谱数据,可选择性地利用上述矿物识别技术开展端元矿物的识别。光谱角方法可直接选择端元矿物进行匹配,最终生成二值图像,简单易行,在阈值合理可靠的前提下能够获取较高的识别精度。
在成像光谱岩矿地质信息识别与提取方法中,光谱角技术是一种较好的方法之一(王志刚,1993;刘庆生,1999)。光谱角识别方法是在由光谱组成的多维光谱矢量空间,利用一个岩矿矢量的角度测度函数(θ)求解岩矿参考光谱端元矢量(r)与图像像元光谱矢量(t)的相似性测度,即:
成像光谱岩矿识别方法技术研究和影响因素分析
这里,‖*‖为光谱向量的模。参考端元光谱可来自实验室、野外测量或已知类别的图像像元光谱。θ介于0到π/2,其值愈小,二者相似度愈高,识别与提取的信息愈可靠。通过合理的阈值选择,获取矿化蚀变信息的二值图像。
4.4.2.4 阈值的选择与航带间信息的衔接
无论是光谱角技术还是光谱匹配以及混合光谱分解,都存在对非矿物信息的分割,因此阈值的选择是一个必须面临的重要问题。这不仅关系到所识别矿物的可靠度,也关系到矿物分布范围大小的界定。同时由于是分航带提取,不同航带间因大气校正的误差和噪声的影响而使同一地物的光谱特征存在差异,可能使所提取的矿物空间展布特征在航带之间所有诊断和一致性,增加了制图的困难。因此对于阈值的选择,需遵循以下原则:在去除明显假象信息、保留可靠的矿化蚀变信息情况下考虑整体的一致性以及航带的过渡性。
4.4.2.5 技术流程
结合成像光谱数据预处理,根据实际应用情况,可以总结出成像光谱遥感地质调查工作的技术流程,如图443所示。