導航:首頁 > 使用方法 > 常用的數字重采樣方法

常用的數字重采樣方法

發布時間:2022-10-07 06:25:05

㈠ 對於重采樣的程序解析

重采樣:就是根據一類象元的信息內插出另一類象元信息的過程。在遙感中,重采樣是從高解析度遙感影像中提取出低解析度影像的過程。

中文名重采樣

外文名resampling

注 意根據信息內插象元信息

目 的提取出低解析度影像

定義

重采樣:就是根據一類象元的信息內插出另一類象元信息的過程。

在 遙感中,重采樣是從高解析度遙感影像中提取出低解析度影像的過程。

重采樣方法

常用的重采樣方法有最鄰近內插法(nearest neighbor interpolation)、雙線性內插法(bilinear interpolation)和三次卷積法內插(cubic convolution interpolation)。其中,最鄰近內插法最為簡單,計算速度快,但是視覺效應差;雙線性插值會使圖像輪廓模糊;三次 卷積法產生的圖像較平滑,有好的視覺效果,但計算量大,較費時。

㈡ 數據科學家需要掌握的10個基本統計技術

數據科學家需要掌握的10個基本統計技術
無論您在數據的科學性問題上持哪種看法,都無法忽視數據的持續重要性,也不能輕視分析、組織和情境化數據的能力。 根據大量的就業數據和員工反饋信息統計,在「25個最佳美國就業機會」排行榜中,數據科學家排名第一。毫無疑問,數據科學家所做的具體工作內容將會進一步拓展。隨著機器學習等技術變得越來越普遍,深度學習等新興領域對研究人員和工程師的需求得到了巨大的推動,數據科學家們在創新和技術進步的浪潮中再次嶄露頭角。
編碼能力強大是很重要的,但數據科學並不專職於軟體工程(事實上,對Python很熟悉就足夠了)。數據科學家生活在編碼、統計學和批判性思維的交叉點上。正如喬希·威爾斯(JoshWills)所說的那樣:「數據科學家是一個比任何程序員都要好的統計學家,而且比任何統計學家都更擅長編程。」筆者個人知道有太多的軟體工程師希望轉向數據科學家,並盲目利用機器學習框架TensorFlow或Apache Spark,而不透徹理解背後的統計理論。因此出現了「統計學習」,一個與機器學習有關的理論框架,包含統計到功能分析的一系列專業領域。
什麼學習統計學習?了解各種技術背後的想法是非常重要的,可以讓你知道如何以及何時使用它們。由簡入繁,首先要理解更簡單的方法,才好把握更復雜的方法。准確地評估一種方法的性能,了解它的工作效果多好或者多糟,這一點很重要。此外,這是一個令人興奮的研究領域,在科學,工業和金融領域有著重要的應用。最終,統計學習是培養現代數據科學家的基本要素。統計學習問題的例子有:
確定前列腺癌的危險因素。
根據記錄周期圖對錄制的音素進行分類。
根據人口統計、飲食和臨床測量,預測是否有人會發生心臟病。
自定義垃圾郵件檢測系統。
識別手寫郵政編碼中的數字。
將組織樣本分為幾個癌症類別之一。
建立人口調查數據中工資與人口變數之間的關系。
統計學習和機器學習之間的差異在於:
機器學習是人工智慧的一個子領域。
統計學習是統計學的一個分支。
機器學習更強調大規模應用和預測的准確性。
統計學習強調模型及其可解釋性,精確性和不確定性。
1 - 線性回歸:
在統計學中,線性回歸是一種通過擬合自變數與自變數之間最佳線性關系來預測目標變數的方法。最好的做法是確保每個點的形狀和實際觀測之間的所有距離之和盡可能小。形狀的適合性是「最好的」,因為在形狀的選擇上沒有其他位置會產生較少的誤差。線性回歸的2種主要類型是簡單線性回歸和多元線性回歸。簡單線性回歸使用一個獨立變數來通過擬合最佳線性關系來預測因變數。多重線性回歸使用多個獨立變數來通過擬合最佳線性關系來預測因變數。
選擇你在日常生活中使用的任何兩件相關的東西。如每月支出,月收入和過去三年每月的旅行次數的數據。就需要回答以下問題:
我明年的每月開支是多少?
哪個因素(每月收入或每月旅行次數)在決定我的每月支出時更重要?
月收入和每月旅行如何與每月支出相關聯?
2 - 分類:
分類是一種數據挖掘技術,它將類別分配給數據集合,以助進行更准確的預測和分析。有時也稱為決策樹,分類是用於對非常大的數據集進行分析的幾種方法之一。眼下有2大分類技術脫穎而出:Logistic回歸和判別分析。
Logistic回歸分析是當因變數是二分(二元)時進行的適當的回歸分析。像所有回歸分析一樣,Logistic回歸是預測分析。 Logistic回歸用於描述數據並解釋一個相關二元變數與一個或多個標稱、序數、區間或比例級別的獨立變數之間的關系。邏輯回歸可以檢查的問題類型:
每增加一磅的超重和每天吸一包香煙,肺癌的可能性(是vs否)會發生怎樣的變化?
體重卡路里攝入量,脂肪攝入量和參與者年齡對心臟病發作是否有影響(有vs無)?
在判別分析中,先驗已知2個或更多個組或群或群,並基於所測量的特徵將1個或更多個新觀察分類到1個已知群中。判別分析在每個響應類別中分別對預測因子X的分布進行建模,然後使用貝葉斯定理將它們翻轉為給定X的值的響應類別概率的估計。這樣的模型可以是線性的或二次的。
線性判別分析為每個觀測值計算「判別分數」,以便對它所處的響應變數類別進行分類。這些分數是通過尋找自變數的線性組合得到的。它假設每個類別內的觀察值都來自多變數高斯分布,預測因子的協方差在響應變數Y的所有k水平上是共同的。
二次判別分析提供了一種替代方法。和LDA一樣,QDA假定每個Y類的觀測值都是從高斯分布中得到的。但是,與LDA不同的是,QDA假定每個類都有其自己的協方差矩陣。換句話說,預測因子不被假定在Y中的每個k水平上具有共同的方差。
3 - 重采樣方法:
重采樣是從原始數據樣本中繪制重復樣本的方法。這是統計推斷的非參數方法。換句話說,重采樣方法不涉及使用通用分布表來計算近似p概率值。
重采樣根據實際數據生成唯一的采樣分布。它使用實驗方法而不是分析方法來生成獨特的抽樣分布。它產生無偏估計,因為它是基於研究者所研究數據的所有可能結果的無偏樣本。為了理解重采樣的概念,您應該理解術語Bootstrapping和交叉驗證:
Bootstrapping是一種技術,可以幫助您在很多情況下驗證預測模型的性能、集成方法、估計模型的偏差和方差。它通過對原始數據進行替換來進行采樣,並將「未選擇」的數據點作為測試用例。我們可以做這幾次,並計算平均分作為我們的模型性能的估計。
另一方面,交叉驗證是驗證模型性能的一種技術,它是通過將訓練數據分成k個部分來完成的。我們以k - 1部分作為訓練集,並使用「伸出部分」作為我們的測試集。我們重復k次不同的方式。最後,我們將k分數的平均值作為我們的業績估計。
通常對於線性模型,普通最小二乘法是考慮將它們適合於數據的主要標准。接下來的3種方法是可以為線性模型的擬合提供更好的預測精度和模型可解釋性的替代方法。
4 - 子集選擇:
這種方法確定了我們認為與響應相關的p預測因子的一個子集。然後,我們使用子集特徵的最小二乘擬合模型。
最佳子集選擇:這里我們對每個可能的p預測因子組合進行單獨的OLS回歸,然後查看最終的模型擬合。演算法分為2個階段:(1)擬合所有包含k預測因子的模型,其中k是模型的最大長度;(2)使用交叉驗證的預測誤差選擇單個模型。使用測試或驗證錯誤非常重要,而不是訓練錯誤來評估模型擬合,因為RSS和R 2單調增加更多的變數。最好的方法是在測試誤差估計值上交叉驗證並選擇具有最高R 2和最低RSS的模型。
向前逐步選擇考慮預測因子的一個小得多的子集。它從不含預測因子的模型開始,然後在模型中添加預測因子,直到所有預測因子都在模型中。被添加變數的順序是變數,其給出對擬合的最大的加法改進,直到沒有更多的變數使用交叉驗證的預測誤差來改進模型擬合。
向後逐步選擇開始將模型中的所有預測因子,然後迭代去除最不有用的預測因子。
混合方法遵循向前逐步回歸方法,但是,在添加每個新變數之後,該方法還可以去除對模型擬合沒有貢獻的變數。
5 - 收縮:
這種方法適合一個涉及所有p預測因子的模型,然而,估計系數相對於最小二乘估計向零收縮。這種縮水,又稱正規化,具有減少方差的作用。取決於執行什麼類型的收縮,其中一些系數可能恰好被估計為零。因此這個方法也執行變數選擇。將系數估計收縮為零的兩個最著名的技術是嶺回歸和Lasso。
嶺回歸類似於最小二乘,通過最小化一個稍微不同的數量估計系數。像OLS一樣,嶺回歸尋求降低RSS的系數估計值,但是當系數接近於零時,它們也會有收縮懲罰。這個懲罰的作用是將系數估計收縮到零。不用進入數學計算,知道嶺回歸縮小列空間方差最小的特徵是有用的。像在主成分分析中一樣,嶺回歸將數據投影到雙向空間,然後比高方差分量收縮低方差分量的系數,這相當於最大和最小主分量。
嶺回歸至少有一個缺點:它包括最終模型中的所有p預測值。犯規條款將使它們中的許多接近於零,但不完全為零。這對於預測准確性來說通常不是問題,但它可能使模型更難以解釋結果。 Lasso克服了這個缺點,並且能夠迫使一些系數歸零,只要s足夠小。由於s = 1導致有規律的OLS回歸,當s接近0時,系數收縮為零。因此,Lasso回歸也執行變數選擇。
6 - 維度降低:
維數減少將估計p + 1個系數的問題簡化為M + 1個系數的簡單問題,其中M
可以將主成分回歸描述為從大量變數中導出低維特徵集合的方法。數據的第一個主要組成方向是觀測值變化最大的。換句話說,第一台PC是盡可能接近數據的一條線。人們可以適應不同的主要組成部分。第二個PC是與第一個PC不相關的變數的線性組合,並且受這個約束的變化最大。這個想法是主要的組成部分使用隨後正交方向的數據的線性組合捕獲數據中最大的變化。通過這種方式,我們也可以結合相關變數的效果,從可用數據中獲取更多信息,而在正則最小二乘中,我們將不得不放棄其中一個相關變數。
我們上面描述的PCR方法包括確定最能代表預測因子的X的線性組合。這些組合(方向)以無監督的方式被識別,因為響應Y不用於幫助確定主要組件方向。也就是說,響應Y不監督主成分的識別,因此不能保證最能解釋預測因子的方向對於預測響應(即使經常假設)也是最好的。偏最小二乘法(PLS)是一個監督的替代PCR。與PCR一樣,PLS是一種降維方法,它首先識別一組新的較小的特徵,這些特徵是原始特徵的線性組合,然後通過最小二乘法擬合一個線性模型到新的M特徵。然而,與PCR不同的是,PLS利用響應變數來識別新的特徵。
7 - 非線性模型:
在統計學中,非線性回歸是回歸分析的一種形式,其中觀測數據是由一個函數建模的,該函數是模型參數的非線性組合,並取決於一個或多個自變數。數據通過逐次逼近的方法進行擬合。以下是一些處理非線性模型的重要技巧:
如果實數的函數可以寫成區間指示函數的有限線性組合,則稱實數為函數。非正式地說,一個階梯函數是一個只有很多片段的分段常量函數。
分段函數是由多個子函數定義的函數,每個子函數應用於主函數域的一定間隔。分段實際上是表達函數的一種方式,而不是函數本身的一個特徵,但是具有額外的限定,可以描述函數的性質。例如,分段多項式函數是在其每個子域上是多項式的函數,但是每個子域上可能是不同的。
樣條函數是由多項式分段定義的特殊函數。在計算機圖形學中,樣條是指分段多項式參數曲線。由於其結構簡單,評估方便和准確,以及通過曲線擬合和互動式曲線設計逼近復雜形狀的能力,樣條曲線是流行的曲線。
廣義加性模型是一種線性預測模型,其中線性預測變數線性依賴於某些預測變數的未知光滑函數,興趣集中在對這些光滑函數的推理上。
8 - 基於樹的方法:
基於樹的方法可以用於回歸和分類問題。這些涉及將預測空間分層或分割成若干簡單區域。由於用於分割預測變數空間的分裂規則集合可以在樹中進行概括,所以這些類型的方法被稱為決策樹方法。下面的方法生成多個樹,然後結合在一起產生一個單一的共識預測。
套袋(Bagging)是減少預測方差的方法,通過使用重復組合來生成原始數據集中的訓練數據,從而生成與原始數據相同的多樣性。通過增加你的訓練集的大小,你不能提高模型的預測力,只是減少方差,勉強把預測調整到預期的結果。
提升(Boosting)是一種使用幾種不同的模型計算產出的方法,然後使用加權平均方法對結果進行平均。通過改變你的加權公式,結合這些方法的優點和缺陷,你可以使用不同的狹義調整模型,為更廣泛的輸入數據提供一個很好的預測力。
隨機森林(random forest )演算法實際上非常類似於套袋。你也可以繪制訓練集的隨機bootstrap樣本。但是,除了自舉樣本之外,還可以繪制隨機子集來訓練單個樹;在套袋中,你給每個樹一套完整功能。由於隨機特徵選擇,與常規套袋相比,樹木之間的相互獨立性更高,這通常會帶來更好的預測性能(由於更好的方差偏差權衡),而且速度更快,因為每棵樹只能從功能的一個子集。
9 - 支持向量機:
SVM是機器學習中監督學習模型中的一種分類技術。通俗地說,它涉及於找到超平面(2D中的線,3D中的平面和更高維中的超平面,更正式地說,超平面是n維空間中的n維空間)最大保證金從本質上講,它是一個約束優化問題,其邊界被最大化,受限於它對數據進行了完美的分類(硬邊緣)。
這種「支持」這個超平面的數據點被稱為「支持向量」。對於兩類數據不能線性分離的情況,這些點被投影到可能線性分離的分解(高維)空間。涉及多個類的問題可以分解為多個一對一或者一對二的分類問題。
10 - 無監督學習:
到目前為止,我們只討論了監督學習技術,其中組是已知的,提供給演算法的經驗是實際實體和它們所屬的組之間的關系。當數據的組(類別)未知時,可以使用另一組技術。它們被稱為無監督的,因為它會留在學習演算法中以找出所提供的數據中的模式。聚類是無監督學習的一個例子,其中不同的數據集被聚類為密切相關的項目組。下面是最廣泛使用的無監督學習演算法的列表:
主成分分析通過識別一組具有最大方差和相互不相關的特徵的線性組合來幫助產生數據集的低維表示。這種線性維度技術有助於理解變數在無監督環境下的潛在相互作用。
k-Means聚類:根據到群集質心的距離將數據分為k個不同的集群。
分層集群:通過創建集群樹來構建集群的多級分層結構。
以上是一些基本的統計技術的簡單解釋與說明,可以幫助數據科學項目經理和主管人員更好地理解他們的數據科學小組背後隱藏的內容。實際上,一些數據科學小組純粹通過python和R庫運行演算法。他們中的大多數甚至不必考慮潛在的數學問題。但是,能夠理解統計分析的基礎知識可以為您的團隊提供更好的方法。

㈢ ArcGIS中的柵格數據重采樣方法有哪些

柵格重采樣主要包括三種方法:最鄰近法、雙線性內插法和三次卷積插值法。最鄰近法是把原始圖像中距離最近的像元值填充到新圖像中;雙線性內插法和三次卷積插值法都是把原始圖像附近的像元值通過距離加權平均填充到新圖像中。默認情況下,採用最近鄰分配重采樣技術,這種方法同時適用於離散和連續值類型,而其他重采樣方法只適用於連續數據。另外還可以用ArcGIS中的Resampling工具進行柵格重采樣操作。具體操作方法可以去地理國情監測雲平台看看,或者從網上搜索下,這個答案我就是從網上找到答案的。回答完畢。

㈣ 遙感數據及其處理

一、遙感數據及其特徵

滇東北地區鉛鋅礦遙感地質調查工作共分為三個層次,其中1∶5萬層次及1∶2.5萬層次使用美國陸地衛星(Landsat-7)ETM+數據作為基礎數據,1∶1萬層次使用美國快鳥(QuickBird)衛星數據作為基礎數據。

(一)ETM+數據

ETM+數據是美國1999年4月所發射的陸地7號衛星攜帶的增強型主題成像儀(ETM+)對地球表面所採集的數據,其基本參數、設計波段的特徵及設計用途見表3-1。

表3-1Landsat-7衛星參數及數據特徵

長期對Landsat系列衛星數據在地質方面的應用研究表明,Landsat衛星數據各個波段都能提供地質構造、地形地貌信息。其中,5、6、7波段信息量更為豐富,1、2、3、4波段能夠區分岩石中的鐵、錳礦物和含鐵、錳礦物的相對含量,尤其是4波段對於三價鐵的礦物比較敏感,可以藉此區分岩性,5波段對綠簾石族特徵譜帶敏感,7波段識別碳酸鹽岩、綠片岩、絹雲片岩和粘土岩及粘土礦物聚集帶的效果較好,6波段對於識別地熱異常、岩石和構造的含水性及鑒別地質構造有一定的用途。另外,Landsat-7還增加了一個15m解析度的全色波段,從視覺效果上直接提高了對地物的識別,見表3-2。

表3-2 Landsat-7ETM+數據特徵及在地質上的用途簡表

圖3-1 滇東北地區ETM數據分布示意圖

本次工作范圍佔有ETM數據129-041及129-042兩景,時相均為2001年12月23日。工作范圍在兩景數據中的位置如圖3-1。數據元數據情況見表3-3。

表3-3 129-041,129-042衛星數據元數據特徵

續表

(二)快鳥(Quick Bird)衛星數據

快鳥(Quick Bird)是美國Digital Globel(Earth Watch)公司2001年10月發射的高解析度衛星,其空間最高解析度為61cm,可製作比例尺在1∶1萬左右的影像。衛星參數及數據特徵見表3-4。

表3-4 Quick Bird衛星參數及數據特徵

快鳥衛星數據的波段設置,與ETM數據具有一定的對應性,1、2、3、4波段波長范圍完全一致,只是在全色波段快鳥數據比ETM數據的波長范圍略窄一些。

大比例尺遙感地質調查工作主要布設於彝良毛坪地區,購置快鳥數據80km2,范圍為X:3038000—3046000,Y:35392000—35402000。屬於現拍數據,數據採集時間為2004年5月8日,其元數據特徵見表3-5。

表3-5 毛坪地區快鳥衛星數據元數據特徵

二、遙感數據處理

(一)數據處理軟體

遙感圖像處理主要使用加拿大專業遙感圖像處理軟體PCIGeomatica8.0及美國著名專業遙感圖像處理軟體ENVI3.5。

(二)數據處理流程

遙感數據處理的主要流程包括數據組織(即數據種類選擇、范圍確認、時相選擇、訂購等)、數據鑲嵌(單景數據不存在此過程)、幾何校正、圖像生成、圖像增強、圖像整飾等過程,見圖3-2。

圖3-2 數據處理流程圖

(三)數據處理

1.數據鑲嵌

所謂鑲嵌,就是將相鄰兩景圖像拼接、形成大圖像的過程。在圖像鑲嵌過程中如果使用不同時相的數據,由於數據成像的季節、太陽高度角不同,導致同名像元點在不同的數據上可能表現為不同的灰階;當使用相同時相數據時,由於地面站後期人為分景、單獨處理,也會導致同名像元點在不同的數據上有可能表現為不同的灰階,同一地物在不同數據上表現出不同特徵。因此說,圖像的鑲嵌過程是一個數據重疊范圍內的配准過程。

滇東北地區1∶5萬工作區涉及129-041及129-042兩景數據,數據鑲嵌是在PCIGeomatica遙感圖像處理平台的GCPworks模塊中完成的。鑲嵌過程中側重於重疊數據范圍內同名點的選擇及鑲嵌線的選擇。一般每兩景圖像上下鑲嵌選擇10~15個GCP。在鑲嵌線的選擇上,避免一條直線,根據鑲嵌區的地貌特徵盡量使鑲嵌線通過色差較大的地方,避免人為造成線性體。然後利用PCI提供的ColourMatching功能對鑲嵌區內的圖像色彩進行匹配,使鑲嵌後圖像的色彩在鑲嵌線兩側柔和過渡,達到無縫的效果。

2.幾何校正

(1)幾何校正方法

由於衛星姿態與軌道、地球運動和形狀、遙感器本身的性能和掃描鏡的不規則、探測器的配置、檢測器采樣延遲、數模轉換的誤差等等原因,均會導致原始遙感圖像的嚴重幾何變形,不能直接使用。一般而言,衛星地面站會根據衛星軌道的各種參數將圖像進行粗略的校正,但往往由於遙感器的位置及姿態的測量值不高,其粗校正後的圖像仍存在不小的幾何變形。用戶需要利用地面控制點和多項式糾正模型做進一步的幾何糾正。只有按照一定的投影模式對原始圖像進行幾何精校正後的圖像,才能使圖像上每個像元具有相應的准確的地理坐標,只有進行幾何精校正後的圖像才能製作成能與其他圖件配合使用的「地圖(map)」。幾何糾正的步驟有以下3步:

1)地面控制點(GCP)的選擇。地面控制點的選擇一般有兩種方法,實地測量和在相同比例尺或更大比例尺地形圖上采點。地面控制點選擇的原則是,選擇在圖像上顯示清晰、實地不(或很少)隨時間變化的定位識別標志,如道路交叉點、河流交匯處等。另外,控制點要在校正范圍內均勻分布,並保證一定的數量。

2)多項式模型糾正。多項式模型糾正就是在圖像像元坐標(x,y)與地形圖上相應點的地理坐標(X,Y)之間通過適當的坐標多項式模型(坐標變換函數)建立一種關系,從而通過像元的重新定位把圖像擬合到地形圖上。多項式校正模型的數學表達式為:

滇東北鉛鋅銀礦床遙感地質與成礦預測

式中:aij,bij為多項式系數;N為多項式次數,取決於圖像的變形程度、控制點的數量和地形位移的大小。

3)重采樣。由於經過了多項式校正,重新定位後的像元在原圖像中分布是不均勻的,因此需要對原圖像按一定的規則重新采樣,進行亮度值的插值計算,建立新的圖像矩陣。常用的重采樣方法有最臨近法、雙線性內插法、三次卷積內插法。3種方法在地物邊緣增強、地物連貫性、計算速度等方面各有利弊。其中三次卷積內插法對邊緣有所增強,並具有均衡化和清晰化的效果,但計算量大。

(2)1∶5萬工作范圍圖像幾何校正

1∶5萬工作范圍圖像校正使用相應范圍的1∶5萬地形圖60幅。校正點的選擇是在60幅地形圖上均勻選擇GCP203點,校正模型選擇了二次多項式擬合,重采樣方法使用三次卷積內插法。校正後的圖像投影方式為高斯投影、6°分帶,中央經線為105°,橢球體採用克拉索夫斯基1954橢球體,與地形圖保持一致。

(3)1∶1萬工作范圍圖像幾何校正

由於缺少相同比例尺地形圖,收集到的地形資料只有區內1∶5萬地形圖和極少部分1∶2000地形圖,因此校正點的採集採用地形圖采點與野外實地測點相結合的方法完成。共採集GCP33個。校正模型選擇了二次多項式擬合,重采樣方法使用三次卷積內插法。校正後的圖像投影方式為高斯投影、3°分帶,中央經線為105°,橢球體採用克拉索夫斯基1954橢球體。

3.彩色合成

彩色合成的目的是將單色波段每像元的28(即256)色空間擴展到224(即16777216)色空間,增強目標地物的可視性,提高目視解譯效果。通過色彩豐富、信息攜帶量大的基礎彩色圖像,解譯人員才能充分識別圖像的信息,進行地質解譯。

為達到最佳的彩色合成效果,參加合成的波段選擇常遵循以下原則:

1)參加合成的單波段有較大的方差,即波段本身具有較大的信息量。

2)參加合成的各波段間相關系數較小,避免信息的重復和冗餘。

3)參加合成的三波段圖像的均值要相近,避免合成圖像產生嚴重偏色。

4)為突出目標地物,要選擇目標物體顯示較為突出的波段。

彩色合成圖像為3個波段,賦予紅、綠、藍三原色的合成圖像。

1∶5萬工作范圍基礎圖像製作選擇了波段7、4、2合成方案,1∶2.5萬工作范圍基礎圖像選擇了波段4、5、3合成方案,1∶1萬工作區基礎圖像選擇了波段3、2、1合成方案。選擇依據將在「數據特徵」一節中進行分析。

4.圖像增強

圖像增強的目的是為了突出相關的主題信息,提高圖像的視覺效果,使解譯分析者能更容易地識別圖像內容,從而從圖像中提取更有用的信息。圖像增強的方法很多,從其作用的空間來看可以分為光譜增強和空間增強。這兩種增強類型在整個圖像處理和信息提取過程中都很常用。對於基礎圖像的增強一般採用光譜增強,從像元的對比度及波段間的亮度等方面改善圖像的視覺效果,基本不改變目標地物的形狀、大小等特徵。

項目工作中的3種基礎圖像在生成後均採用光譜增強。根據圖像各波段的直方圖分布,分析整幅圖像中像元間對比度的差異大小,確定光譜增強的具體手段。其中1∶5萬范圍的波段7、4、2合成圖像面積大,地物種類多,信息豐富,增強過程中要求各種信息的充分顯示,因此使用直方圖均衡化的方法,理論上使圖像中的各種亮度值均衡分布。1∶2.5萬范圍的波段4、5、3合成圖像,圖像范圍相對較小,又由於地形切割較深,造成圖像上山體陰影所佔面積較大,而西南角地區比較平坦,反射率較高,像元亮度大,因此選擇線性拉伸的方法進行增強。1∶1萬范圍的快鳥衛星波段3、2、1數據合成影像中,紅尖山—姜家灣—花苗寨一帶植被覆蓋較多,造成影像上大面積綠色,使用線性拉伸的方法可以保證原始圖像的對比度不再有大改變。

圖3-3 毛坪地區圖像不同拉伸方法效果對比圖

拉伸方法應用效果以毛坪地區1∶1萬影像為例,見圖3-3。由圖中可以看出,不拉伸的圖像顯然色彩層次太少,使用均方根拉伸的圖像總體上提高了圖形的亮度,壓抑了像元間對比度的擴展,同時亮度高的地區彩色層次減少;直方圖均衡化的圖像提高了像元間的對比度,在原圖像的暗色地區使色彩層次增加,但高亮色地區由於像元頻率的增高而使色彩層次減少;線性拉伸不同程度地克服了以上幾種拉伸的弊端,使圖像色彩趨於豐富,層次趨於明顯,便於解譯者的解譯。

在解譯過程中為突出某種特徵地物也可採用其他的增強手段,這里不再贅述。

5.圖像融合

為了提高圖像清晰度,同時充分發揮多波段數據的特點,需要將高解析度的全色波段與參加彩色合成的多光譜波段進行融合處理。融合後的圖像可以發揮多光譜圖像與高解析度圖像各自的優勢,彌補不足,改善遙感圖像目標識別的准確率,提高遙感圖像的綜合分析精度。

融合方法大致可以分為彩色相關技術和數學方法兩大類。彩色相關技術包括彩色合成、彩色空間變換等,有利於保持解析度和色彩特徵,如IHS變換法。常用的融合方法有IHS變換法、PCA變換法、HPF變換法與小波變換法等。

鑒於工作目的,為了提高地面解析度和保持低解析度圖像的光譜信息,工作中選擇了IHS變換方法,即將標準的RGB圖像分離為空間信息的明度、波譜信息的色別及飽和度,而後用高解析度圖像代替明度再進行反變換的融合方法。融合後的圖像既具有較高的解析度,又具有與原圖像相同的色度與飽和度。其具體過程如圖3-4。

項目工作中所採用的ETM數據7個30m多光譜波段與15mPAN波段源於同一感測器,快鳥數據的4個2.4m多光譜波段與其0.6mPAN波段也源於同一感測器,因此數據融合過程中不存在數據配准問題,只對低解析度波段進行重采樣,並對參加融合的各波段進行直方圖匹配,再進行IHS變換和RGB變換。其中低解析度波段的重采樣使用的方法為三次卷積內插法。融合前後圖像特徵如圖3-5所示。

圖3-4 IHS變換融合流程圖

圖3-5 融合前、後圖像特徵對比示意圖

(四)圖像處理精度評價

鑲嵌校正過程中的精度評價常常使用RMS誤差(均方根)來衡量,RMS是GCP的輸入位置和逆轉換之間的距離;它是在用轉換矩陣對一個GCP做轉換時所期望輸出的坐標與實際輸出的坐標之間的偏差。

滇東北鉛鋅銀礦床遙感地質與成礦預測

式中:Ri為GCPi的RMS誤差,XRi為GCPi的X殘差,YRi為GCPi的Y殘差。

整幅圖像的總RMS誤差:

滇東北鉛鋅銀礦床遙感地質與成礦預測

式中:T為總RMS誤差。

1.1∶5萬鑲嵌精度

數據鑲嵌的誤差大小對幾何校正有很大影響,大的誤差將人為增大圖像的畸變。工作中1∶5萬工作范圍需要129-041與129-042兩景數據上下鑲嵌,按照《1/25萬遙感地質調查技術規定》(DD2001—01)對鑲嵌配准精度的規定同比計算,預設鑲嵌誤差T≤0.40。鑲嵌過程中共採集鑲嵌GCP13個,糾正模型1次,誤差見表3-6。

表3-6 1∶5萬圖像鑲嵌誤差

由表3-6中可以看出,T=0.311,小於預設值0.40,能夠滿足無縫鑲嵌的要求。

2.校正精度

(1)1∶5萬圖像校正精度

校正精度按照《1/25萬遙感地質調查技術規定》(DD2001—01)對圖像校正精度及校正點數目的同比計算,預設校正誤差T≤0.80。校正過程中在60幅1∶5萬地形圖上基本均勻地選擇203點,經誤差調整選擇有效校正GCP190個,校正多項式模型選擇二次多項式,其誤差見表3-7,由表中可以看出,T=0.794,小於預設值0.80,能夠達到規范要求。

表3-7 1∶5萬圖像校正誤差

(2)1∶1萬圖像校正精度

由於工作區只收集到1∶5萬地形圖和占很小部分的1∶2000地形地質圖,且1∶5萬地形圖年代比較久遠,因此在幾何校正過程中誤差較大。由於圖像細節清晰,不影響使用與定位。

3.融合精度

低解析度數據與高解析度數據融合的目的是為了提高解析度,為此,圖像融合前後清晰程度的改變成為融合精度評價的主要指標。圖像的清晰度是指地物的邊界或影線兩側附近灰度有明顯差異,即灰度變化率大小,它反映圖像微小細節反差變化的速率,即圖像多維方向上密度變化的速率,可用g來表示,一般來說融合前後g的變化越大則融合後圖像的清晰度越高。

滇東北鉛鋅銀礦床遙感地質與成礦預測

ETM30m多光譜波段與15m全色波段融合前後的值及快鳥數據2.4m多光譜數據與0.6m全色波段融合前後的g值對比見表3-8。由表中可以看出,融合後密度變化速率比原來提高幾十到上百倍,表明圖像融合後精度有很大提高。

表3-8 融合精度對照

三、工作區遙感數據

(一)1∶5萬工作范圍ETM數據特徵

1∶5萬工作范圍圖像行列數為9233(列)×12423(行)(插值為15m),總像元數為114701559點,由於左上角數據缺少使1140點為無效像素。

數據基本統計特徵如表3-9至表3-11,各波段直方圖見圖3-6。

表3-9 1∶5萬范圍ETM數據基本統計特徵

表3-10 1∶5萬范圍ETM數據波段間協方差矩陣

表3-11 1∶5萬范圍ETM數據波段間相關系數矩陣

從以上統計參數來看,8個波段的均值除60m解析度的波段6和15m解析度的PAN波段外,其他6個波段相差不大。8個波段的標准差從大到小排列為S5>S7>S4>S3>S6>S8>S2>S1,表明波段5的像元亮度值離散程度最大,波段1最小。對於波段間的相關系數而言(由於6波段與8波段解析度的不同而不考慮),R12、R23、R25、R35、R45、R57、R37、R27均比較大,數值在0.80以上,而R13、R24、R34、R47相對較小,數值在0.7~0.8之間,相關系數最小的為R14、R15、R17,數值在0.5~0.6之間,相關系數大小也表徵了波段間信息冗餘的多少。1∶5萬工作范圍的彩色合成方案就是根據以上的統計數據結合彩色合成波段選擇的其他原則而確定的。

直方圖是圖像范圍內每個亮度值(DN)的像元數量的統計分布,能夠直觀反映原始圖像的質量信息,如亮度值分布范圍、亮度值分布規律,也可直接大致判讀出圖像的中值等參數。從8個波段的直方圖可以看出波段4、5、7的直方圖呈雙峰表現,主峰在50~60出現,而在10~15之間又出現一個表現很窄的次峰,這是由於圖像上的陰影及水體的像元亮度值所產生的,由此大致可以計算出陰影及水體在圖像中所佔的面積,以波段5為例計算出所佔比例為6%左右。其他各波段的直方圖比較接近正態分布。

協方差矩陣反映各個波段各自亮度值取值的分散程度,同時又能反映不同波段間的相關密切程度,它是單波段圖像統計表與相關系數矩陣的合成,同時又能反向分裂。

圖3-6 1∶5萬范圍ETM各波段圖像直方圖

(二)1∶2.5萬工作范圍ETM數據特徵

1∶2.5萬工作范圍行列數為3000(列)×1860(行),總像元數為5580000點,插值後解析度為15m。數據基本統計特徵如表3-12至表3-14,各波段直方圖如圖3-7。

表3-12 1∶2.5萬范圍ETM數據基本統計特徵

表3-13 1∶2.5萬范圍ETM數據波段間協方差矩陣

表3-14 1∶2.5萬范圍ETM數據波段間相關系數矩陣

圖3-7 1∶2.5萬范圍ETM各波段圖像直方圖

從以上統計參數來看,8個波段的均值除60m解析度的波段6為110表現較大,15m解析度的PAN波段為29表現較小外,其他1、4、5三個波段數值相差不多,在50左右,2、3、7三個波段也相差不大,在37左右。8個波段的標准差從大到小排列為S5>S4>S7>S3>S8>S6>S2>S1,表明波段5的像元亮度值離散程度最大,波段1最小。對於波段間的相關系數而言(由於6波段與8波段解析度的不同而不考慮),R57、R23、R73表現最大,數值在0.9以上,R12、R13、R25、R27、R35、R45次之,數值在0.8~0.9之間,而R24、R34、R47相對較小,數值在0.7~0.8之間,相關系數最小的為R14、R15、R17,數值在0.5~0.6之間,相關系數大小也表徵了波段間信息冗餘的多少。1∶2.5萬工作范圍的彩色合成方案就是根據以上的統計數據結合彩色合成波段選擇的其他原則而決定的。

8個波段的直方圖形態大致與1∶5萬范圍一致,表現意義相同,不再贅述。

(三)1∶1萬工作范圍QB數據特徵

1∶1萬工作范圍採用高解析度的QB數據,其多光譜波段只有4個,解析度為2.4m,工作范圍圖像行列數為4168(列)×3407(行),總像元數為14200376點。多光譜數據基本統計特徵如表3-15、表3-16,各波段直方圖如圖3-8。

表3-15 1∶1萬范圍QB數據基本統計特徵

表3-16 1∶1萬范圍QB數據波段間相關系數矩陣

從以上統計可以看出,QB數據4個波段中1、2、3波段的相關系數均較大(R12=R23=0.96,R13=0.89),只有近紅外波段與其他波段的相關系數很小(R14=0.29,R24=0.37,R34=0.20),同時可以看出近紅外波段的中值與標准差也與其他波段相差很大,這是由於工作區內大面積植被所引起的。眾所周知,綠色植物的葉綠素對可見光紅波段(0.6~0.7μm)有強吸收,而葉內組織對近紅外波段(0.7~1.1μm)有高反射,因此大面積植被將會直接改變相關波段的像元亮度值的分布。在基礎圖像彩色合成波段選擇中,依據各項原則結合統計參數,選擇波段1、2、3參與合成,為使合成後圖像接近真彩色,合成方案為3(R)+2(G)+1(B)。

圖3-8 1∶1萬范圍QB各波段圖像直方圖

四、遙感信息增強與提取

為了突出地質目標,增強微弱岩石蝕變信息,在圖像處理過程中的不同階段使用了多種信息增強技術方法,主要有地表三維技術、比值運算、KL變換、空間濾波、彩色變換技術等(表3-17)。

表3-17 工作中採用的主要信息增強方法技術及用途

(一)地表三維技術

地表三維技術是利用DEM(數字高程模型)將地圖上的二維平面空間按高程的差異製作成一種地形上連續起伏變化的曲面,從而更真實地反映地表地貌的自然景觀,突出顯示特殊岩性的特殊地貌特徵。

毛坪地區地表三維影像的製作利用了1∶5萬DEM與QB3、2、1彩色合成圖像;1∶5萬DEM來源於1∶5萬地形圖,通過等高線數字化—高程賦值—DEM生成等過程實現。地表三維影像的製作主要有DEM與影像的配准及配准後的DEM與影像的復合兩個過程。

圖3-9是毛坪地區地表三維景觀局部,其中視點為(103°54བྷ″,27°27བ″),視向45°,視角60°,視域60°。

圖3-9 毛坪地區快鳥遙感影像地表三維景觀(局部)

從毛坪地區地表三維影像可以看出左側發育柱狀節理的玄武岩及右側二疊系灰岩地貌景觀。

(二)圖像比值運算

比值運算是將兩個波段中不同亮度的地物成輻射狀投射到一個曲線上,從而可非線性地誇大不同地物間的反差,它能夠壓抑影像上由於地形坡度和方向而引起的輻射量變化,減小環境條件的影響,提供任何單波段都不具有的獨特信息。其運算公式為:

滇東北鉛鋅銀礦床遙感地質與成礦預測

式中:DNm(x,y),DNn(x,y)分別是像元(x,y)在m和n波段上的亮度值;Rmn(x,y)為輸出的比值。工作中比值運算主要運用於以下兩方面。

1.計算植被覆蓋度

植被覆蓋度(f)是指某一時間某一地區內植被冠層的垂直投影面積與區域總面積之比。遙感地質解譯主要是利用地表物體的光譜反射特性的差異,提取與地質工作有關的信息,工作的特點主要針對地表岩石、構造等,當地表植被覆蓋時,對這些信息的解譯將造成阻礙。因此,了解工作區的植被覆蓋度能客觀評價該區遙感地質解譯的可解譯程度。

研究表明綠色植物在可見光紅波段(0.6~0.7μm)有強的吸收(葉綠素引起),在近紅外波段(0.7~1.1μm)有高的反射和透射(葉內組織引起)。因此,在這兩個波段使用比值運算可以充分表達它們反射率之間的差異,製作植被為高亮顯示的植被信息圖,並直接在圖像上以像元數目比值求解植被覆蓋度。

2.提取礦化蝕變信息

ETM的不同波段在地質上有不同的應用,這主要取決於各種與礦有關的蝕變礦物在不同波段存在波譜特徵上的差異。圖3-26是典型蝕變礦物的反射波譜曲線,從圖中可看出,通常所講的泥化蝕變礦物(即含有OH-、CO2-3)在2.2μm附近有明顯吸收帶,並與TM7波長范圍相吻合。而在波段5的波長范圍(1.55~1.75μm)內少有礦物的吸收譜帶,多數都表現出高反射的特點,未蝕變礦物在波段5范圍均沒有明顯的波譜特徵,表現在TM5與TM7兩個波段的相對亮度值的相對差異。因此,常常可使用波段5/7比值來突出含羥基和CO2-3類的蝕變礦物特徵。另外,由圖中可以看出三價鐵礦物在波段1具有強的吸收,而在波段3具有相對強的反射;二價鐵礦物在波段4具有強的吸收,而在波段5相對具有反射特徵,因此也常用波段5/4、3/1比值來突出鐵類礦物蝕變特徵。比值後的圖像上欲突出的蝕變特徵常以高亮值顯示而被提取出來。

(三)KL變換

KL變換又稱為主成分分析,是在統計特徵基礎上的多維(如多波段)正交線性變換。多波段圖像通過這種變換後產生一組新的組分圖像,把原來多個波段中的信息進行集中和重組,並使新組分圖像之間互不相關。其運算公式為:

滇東北鉛鋅銀礦床遙感地質與成礦預測

其中,X為原圖像p個波段的像元值向量,Y為變換後的q個組分的像元值向量,q≤

,T為變換矩陣。

KL變換要求Y的分量Yj與Yk相互獨立,且若有j<k,則Yj的方差小於Yk的方差,所以必須有:

滇東北鉛鋅銀礦床遙感地質與成礦預測

又因為:

所以:

即把矩陣D(X)變為對角矩陣Λ,對角線元素λ1、λ2…λp是D(X)的特徵值,也分別是Y1、Y2…Yp的方差。

KL變換後的新組分圖像中,一般第一組分具有大量的信息,但它包含了地形、植被等因素,對地質體的區分而言就成為干擾因素;其他組分雖然具有小的方差,包含的信息量少,但它可能正好突出了區分某些地質體的信息。因此,當需要對諸多信息進行綜合時,往往使用KL變換後的第一組分,當要求某種特徵信息時就選擇相關的其他主組分。如圖3-10,在B7單波段上玄武岩和火山碎屑岩界線顯示隱約(或不顯示),而在KL變換(參與波段B1、B2、B3、B4、B5、B6、B7)後的PC3上,界線顯示明顯。

圖3-10 KL變換前後岩性邊界對比影像

此外,KL變換也是提取與鐵化和泥化有關蝕變的遙感信息的重要方法。通過對KL變換後的特徵矩陣進行分析,選擇富集特徵信息的主組分,對蝕變信息的提取又很大的幫助。在後面信息提取過程中已經使用。

(四)空間信息增強

空間信息增強是指通過改變圖像空間特徵或頻率來增強圖像上信息的手段,即改變圖像的「粗糙」或「平滑」程度來增強特徵信息的方法。工作中使用了方向濾波和平均值濾波。

1.方向濾波

方向濾波是梯度法邊緣增強的一種,它通過指定的8個方向的濾波模塊對圖像按方向進行邊緣增強。工作中主要使用在線性體的解譯和統計中,濾波後的圖像突出顯示了某個方向的線性體特徵,同時對與該方向正交的線性體進行模糊。如圖3-11所示,7波段的圖像在分別使用 個方向模板濾波後,分別突出顯示了45°方向和135°方向的線性體。

圖3-11 方向濾波前後圖像對比

2.平滑濾波

當需要去除圖像上的雜訊時,往往使用平滑濾波或低通濾波,加強圖像中的低頻成分,減弱圖像的高頻成分,使圖像由「粗糙」變得「光滑」。均值濾波就是一種典型的平滑濾波方法,即用局部范圍內臨域像元亮度均值代替中心原像元亮度值。工作中平滑濾波主要使用在遙感蝕變信息提取後,信息雜訊的去除。如圖3-12所示,提取的銹水河鉛鋅礦異常在平滑濾波後,雜亂細小的信息斑點被去除,信息成「塊」成「帶」出現,方便了對異常分布的分析。

圖3-12 平滑濾波前後PCT分級效果對比

(五)彩色變換技術

彩色變換技術是指將彩色圖像在不同的彩色坐標系統之間的變換,主要應用在不同遙感器的數據或不同性質的數據融合後彩色合成圖像的產生。在圖像融合上常使用IHS變換,其簡式如下:

滇東北鉛鋅銀礦床遙感地質與成礦預測

變換後RGB混色系統分離為代表空間信息的明度(I)和代表波譜信息的色別(H)、飽和度(S)。從公式可以看出,明度(I)是3個波段的平均亮度,融合時使用直方圖匹配後的高解析度波段代替I,與原來的H、S一起進行IHS變換的反變換,重新變換到RGB空間,這樣圖像既保證了高解析度數據的參與,提高地面分辨能力,又保持了原來多光譜波段的光譜特徵。其融合效果參見圖3-5。

另外,項目工作中較常用的是RGB彩色合成,當圖像的飽和度缺乏時,也通過IHS變換的方法,專門對變換後的飽和度分量(S)進行調整,反變換後的圖像可解譯性會明顯提高。

㈤ Arcgis中 為什麼要對配准後的數據進行重采樣

因為經過配準的不同柵格的像元並不總是對齊的,因為像元大小可能不同,或者像元邊界之間會有相對的偏移。當進行柵格合並時,空間分析必須為每一個輸出像元指定對應的輸入柵格的像元,這個過程就叫做重采樣。
重采樣的方法有最近鄰發、search法、雙線性內插法和立方卷積法。前兩者適用於離散數據,後兩者適用於連續數據。

㈥ 簡述重采樣的原理

重采樣:就是根據一類象元的信息內插出另一類象元信息的過程。在遙感中,重采樣是從高解析度遙感影像中提取出低解析度影像的過程。常用的重采樣方法有最鄰近內插法(nearest neighbor interpolation)、雙線性內插法(bilinear interpolation)和三次卷積法內插(cubic convolution interpolation)。其中,最鄰近內插法最為簡單,計算速度快,但是視覺效應差;雙線性插值會使圖像輪廓模糊;三次卷積法產生的圖像較平滑,有好的視覺效果,但計算量大,較費時。

㈦ 什麼是重采樣技術

重采樣:就是根據一類象元的信息內插出另一類象元信息的過程。在遙感中,重采樣是從高解析度遙感影像中提取出低解析度影像的過程。
常用的重采樣方法有最鄰近內插法(nearest neighbor interpolation)、雙線性內插法(bilinear interpolation)和三次卷積法內插(cubic convolution interpolation)。其中,最鄰近內插法最為簡單,計算速度快,但是視覺效應差;雙線性插值會使圖像輪廓模糊;三次卷積法產生的圖像較平滑,有好的視覺效果,但計算量大,較費時。

㈧ boosting和bootstrap區別

bootstrap、boosting是機器學習中幾種常用的重采樣方法。其中bootstrap重采樣方法主要用於統計量的估計,boosting方法則主要用於多個子分類器的組合。bootstrap:估計統計量的重采樣方法(推薦學習:Python視頻教程)
bootstrap方法是從大小為n的原始訓練數據集DD中隨機選擇n個樣本點組成一個新的訓練集,這個選擇過程獨立重復B次,然後用這B個數據集對模型統計量進行估計(如均值、方差等)。由於原始數據集的大小就是n,所以這B個新的訓練集中不可避免的會存在重復的樣本。
統計量的估計值定義為獨立的B個訓練集上的估計值θbθb的平均:
boosting:
boosting依次訓練k個子分類器,最終的分類結果由這些子分類器投票決定。
首先從大小為n的原始訓練數據集中隨機選取n1n1個樣本訓練出第一個分類器,記為C1C1,然後構造第二個分類器C2C2的訓練集D2D2,要求:D2D2中一半樣本能被C1C1正確分類,而另一半樣本被C1C1錯分。
接著繼續構造第三個分類器C3C3的訓練集D3D3,要求:C1C1、C2C2對D3D3中樣本的分類結果不同。剩餘的子分類器按照類似的思路進行訓練。
boosting構造新訓練集的主要原則是使用最富信息的樣本。
更多Python相關技術文章,請訪問Python教程欄目進行學習!以上就是小編分享的關於boosting和bootstrap區別的詳細內容希望對大家有所幫助,更多有關python教程請關注環球青藤其它相關文章!

㈨ 常用的數字圖像重采樣方法有那幾種

最近鄰域
二次線性
二乘線性
二次立方
B樣條
lanzcos
hermite

閱讀全文

與常用的數字重采樣方法相關的資料

熱點內容
馴服蜥蜴最簡單的方法 瀏覽:700
淘寶鑽展怎麼操作干貨方法推薦 瀏覽:70
臨床上最廣泛的研究方法 瀏覽:465
避孕方法有哪些怎麼上環 瀏覽:866
電熱板安裝方法 瀏覽:168
中醫治療絲狀疣的方法 瀏覽:708
正確梳頭的方法免費學 瀏覽:87
斜齒輪的計算方法 瀏覽:329
如何寫好行草方法 瀏覽:493
食用方法可以分為什麼和什麼 瀏覽:163
老伴按摩床使用方法 瀏覽:851
原始蜂蜜怎麼食用方法 瀏覽:16
研究方法名詞解釋333 瀏覽:503
腿部伸展機使用方法 瀏覽:107
健腹輪訓練正確方法 瀏覽:780
qq同步助手簡訊功能在哪裡設置方法 瀏覽:926
風險識別分析方法培訓 瀏覽:927
用什麼方法識別身上的靈 瀏覽:734
中周的安裝方法 瀏覽:636
嗓子腫了怎麼辦最有效的方法 瀏覽:218