1. 重、磁對應分析技術
利用重、磁異常對應分析方法,獲得重、磁異常對應分析結果,推斷對應分析結果中的低值區對應沉積地層可能性最大,是中生界分布的可能范圍。該方法結果經綜合地震資料對比分析,效果良好。
(一)方法原理
一個均勻磁化且密度均勻的物體,其磁位U和引力位V的解析式間存在以下關系:
海域油氣資源戰略調查與選區
從式中可以看出,磁位和引力位的方向導數存在簡單的線性關系,可以推出化極磁異常與重力異常的垂向一階導數亦存在此簡單的線性關系。
根據上述原理,將化極磁力異常和基底布格重力異常(為自由空間重力數據經過海水校正並消除新生界影響後得到的重力數據)垂向一階導數進行歸一化處理,得出重、磁異常對應分析結果。在重磁異常對應分析結果中,低值區表現為重力低、磁力低,對應沉積地層可能性最大;高值區表現為重力高、磁力高,對應高磁性火成岩或基底隆起的可能性最大。據此結果,可以有效地綜合分析研究區內的重、磁異常特徵,並與其所反映的地質問題緊密結合。
(二)應用與效果
利用南海東北部衛星測高重力異常及航空磁力數據進行重、磁對應分析,首先對衛星重力數據進行海水校正並消除新生界影響,獲得基底布格重力異常並對其作垂向一階導數處理(圖5-33),其次對航磁數據進行化極處理(圖5-34),最後將基底布格重力異常與化極磁力異常進行歸一化處理,獲得重、磁對應分析結果圖(圖4-70)。
圖5-33 基底布格重力異常垂向一階導數圖(等值線間距為0.1mGal/km)
通過定性分析重磁平面異常特徵、重磁數據後續處理圖件、重磁異常地質成因以及結合分析地震資料顯示的地層結構,認為南海東北部海域中部北東向的基底布格重力低、化極磁力低區域,是我們探討中生界分布的重點區域,大致呈兩個帶(圖4-70):北帶位於珠江口盆地北緣的北東向條帶;南帶位於珠江口盆地的白雲凹陷經潮汕坳陷、台西南盆地北部,直至台灣陸區西部的北東向條帶,圈劃區內有眾多地震剖面不同程度地揭示了中生界的存留。
圖5-34 化極磁力異常等值線圖(等值線間距為10nT)
2. 自適應重磁對應分析法
從前面的分析得知,重磁對應分析的根本目的在於了解重磁異常是否相關和是否同源,因此,主要應考慮重磁異常主體或異常源上方所在位置的對應分析參數,至於遠離異常中心的地方,則沒有必要再考慮對應分析參數的數值變化。傳統重磁對應分析數據處理方法採用正方形窗口逐點滑動計算相關系數,在遠離重磁異常中心或非重磁異常主體的地方,也求出了相關系數數值,而這些地方的數值沒有實際意義,且給解釋造成干擾。為了解決該問題,提出了自適應重磁對應分析方法。
所謂自適應重磁對應分析數據處理方法,就是根據異常的寬度和周圍的干擾,自動調節重磁對應分析參數計算窗口大小的方法,其具體工作流程是:首先找到異常中心的位置;然後向四周搜索,尋找異常的邊界,確定異常范圍;接下來,再根據異常范圍和事先給定的對計算窗口大小的要求,確定自適應重磁對應分析的計算窗口大小,並計算異常中心處的重磁對應分析的有關參數。
自適應重磁對應分析數據處理方法,通常應分別計算磁異常或重力異常中心處的重磁對應分析的有關參數。由於對重磁異常的處理方法相同,下面以磁△T化極異常為例,介紹自適應重磁對應分析的計算過程。
1.尋找磁異常中心的位置
利用一個正方形滑動窗口,逐點滑動尋找異常中心的位置。
假設某點的位置為(i,j),當該點處磁△T化極異常的數值△T⊥(i,j)滿足下列條件時,則該點就是一個磁△T化極異常中心的位置:
晉冀北緣—遼西鐵礦重要成礦帶找礦靶區航磁優選
對於負異常,其中心的位置就是異常極小值點所在位置,其判斷標志是窗口中心點的數值不大於周圍點的數值。
2.尋找異常的邊界
就重磁對應分析來說,所關心的是異常的主體部分。根據重磁異常特徵,其主體部分的數值變化具有單調性(正異常為單調減小,負異常為單調增加)。因此,通過分析異常數值變化的單調性是否改變,即可找到異常主體的邊界。具體講,在找到磁△T化極異常中心的位置後,便以此為出發點,沿上下左右四個方向逐點進行搜索,尋找到異常數值變化單調性的改變點,即為異常主體的邊界點。
假設點(i,j)為磁△T化極正異常中心的位置,在向左搜索的過程中,當某點(i-Dl,j)處磁△T 化極異常的數值△T⊥(i-Dl,j)滿足條件△T⊥(i-Dl,j)≤△T⊥(i-Dl-1,j)時,則該點就是該磁△T化極正異常的左側邊界。同理,可以找到右側邊界(i+Dr,j)、下側邊界(i,j-Dd)和上側邊界(i,j+Du)。
對於負異常,只要將其判別條件作相應改變即可,如△T⊥(i-Dr,j)≥△T⊥(i-Dr-l,j)。
3.確定重磁對應分析參數計算窗口
重磁對應分析中影響計算結果質量的一個重要因素是計算窗口的大小:一方面,窗口尺寸要盡量大,以便盡可能包含足夠的異常變化信息,如果窗口太小,沒有包含足夠的異常信息,則會因為信噪比低而造成所得的相關系數不準確;另一方面,窗口的尺寸要盡量小,以避開相鄰異常的影響和減少深源異常的干擾,若窗口太大則包含其他異常的信息較多,使得相關系數的誤差變大。因此,在開展重磁對應分析之前,應根據研究目標的大小和干擾的強弱,合理確定重磁對應分析參數計算窗口所允許的最小半邊長Ln和最大半邊長Lx。
對於某磁△T化極異常,如果其某方向的寬度小於Ln,則認為該異常屬於干擾,不予計數重磁對應分析參數;如果其任意方向的寬度都大於Ln,則認為該異常屬於有效異常,應計算重磁對應分析參數,矩形計算窗口的邊長確定為Dl+Dr+1和Dd+Du+1,其中Dl、Dr、Dd和Du應小於或等於Lx。
4.計算重磁對應分析參數
根據第3步確定的計算窗口,採用式(3—3)計算相關系數R,並將其賦予磁△T化極正異常中心的位置(i,j)處。
5.判斷重磁異常相關性
重磁異常相關性的判別方法,是根據計算重磁異常相關系數時的自由度n,查找給定顯著性水平下的最小相關系數Rα,如果|R|大於等於Rα,則認為顯著性相關,否則認為不相關。為了便於表達,定義相關程度p為
晉冀北緣—遼西鐵礦重要成礦帶找礦靶區航磁優選
式中:p為相關程度;R為計算的重磁異常相關系數;Rα為顯著性水平α時的最小相關系數(表3-1)。
表3-1 相關系數顯著性檢驗表
(據劉承柞等,1981)
判別重磁異常是否相關的條件為:
(1)p≥1,表示重力異常和磁異常屬於顯著性正相關;
(2)p≤-1,表示重力異常和磁異常屬於顯著性負相關;
(3)-1<p<1,表示重力異常和磁異常屬於顯著性不相關。
3. 大數據分析方法有哪些
1、因子分析方法
所謂因子分析是指研究從變數群中提取共性因子的統計技術。因子分析就是從大量的數據中尋找內在的聯系,減少決策的困難。因子分析的方法約有10多種,如影像分析法,重心法、最大似然法、最小平方法、α抽因法、拉奧典型抽因法等等。
2、回歸分析方法
回歸分析方法就是指研究一個隨機變數Y對另一個(X)或一組變數的相依關系的統計分析方法。回歸分析是確定兩種或兩種以上變數間相互依賴的定量關系的一種統計分析方法。回歸分析方法運用十分廣泛,回歸分析按照涉及的自變數的多少,可分為一元回歸分析和多元回歸分析;按照自變數和因變數之間的關系類型,可分為線性回歸分析和非線性回歸分析。
3、相關分析方法
相關分析是研究現象之間是否存在某種依存關系,並對具體有依存關系的現象探討其相關方向以及相關程度。相關關系是一種非確定性的關系。
4、聚類分析方法
聚類分析指將物理或抽象對象的集合分組成為由類似的對象組成的多個類的分析過程。聚類是將數據分類到不同的類或者簇這樣的一個過程,所以同一個簇中的對象有很大的相似性,而不同簇間的對象有很大的相異性。聚類分析是一種探索性的分析,在分類的過程中,不需要事先給出一個分類的標准,聚類分析能夠從樣本數據出發,自動進行分類。
5、方差分析方法
方差數據方法就是用於兩個及兩個以上樣本均數差別的顯著性檢驗。由於各種因素的影響,研究所得的數據呈現波動狀。方差分析是從觀測變數的方差入手,研究諸多控制變數中哪些變數是對觀測變數有顯著影響的變數。
6、對應分析方法
對應分析是通過分析由定性變數構成的交互匯總表來揭示變數間的聯系。可以揭示同一變數的各個類別之間的差異,以及不同變數各個類別之間的對應關系。對應分析的基本思想是將一個聯列表的行和列中各元素的比例結構以點的形式在較低維的空間中表示出來。
4. spss分析方法-對應分析(轉載)
對應分析也稱關聯分析、R-Q型因子分析,通過分析由定性變數構成的交互匯總表來揭示變數間的聯系。對應分析法是在R型和Q型因子分析的基礎上發展起來的一種多元統計分析方法。 下面我們主要從下面四個方面來解說:
[if !supportLineBreakNewLine]
[endif]
實際應用
理論思想
建立模型
[if !supportLineBreakNewLine]
[endif]
分析結果
[if !supportLineBreakNewLine]
[endif]
一、實際應用
對應分析法 可以揭示同一變數的各個類別之間的差異,以及不同變數各個類別之間的對應關系 。當所涉及的 分類變數類別較多或者分類變數的個數較多 的時候,我們就需要用到對應分析。主要應用在市場細分、產品定位、地質研究以及計算機工程等領域中。原因在於,它是一種視覺化的數據分析方法,它能夠將幾組看不出任何聯系的數據,通過視覺上可以接受的定點陣圖展現出來。
[if !supportLineBreakNewLine]
[endif]
二、理論思想
由於指標型的因子分析和樣品型的因子分析反映的是一個整體的不同側面,因此它們之間一定存在內在的聯系。如果能夠有效利用這種內在聯系所提供的信息,對更全面合理地分析數據具有很大的幫助。在因子分析中,如果研究的對象是樣品,可採用Q型因子分析;如果研究的對象是變數,則需採用R型因子分析。但是,因為這兩種因子分析方法必須分別對樣品和變數進行處理,所以這兩種分析方法往往存在著相互對立的關系,為我們發現和尋找它們的內在聯系製造了困難。而對應分析通過一個過渡矩陣Z將兩者有機地結合了起來。 對應分析的基本思想是將一個聯列表的行和列中各元素的比例結構,以點的形式在較低維的空間中表示出來。 首先,給出指標變數點的協差陣A=Z,Z和樣品點的協差陣B=ZZ』,由於兩者有相同的非零特徵根,所以可以很方便地藉助指標型因子分析而得到樣品型因子分析的結論。如果對每組變數選擇前兩列因子載荷,那麼兩組變數就可以畫出兩個因子載荷的散點圖。由於這兩個圖所表示的載荷可以配對,於是就可以把這兩個因子載荷的兩個散點圖畫到同一張圖中,並以此來直觀地顯示各行變數和各列變數之間的關系。
[if !supportLineBreakNewLine]
[endif]
三、建立模型
[if !supportLineBreakNewLine]
[endif]
數據條件:
[if !supportLists]§ [endif]不能用於相關關系的假設檢驗
對應分析案例:
[if !supportLineBreakNewLine]
[endif]
題目:費希爾在1940年首次介紹列聯表資料時使用的是一份關於眼睛顏色與頭發顏色的調查研究數據。該研究數據包含了5387名蘇格蘭北部的凱斯納斯郡的小學生的眼睛顏色與頭發顏色,如下表所示。試用對應分析方法研究眼睛顏色與頭發顏色之間的對應關系。
一、數據輸入
二、操作步驟 1、進入SPSS,打開相關數據文件,因為本例中是以頻數格式錄入數據的(相同取值的觀測只錄入一次,另加一個頻數變數用於記錄該數值共出現了多少次),所以進入SPSS後,首先要對數據進行預處理,以頻數變數進行加權,從而將數據指定為該種格式。選擇「數據」|「個案加權」命令。首先在「個案加權」對話框的右側選中「個案加權系數」單選按鈕,然後在左側的列表框中選擇「頻數」進入「頻率變數」列表框。單擊「確定」按鈕,完成數據預處理。
2、選擇「分析」|「降維」|「對應分析」命令。先定義行變數及其取值范圍,即在「對應分析」對話框的左側選擇「眼睛顏色」進入右側的「行」列表框,然後單擊下方的「定義范圍」按鈕,在「最小值」中輸入「1」,「最大值」輸入「4」,單擊「更新」按鈕,最後單擊「繼續」按鈕返回「對應分析」對話框。利用同樣的方法定義列變數及其取值范圍。列變數選擇「頭發顏色」,設置「最小值」為「1」,「最大值」為「5」。
3、其餘設置採用系統默認值即可。單擊「確定」按鈕,等待輸出結果。
[if !supportLineBreakNewLine]
[endif]
四、結果分析
1、對應分析表下表是按照原始數據整理而成的行列表,反映的是眼睛顏色和頭發顏色不同組合下的實際樣本數。
2、對應分析摘要在下表中,第一列是維度,其個數等於變數的最小分類數減1,本例中的最小分類數是眼睛顏色的種類(為4類),所以維度是3;第2~5列分別表示奇異值、慣量、卡方值和顯著性;隨後的列給出了各個維度所能解釋的兩個變數關系的百分比,容易發現,前兩個維度就累計解釋了99.6%的信息。
3
、對應分析坐標值及貢獻值下表給出了行變數(眼睛顏色)和列變數(頭發顏色)在各個維度上的坐標值,以及各個類別對各維數的貢獻值。以本表上部分概述行點為例,對表中各列含義做一下簡要說明。 「 數量」列表示各種類別的構成比 ,如深色眼睛的人占總數的構成比例是0.244。 「維得分」列表示各類別在相關維數上的評分 ,首先給出的是默認提取的兩個維數上各類別的因子負荷值。 「慣量」列給出了總慣量(0.23)在行變數中的分解情況,數值越大表示該類別對慣量的貢獻越大。「點對維的慣量」表示在各個維數上,信息量在各類別間的分解狀況 ,本例中第一維數主要被深色、藍色、淺色所攜帶,也就是說這3個類別在第一維數上的區分比較好,第二維數主要被深色、棕色、藍色所攜帶,說明這3個類別在第二維數上的區分比較好。 「維對點的慣量」表示各類別的信息在各維數上的分布比例 ,本例中深色、藍色、淺色都主要分布在第一維數上,棕色主要分在第二維數上。 「總計」表示各維數的信息比例之和 ,可見紅色這一類別在前兩位中只提出了80.3%的信息,效果最差。
4、對應分析圖下表是對應分析圖,是對應分析中最主要的結果,從圖中可以看出兩個變數不同類別之間的關系。我們可以從兩個方面來閱讀本圖:一方面可以分別從橫坐標和縱坐標方向考察變數不同類別之間的稀疏,如果靠得近,則說明在該維數上這些類別之間差別不大;另一方面可以把平面劃分為以(0,0)為原點的4個象限,位於相同象限的不同變數的分類點之間的關聯較強。容易發現本例中:棕色頭發和棕色眼睛,深色頭發、黑色頭發和深色眼睛,金色頭發和藍色眼睛、淺色眼睛存在著比較強的聯系。
分析結論: 通過分析,我們可以知道:由結果分析1可知,眼睛顏色和頭發顏色在不同組合下的實際樣本數。由結果分析2可知,提取的前兩個維數累計就已解釋了99.6%的信息。由結果分析3可知,眼睛顏色和頭發顏色在各個維數上的坐標值,以及各個類別對各個維數的貢獻值。由結果分析4可知,棕色頭發和棕色眼睛,深色頭發、黑色頭發和深色眼睛,金色頭發和藍色眼睛、淺色眼睛存在著比較強的聯系。
(獲取更多知識,前往 gz 號程式解說)
原文來自 https://mp.weixin.qq.com/s/Bt4IzRvcDRAtHKUtmuO57w
5. 數據分析算研究方法嗎
對於數據分析師來說,懂得更多的數據分析方法是很有必要的,而且數據分析師工作工程中會根據變數的不同採用不同的數據分析方法,一般常用的數據分析方法包括聚類分析、因子分析、相關分析、對應分析、回歸分析、方差分析等,我們要學會使用這些數據分析之前一定要懂得這些方法的定義是什麼。
第一先說因子分析方法,所謂因子分析是指研究從變數群中提取共性因子的統計技術。因子分析就是從大量的數據中尋找內在的聯系,減少決策的困難。因子分析的方法約有10多種,如影像分析法,重心法、最大似然法、最小平方法、α抽因法、拉奧典型抽因法等等。
第二說一下回歸分析方法。回歸分析方法就是指研究一個隨機變數Y對另一個(X)或一組變數的相依關系的統計分析方法。回歸分析是確定兩種或兩種以上變數間相互依賴的定量關系的一種統計分析方法。回歸分析方法運用十分廣泛,回歸分析按照涉及的自變數的多少,可分為一元回歸分析和多元回歸分析;按照自變數和因變數之間的關系類型,可分為線性回歸分析和非線性回歸分析。
接著說相關分析方法,相關分析是研究現象之間是否存在某種依存關系,並對具體有依存關系的現象探討其相關方向以及相關程度。相關關系是一種非確定性的關系。
然後說聚類分析方法。聚類分析指將物理或抽象對象的集合分組成為由類似的對象組成的多個類的分析過程。聚類是將數據分類到不同的類或者簇這樣的一個過程,所以同一個簇中的對象有很大的相似性,而不同簇間的對象有很大的相異性。聚類分析是一種探索性的分析,在分類的過程中,不需要事先給出一個分類的標准,聚類分析能夠從樣本數據出發,自動進行分類。
接著說方差分析方法。方差數據方法就是用於兩個及兩個以上樣本均數差別的顯著性檢驗。由於各種因素的影響,研究所得的數據呈現波動狀。方差分析是從觀測變數的方差入手,研究諸多控制變數中哪些變數是對觀測變數有顯著影響的變數。
最後說一下對應分析方法。對應分析是通過分析由定性變數構成的交互匯總表來揭示變數間的聯系。可以揭示同一變數的各個類別之間的差異,以及不同變數各個類別之間的對應關系。對應分析的基本思想是將一個聯列表的行和列中各元素的比例結構以點的形式在較低維的空間中表示出來。