A. 地質因子分析
礦液的運移總是從高壓向低壓方向流動,溫度一般也是由高變低。礦液自深部上升時,由於溫度、應力逐漸降低和成礦物質不斷地析出,溶液的成分和濃度也在不斷變化。因此,沿著礦液通路各地段形成的礦化類型與礦化強度也是不斷變化的。通過R型聚類分析,求得礦化指示元素之間的關系。結合礦化原生帶分帶性將成礦元素分組,分別求出各組元素礦化地質因子F1、F2、F3、F4。選其中方差貢獻最大的地質因子,研究礦化過程中不同溫度、壓力環境,從而作為研究礦液運移特徵的基本指標。
因子得分是地質因子在樣品上的取值。因子得分絕對值較高,該地質因子代表的地質條件(如成礦溫度、壓力環境)在樣品上反映就越明顯。為此,將每個樣品的因子得分投到礦區各中段取樣位置圖上,得到礦化組合帶,即可藉此確定礦液入口、礦液運移的具體路徑及流向。
圖3.51 長鬧塘斷裂縱剖面F1、F2因子得分分布圖
(據江祝偉等)
江祝偉等研究認為個舊松樹腳礦田6號東錫礦床長鬧塘斷裂,縱剖面F1與F2因子得分分布圖(圖3.51)顯示礦液在導礦斷裂中的主要運移通道具有定位性與定向性,高值區都在y坐標3200~3400線之間。F1極大值處於920m標高,靠近3200線,F2極大值位於720m高程,靠近3400線。二者形成由下而上、由北東向南西斜向錯位。代表Sn、Cu礦化的較高溫壓條件下的礦化因子與代表鉛、鋅礦化的較低溫壓條件下的礦化因子的礦化元素組合帶分帶明顯,反映礦液運移的主要通道在y坐標3400~3200線之間,且沿長鬧塘斷裂,由深部向淺部,從北東向南西運移。兩個因子得分極大值較小,分別為—18.5與+10,表明兩種不同的礦化元素組合帶在長鬧塘斷裂中相對較弱;加之極大值錯距大,說明礦化元素組合帶分帶寬,反映礦液在導礦構造中流速較大。
圖3.52 6號東礦床不同中段平面F1與F2因子得分分布圖
(據江祝偉等)
1—斷層;2—礦體;3—F1因子得分等值線;4—F2因子得分等值線
不同方向剖面和不同標高中段F1、F2因子得分分布不同(圖3.52),顯示礦床范圍內礦液主要為由下而上的運移特徵,並有一些主要的礦液入口。礦液運移主要通道及運移方向主要受2號斷裂控制。3200線東西向剖面中995m中段與1045中段較低溫壓條件下的礦化元素組合帶高值區相對較高溫壓條件下礦化元素組合帶高值區由6400線向西錯位,表明礦液自東向西流動;950中段x=6400,y=3200處為礦液主要入口處,礦液從該處進入礦床後,向西注入近東西向容礦構造;870m與920m中段,兩類礦化元素組合帶高值區在平面上局部錯位,870m中較低溫壓條件下,礦化元素組合帶相對較高溫壓條件下的組合帶由南東向北西錯位,而920m中段前者都相對後者由北西向南東錯位,反映礦液運移路徑的復雜性和迴流特徵。
B. 因子分析的基本步驟
因子分析是指研究從變數群中提取共性因子的統計技術。最早由英國心理學家C.E.斯皮爾曼提出。他發現學生的各科成績之間存在著一定的相關性,一科成績好的學生,往往其他各科成績也比較好,從而推想是否存在某些潛在的共性因子,或稱某些一般智力條件影響著學生的學習成績。因子分析可在許多變數中找出隱藏的具有代表性的因子。將相同本質的變數歸入一個因子,可減少變數的數目,還可檢驗變數間關系的假設。因子分析的前提條件
由於因子分析的主要任務之一是對原有變數進行濃縮,即將原有變數中的信息重疊部分提取和綜合成因子,進而最終實現減少變數個數的目的。因此它要求原有變數之間應存在較強的相關關系。否則,如果原有變數相互獨立,相關程度很低,不存在信息重疊,它們不可能有共同因子,那麼也就無法將其綜合和濃縮,也就無需進行因子分析。本步驟正是希望通過各種方法分析原有變數是否存在相關關系,是否適合進行因子分析。SPSS提供了四個統計量可幫助判斷觀測數據是否適合作因子分析:
(1)計算相關系數矩陣Correlation Matrix
在進行提取因子等分析步驟之前,應對相關矩陣進行檢驗,如果相關矩陣中的大部分相關系數小於0.3,則不適合作因子分析;當原始變數個數較多時,所輸出的相關系數矩陣特別大,觀察起來不是很方便,所以一般不會採用此方法或即使採用了此方法,也不方便在結果匯報中給出原始分析報表。
(2)計算反映象相關矩陣Anti-image correlation matrix
反映象矩陣重要包括負的協方差和負的偏相關系數。偏相關系數是在控制了其他變數對兩變數影響的條件下計算出來的凈相關系數。如果原有變數之間確實存在較強的相互重疊以及傳遞影響,也就是說,如果原有變數中確實能夠提取出公共因子,那麼在控制了這些影響後的偏相關系數必然很小。觀察反映象相關矩陣,如果反映象相關矩陣中除主對角元素外,其他大多數元素的絕對值均小,對角線上元素的值越接近1,則說明這些變數的相關性較強,適合進行因子分析。與方法(1)中最後所述理由相同,一般少採用此方法
(3)巴特利特球度檢驗Bartlett test of sphericity
Bartlett球體檢驗的目的是檢驗相關矩陣是否是單位矩陣(identity matrix),如果是單位矩陣,則認為因子模型不合適。Bartlett球體檢驗的虛無假設為相關矩陣是單位陣,如果不能拒絕該假設的話,就表明數據不適合用於因子分析。一般說來,顯著水平值越小(<0.05)表明原始變數之間越可能存在有意義的關系,如果顯著性水平很大(如0.10以上)可能表明數據不適宜於因子分析。
(4)KMO(Kaiser-Meyer-OklinMeasure of Smapling Adequacy)
KMO是Kaiser-Meyer-Olkin的取樣適當性量數。KMO測度的值越高(接近1.0時),表明變數間的共同因子越多,研究數據適合用因子分析。通常按以下標准解釋該指標值的大小:KMO值達到0.9以上為非常好,0.8~0.9為好,0.7~0.8為一般,0.6~0.7為差,0.5~0.6為很差。如果KMO測度的值低於0.5時,表明樣本偏小,需要擴大樣本。
C. 因子分析概念
在各個領域的科學研究中,往往需要對反映事物的多個變數進行大量的觀測並收集大量數據,以便分析尋找規律。多變數大樣本無疑會為科學研究提供豐富的信息,但也在一定程度上增加了數據採集的工作量,更重要的是在大多數情況下,許多變數之間可能存在的相關性增加了問題分析的復雜性,同時對分析帶來不便。如果分別分析每個指標,分析又可能是孤立的,而不是綜合的。盲目減少指標會損失很多信息,產生錯誤的結論。因此需要找到一個合理的方法,在減少分析指標的同時,盡量減少原指標包含信息的損失,對所收集的資料作全面的分析。由於各變數間存在一定的相關關系,因此用較少的指標分別綜合存在於各變數中的各類信息,這少數幾個綜合指標彼此不相關,即所代表的信息是不重疊的,通常稱為因子,因子分析法因此得名。因此,因子分析是將多個實測變數轉換為少數幾個不相關的綜合指標的多元統計分析方法(於志鈞等,1984;趙旭東,1992;陸明德,1991)。
因子分析方法由Spearman在19世紀初研究心理學問題時提出,1957年由Krumbein引入地質學,後來Imbrie對因子分析在地質學中的應用和發展做了大量工作。
因子分析可以從以下幾個方面為地質研究提供幫助:①壓縮原始數據。因子分析為眾多復雜的地質數據精簡提供了一種數學演算法,它能在數量上大大精簡原始數據但又不損失數據中包含的成因信息,這樣就有利於地質人員進行綜合分析。②指示成因推理方向。因子分析能夠把龐雜紛亂的原始數據按成因上的聯系進行歸納、整理、精煉和分類,理出幾條客觀的成因線索,為地質人員提供邏輯推理方向,啟發思考相應的成因結論。③分解疊加的地質過程。現實中觀測到的地質現象往往是多種成因過程疊加的產物,因子分析提供了一個分解疊加過程而識別每個單一地質過程的手段。
鑒於上述原因,因子分析在地學領域的應用十分廣泛,已有效地應用於沉積盆地蝕源區的研究、沉積物的粒度分析、沉積相研究、地層分析、古環境與古生態的研究、石油及天然氣成因研究、油田水化學研究、有機地球化學研究及石油、天然氣化探資料分析等各個方面(曾濺輝等,2002;張俊,2005;陳科貴等,2006)。
D. 什麼是因子分析法
因子分析法是指研究從變數群中提取共性因子的統計技術。因子分析可在許多變數中找出隱藏的具有代表性的因子。將相同本質的變數歸入一個因子,可減少變數的數目,還可檢驗變數間關系的假設。
在市場調研中,研究人員關心的是一些研究指標的集成或者組合,這些概念通常是通過等級評分問題來測量的,如利用李克特量表取得的變數。每一個指標的集合(或一組相關聯的指標)就是一個因子,指標概念等級得分就是因子得分。
因子分析在市場調研中有著廣泛的應用,主要包括:
(1)消費者習慣和態度研究(U&A)
(2) 品牌形象和特性研究
(3)服務質量調查
(4) 個性測試
(5)形象調查
(6) 市場劃分識別
(7)顧客、產品和行為分類
在實際應用中,通過因子得分可以得出不同因子的重要性指標,而管理者則可根據這些指標的重要性來決定首先要解決的市場問題或產品問題。
E. 怎樣用spss做因子分析
可以使用在線spss平台SPSSAU進行分析,因子分析用於探索定量數據可以濃縮為幾個方面(因子),每個方面(因子)和題項對應關系。因子分析步驟:
1、選擇進階方法>>因子
3、點擊開始分析
因子分析通常有三個步驟:第一步是判斷是否適合進行因子分析;第二步是因子與題項對應關系判斷;第三步是因子命名。
第一步:判斷是否進行因子分析,判斷標准為KMO值大於0.6;
第二步:因子與題項對應關系判斷。如因子與題項對應關系與預期嚴重不符則可考慮對題項進行刪除
第三步:在第二步刪除掉不合理題項後,並且確認因子與題項對應關系良好後,則可結合因子與題項對應關系,對因子進行命名。
F. 質因子的演算法
求因子和的方法:
sqrt( n ) 太慢,可以用一下DP的思想,
把質因子分析出來 ai^x,
那麼 再乘 一個 ai+1 ,因子和就增加了原來的 ai+1 倍
如果這個質因子是2次冪,那麼還得增加原來那一層的 (ai+1)^2倍
速度因該是質因子的指數的和,但是受到求質因子速度的制約
36:
0: 1
1: 2 4 =( 1*2,1*2^2 ) sum = 1+(2)+(4); //2*2
2: 3 6 12 , 9 18 36 sum = 1+2+4+ (3+6+12) + (9+18+26)
也就是說,如果我們知道了一層的sum,那麼就可以推出下一層的sum
知道了一個數的因子和,就可以推知他的質數倍^x 的那個數的因子的和,
DP來解決這道題,對於數 x,把它除盡一個質數,那麼x/a^k = y
那麼 y 就是上一層的那個sum
而對於x,存在 x = (1+a+a^2+a^3..a^k)*y
上面這個方法要 100 s, 題目要求不是求因子和,所以如果有質數在 [a,b] 內,那麼最大的質數就是answer
主要的函數:
cal (x) 求 x 的因子和
int cal(int a) //計算 a 的因子和
{
int i;
int last,now;// sum
last = 1;now = 0;
int x;// 因子的^x 與前一階段
int t = a;
for ( i=0;primes[ i ] <= a;i++ )
{
if ( a%primes[ i ] == 0 )
{
x = last;
now = last;
while ( a %primes[ i ] == 0 )
{
// printf(%d can div %d :, a ,primes[i] );//debug
a /= primes[i];
x *= primes[ i ];
now += x;
// printf(now: %d x: %d
,now,x);//debug
}
// printf(now: %d last: %d
,now,last);//debug
last = now;
}
}
return last - t;
// printf(answer is %d
,last);
}
第二個DP雖然TLE,但是有思考價值,求很多數的因子和時,也許能用的到
void work2()
{
int i,j;
dp[ 1 ] = 1;
int temp;
for ( i=2;i<=1000000;i++ )
{
for ( j=0; primes[ j ]<=i;j++ ) //尋找上一層
if ( i % primes[ j ] == 0 )
break;
int i2 = i;
temp = 1;//求前面那個系數
while ( i2 % primes[ j ] == 0 )
{
temp = temp* primes[ j ] + 1;
i2 /= primes[ j ];
}
int last = dp [ i2 ];
dp [ i ] = temp* last;
// printf(dp[ %d ] = %d
,i,dp[i]);
if (i%1000 == 0) cout<<i<<endl;//debug
}
}
G. 進行因子分析的前提條件是各變數之間應該怎麼做
進行因子分析的前提條件是,各變數之間應該低度相關。
因子分析的主要目的是用來描述隱藏在一組測量到的變數中的一些更基本的,但又無法直接測量到的隱性變數。因此因子分析的首要前提就是各個變數之間應該具有一定的相關度,不要求相關度過高,只是低度相關
比如,如果要測量學生的學習積極性,課堂中的積極參與,作業完成情況,以及課外閱讀時間可以用來反應積極性。而學習成績可以用期中,期末成績來反應。在這里,學習積極性與學習成績是無法直接用一個測度測准,它們必須用一組測度方法來測量,然後把測量結果結合起來,才能更准確地把握。
換句話說,這些變數無法直接測量。可以直接測量的可能只是它所反映的一個表徵,或者是它的一部分。在這里,表徵與部分是兩個不同的概念。表徵是由這個隱性變數直接決定的。隱性變數是因,而表徵是果,比如學習積極性是課堂參與程度的一個主要決定因素。
(7)質因子分析的方法擴展閱讀
因子分析的應用
在市場調研中,研究人員關心的是一些研究指標的集成或者組合,這些概念通常是通過等級評分問題來測量的,如利用李克特量表取得的變數。每一個指標的集合(或一組相關聯的指標)就是一個因子,指標概念等級得分就是因子得分。
因子分析在市場調研中有著廣泛的應用,主要包括:
1、消費者習慣和態度研究(U&A)
2、品牌形象和特性研究
3、服務質量調查
4、個性測試
5、形象調查
6、市場劃分識別
7、顧客、產品和行為分類
參考資料來源:網路—因子分析
H. 因子分析法的分析步驟
因子分析的核心問題有兩個:一是如何構造因子變數;二是如何對因子變數進行命名解釋。因此,因子分析的基本步驟和解決思路就是圍繞這兩個核心問題展開的。
(i)因子分析常常有以下四個基本步驟:
⑴確認待分析的原變數是否適合作因子分析。
⑵構造因子變數。
⑶利用旋轉方法使因子變數更具有可解釋性。
⑷計算因子變數得分。
(ii)因子分析的計算過程:
⑴將原始數據標准化,以消除變數間在數量級和量綱上的不同。
⑵求標准化數據的相關矩陣;
⑶求相關矩陣的特徵值和特徵向量;
⑷計算方差貢獻率與累積方差貢獻率;
⑸確定因子:
設F1,F2,…, Fp為p個因子,其中前m個因子包含的數據信息總量(即其累積貢獻率)不低於80%時,可取前m個因子來反映原評價指標;
⑹因子旋轉:
若所得的m個因子無法確定或其實際意義不是很明顯,這時需將因子進行旋轉以獲得較為明顯的實際含義。
⑺用原指標的線性組合來求各因子得分:
採用回歸估計法,Bartlett估計法或Thomson估計法計算因子得分。
⑻綜合得分
以各因子的方差貢獻率為權,由各因子的線性組合得到綜合評價指標函數。
F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm )
此處wi為旋轉前或旋轉後因子的方差貢獻率。
⑼得分排序:利用綜合得分可以得到得分名次。
在採用多元統計分析技術進行數據處理、建立宏觀或微觀系統模型時,需要研究以下幾個方面的問題:
· 簡化系統結構,探討系統內核。可採用主成分分析、因子分析、對應分析等方法,在眾多因素中找出各個變數最佳的子集合,從子集合所包含的信息描述多變數的系統結果及各個因子對系統的影響。「從樹木看森林」,抓住主要矛盾,把握主要矛盾的主要方面,舍棄次要因素,以簡化系統的結構,認識系統的內核。
· 構造預測模型,進行預報控制。在自然和社會科學領域的科研與生產中,探索多變數系統運動的客觀規律及其與外部環境的關系,進行預測預報,以實現對系統的最優控制,是應用多元統計分析技術的主要目的。在多元分析中,用於預報控制的模型有兩大類。一類是預測預報模型,通常採用多元線性回歸或逐步回歸分析、判別分析、雙重篩選逐步回歸分析等建模技術。另一類是描述性模型,通常採用聚類分析的建模技術。
· 進行數值分類,構造分類模式。在多變數系統的分析中,往往需要將系統性質相似的事物或現象歸為一類。以便找出它們之間的聯系和內在規律性。過去許多研究多是按單因素進行定性處理,以致處理結果反映不出系統的總的特徵。進行數值分類,構造分類模式一般採用聚類分析和判別分析技術。
如何選擇適當的方法來解決實際問題,需要對問題進行綜合考慮。對一個問題可以綜合運用多種統計方法進行分析。例如一個預報模型的建立,可先根據有關生物學、生態學原理,確定理論模型和試驗設計;根據試驗結果,收集試驗資料;對資料進行初步提煉;然後應用統計分析方法(如相關分析、逐步回歸分析、主成分分析等)研究各個變數之間的相關性,選擇最佳的變數子集合;在此基礎上構造預報模型,最後對模型進行診斷和優化處理,並應用於生產實際。
I. 成分分析法和因子分析法的主要區別
主成分分析和因子分析有十大區別:
1.原理不同:成分分析基本原理:利用降維(線性變換)的思想,在損失很少信息的前提下把多個指標轉化為幾個不相關的綜合指標(主成分),即每個主成分都是原始變數的線性組合,且各個主成分之間互不相關,使得主成分比原始變數具有某些更優越的性能(主成分必須保留原始變數90%以上的信息),從而達到簡化系統結構,抓住問題實質的目的。 因子分析基本原理:利用降維的思想,由研究原始變數相關矩陣內部的依賴關系出發,把一些具有錯綜復雜關系的變數表示成少數的公共因子和僅對某一個變數有作用的特殊因子線性組合而成。就是要從數據中提取對變數起解釋作用的少數公共因子(因子分析是主成分的推廣,相對於主成分分析,更傾向於描述原始變數之間的相關關系)
2.線性表示方向不同:因子分析是把變數表示成各公因子的線性組合;而主成分分析中則是把主成分表示成各變數的線性組合。
3.假設條件不同:成分分析不需要有假設(assumptions), 因子分析:需要一些假設。因子分析的假設包括:各個共同因子之間不相關,特殊因子(specificfactor)之間也不相關,共同因子和特殊因子之間也不相關。
4.求解方法不同:成分分析方法從協方差陣出發(協方差陣已知),從相關陣出發(相關陣R已知),採用的方法只有主成分法。 (實際研究中,總體協方差陣與相關陣是未知的,必須通過樣本數據來估計) 注意事項:由協方差陣出發與由相關陣出發求解主成分所得結果不一致時,要恰當的選取某一種方法;一般當變數單位相同或者變數在同一數量等級的情況下,可以直接採用協方差陣進行計算;對於度量單位不同的指標或是取值范圍彼此差異非常大的指標,應考慮將數據標准化,再由協方差陣求主成分;實際應用中應該盡可能的避免標准化,因為在標准化的過程中會抹殺一部分原本刻畫變數之間離散程度差異的信息。此外,最理想的情況是主成分分析前的變數之間相關性高,且變數之間不存在多重共線性問題(會出現最小特徵根接近0的情況); 求解因子載荷的方法:主成分法,主軸因子法,極大似然法,最小二乘法,a因子提取法。
5.主成分和因子的變化不同:成分分析當給定的協方差矩陣或者相關矩陣的特徵值唯一時,主成分一般是固定的獨特的; 因子分析:因子不是固定的,可以旋轉得到不同的因子。
6.因子數量與主成分的數量:成分分析主成分的數量是一定的,一般有幾個變數就有幾個主成分(只是主成分所解釋的信息量不等),實際應用時會根據碎石圖提取前幾個主要的主成分。 因子分析:因子個數需要分析者指定(SPSS和sas根據一定的條件自動設定,只要是特徵值大於1的因子主可進入分析),指定的因子數量不同而結果也不同;
7.解釋重點不同:成分分析重點在於解釋個變數的總方差, 因子分析:則把重點放在解釋各變數之間的協方差。
8.演算法上的不同:成分分析協方差矩陣的對角元素是變數的方差; 因子分析:所採用的協方差矩陣的對角元素不在是變數的方差,而是和變數對應的共同度(變數方差中被各因子所解釋的部分)
9.優點不同:因子分析可以使用旋轉技術,使得因子更好的得到解釋,因此在解釋主成分方面因子分析更占優勢;其次因子分析不是對原有變數的取捨,而是根據原始變數的信息進行重新組合,找出影響變數的共同因子,化簡數據; 主成分分析: 第一:如果僅僅想把現有的變數變成少數幾個新的變數(新的變數幾乎帶有原來所有變數的信息)來進入後續的分析,則可以使用主成分分析,不過一般情況下也可以使用因子分析; 第二:通過計算綜合主成分函數得分,對客觀經濟現象進行科學評價; 第三:它在應用上側重於信息貢獻影響力綜合評價。 第四:應用范圍廣,主成分分析不要求數據來自正態分布總體,其技術來源是矩陣運算的技術以及矩陣對角化和矩陣的譜分解技術,因而凡是涉及多維度問題,都可以應用主成分降維;
10.應用場景不同:成分分析可以用於系統運營狀態做出評估,一般是將多個指標綜合成一個變數,即將多維問題降維至一維,這樣才能方便排序評估; 此外還可以應用於經濟效益、經濟發展水平、經濟發展競爭力、生活水平、生活質量的評價研究上; 主成分還可以用於和回歸分析相結合,進行主成分回歸分析,甚至可以利用主成分分析進行挑選變數,選擇少數變數再進行進一步的研究。 一般情況下主成分用於探索性分析,很少單獨使用,用主成分來分析數據,可以讓我們對數據有一個大致的了解。
文章來於成分分析:http://www.femtoanalysis.com,轉載請註明出處
J. 因子分析法的優缺點
它的優缺點是相對主成分分析法而言的
因子分析法與主成分分析法都屬於因素分析法,都基於統計分析方法,但兩者有較大的區別:主成分分析是通過坐標變換提取主成分,也就是將一組具有相關性的變數變換為一組獨立的變數,將主成分表示為原始觀察變數的線性組合;而因子分析法是要構造因子模型,將原始觀察變數分解為因子的線性組合。通過對上述內容的學習,可以看出因子分析法和主成分分析法的主要區別為:
(1)主成分分析是將主要成分表示為原始觀察變數的線性組合,而因子分析是將原始觀察變數表示為新因子的線性組合,原始觀察變數在兩種情況下所處的位置不同。
(2)主成分分析中,新變數Z的坐標維數j(或主成分的維數)與原始變數維數相同,它只是將一組具有相關性的變數通過正交變換轉換成一組維數相同的獨立變數,再按總方差誤差的允許值大小,來選定q個(q<p)主成分;而因子分析法是要構造一個模型,將問題的為數眾多的變數減少為幾個新因子,新因子變數數m小於原始變數數P,從而構造成一個結構簡單的模型。可以認為,因子分析法是主成分分析法的發展。
(3)主成分分析中,經正交變換的變數系數是相關矩陣R的特徵向量的相應元素;而因子分析模型的變數系數取自因子負荷量,即。因子負荷量矩陣A與相關矩陣R滿足以下關系:
其中,U為R的特徵向量。
在考慮有殘余項ε時,可設包含εi的矩陣ρ為誤差項,則有R
−
AAT
=
ρ。
在因子分析中,殘余項應只在ρ的對角元素項中,因特殊項只屬於原變數項,因此,的選擇應以ρ的非對角元素的方差最小為原則。而在主成分分析中,選擇原則是使舍棄成分所對應的方差項累積值不超過規定值,或者說被舍棄項各對角要素的自乘和為最小,這兩者是不通的。