㈠ 分析物質成分有什麼方法
分析物質成分方法:主成分分析是一種綜合評價方法。它比較了樣品的相對位置,比較了樣品的優缺點,缺口和原因。方向不積極,沒有正確的結論。因此,在分析中,必須轉發指標體系中的強度逆指數和中等指數。
主成分分析的理論和計算較為成熟,但主成分分析的應用尚未達到解決實際問題的成熟狀態。
根據總結,一些用戶在應用主成分分析方法進行綜合評價時有以下10個問題。
1、原始數據不正,有什麼影響?如何轉發?
2、原始變數是否意味著主成分的平方和不是1對?
3、主成分分析的主成分正交旋轉後會發生什麼?
4、回歸計算是否需要主成分分析的主要成分?
5、主成分分析和正交因子分析嗎?
6、何時進行主成分分析?
7、主成分分析有時會丟失一些原始變數的原因是什麼?
8、如何命名主成分並維護原始變數和多個主成分之間的內在關系?
9、前m個主成分仍然是多因素,客觀上只使用綜合主成分進行綜合分析?
10、綜合評價結果,如何深入了解決策相關程度?
主成分分析服務范圍
1、產品開發或改進:一般分析,比較分析,特殊需求分析。
2、質量控制:供應商評估,內部控制檢查。
3、工業診斷:異物分析,失效分析,副產物分析。
4、了解成分:(溶劑,表面活性劑,樹脂,主成分)定性和定量分析,名稱
5、組分定量或驗證,未知重復,無機定性定量,橡膠和塑料主成分表徵等。
㈡ 主成分分析,聚類分析,因子分析的基本思想以及他們各自的優缺點。
主成分分析與因子分析的區別
1. 目的不同: 因子分析把諸多變數看成由對每一個變數都有作用的一些公共因子和僅對某一個變數有作用的特殊因子線性組合而成,因此就是要從數據中控查出對變數起解釋作用的公共因子和特殊因子以及其組合系數;主成分分析只是從空間生成的角度尋找能解釋諸多變數變異的絕大部分的幾組彼此不相關的新變數(主成分)。
2. 線性表示方向不同: 因子分析是把變數表示成各公因子的線性組合;而主成分分析中則是把主成分表示成各變數的線性組合。
3. 假設條件不同:主成分分析中不需要有假設;因子分析的假設包括:各個公共因子之間不相關,特殊因子之間不相關,公共因子和特殊因子之間不相關。
4. 提取主因子的方法不同:因子分析抽取主因子不僅有主成分法,還有極大似然法,主軸因子法,基於這些方法得到的結果也不同;主成分只能用主成分法抽取。
5. 主成分與因子的變化:當給定的協方差矩陣或者相關矩陣的特徵值唯一時,主成分一般是固定的;而因子分析中因子不是固定的,可以旋轉得到不同的因子。
6. 因子數量與主成分的數量:在因子分析中,因子個數需要分析者指定(SPSS根據一定的條件自動設定,只要是特徵值大於1的因子主可進入分析),指定的因子數量不同而結果也不同;在主成分分析中,成分的數量是一定的,一般有幾個變數就有幾個主成分(只是主成分所解釋的信息量不等)。
7. 功能:和主成分分析相比,由於因子分析可以使用旋轉技術幫助解釋因子,在解釋方面更加有優勢;而如果想把現有的變數變成少數幾個新的變數(新的變數幾乎帶有原來所有變數的信息)來進入後續的分析,則可以使用主成分分析。當然,這種情況也可以使用因子得分做到,所以這種區分不是絕對的。
1 、聚類分析
基本原理:將個體(樣品)或者對象(變數)按相似程度(距離遠近)劃分類別,使得同一類中的元素之間的相似性比其他類的元素的相似性更強。目的在於使類間元素的同質性最大化和類與類間元素的異質性最大化。
常用聚類方法:系統聚類法,K-均值法,模糊聚類法,有序樣品的聚類,分解法,加入法。
注意事項:1. 系統聚類法可對變數或者記錄進行分類,K-均值法只能對記錄進行分類;
2. K-均值法要求分析人員事先知道樣品分為多少類;
3. 對變數的多元正態性,方差齊性等要求較高。
應用領域:細分市場,消費行為劃分,設計抽樣方案等
2、判別分析
基本原理:從已知的各種分類情況中總結規律(訓練出判別函數),當新樣品進入時,判斷其與判別函數之間的相似程度(概率最大,距離最近,離差最小等判別准則)。
常用判別方法:最大似然法,距離判別法,Fisher判別法,Bayes判別法,逐步判別法等。
注意事項:1. 判別分析的基本條件:分組類型在兩組以上,解釋變數必須是可測的;
2. 每個解釋變數不能是其它解釋變數的線性組合(比如出現多重共線性情況時,判別權重會出現問題);
3. 各解釋變數之間服從多元正態分布(不符合時,可使用Logistic回歸替代),且各組解釋變數的協方差矩陣相等(各組協方方差矩陣有顯著差異時,判別函數不相同)。
相對而言,即使判別函數違反上述適用條件,也很穩健,對結果影響不大。
應用領域:對客戶進行信用預測,尋找潛在客戶(是否為消費者,公司是否成功,學生是否被錄用等等),臨床上用於鑒別診斷。
3、 主成分分析/ 因子分析
主成分分析基本原理:利用降維(線性變換)的思想,在損失很少信息的前提下把多個指標轉化為幾個綜合指標(主成分),即每個主成分都是原始變數的線性組合,且各個主成分之間互不相關,使得主成分比原始變數具有某些更優越的性能(主成分必須保留原始變數90%以上的信息),從而達到簡化系統結構,抓住問題實質的目的。
因子分析基本原理:利用降維的思想,由研究原始變數相關矩陣內部的依賴關系出發,把一些具有錯綜復雜關系的變數歸結為少數幾個綜合因子。(因子分析是主成分的推廣,相對於主成分分析,更傾向於描述原始變數之間的相關關系)
求解主成分的方法:從協方差陣出發(協方差陣已知),從相關陣出發(相關陣R已知)。
(實際研究中,總體協方差陣與相關陣是未知的,必須通過樣本數據來估計)
求解因子載荷的方法:主成分法,主軸因子法,極大似然法,最小二乘法,a因子提取法。
注意事項:1. 由協方差陣出發與由相關陣出發求解主成分所得結果不一致時,要恰當的選取某一種方法;
2. 對於度量單位或是取值范圍在同量級的數據,可直接求協方差陣;對於度量單位不同的指標或是取值范圍彼此差異非常大的指標,應考慮將數據標准化,再由協方差陣求主成分;
3.主成分分析不要求數據來源於正態分布;
4. 在選取初始變數進入分析時應該特別注意原始變數是否存在多重共線性的問題(最小特徵根接近於零,說明存在多重共線性問題)。
5. 因子分析中各個公共因子之間不相關,特殊因子之間不相關,公共因子和特殊因子之間不相關。
應用領域:解決共線性問題,評價問卷的結構效度,尋找變數間潛在的結構,內在結構證實。
4、對應分析/最優尺度分析
基本原理:利用降維的思想以達到簡化數據結構的目的,同時對數據表中的行與列進行處理,尋求以低維圖形表示數據表中行與列之間的關系。
對應分析:用於展示變數(兩個/多個分類)間的關系(變數的分類數較多時較佳);
最優尺度分析:可同時分析多個變數間的關系,變數的類型可以是無序多分類,有序多分類或連續性變數,並 對多選題的分析提供了支持。
5、典型相關分析
基本原理:借用主成分分析降維的思想,分別對兩組變數提取主成分,且使從兩組變數提取的主成分之間的相關程度達到最大,而從同一組內部提取的各主成分之間互不相關。
㈢ 試述主成分分析,因子分析和對應分析三者之間的區別與聯系
一、方式不同:
1、主成分分析:
通過正交變換將一組可能存在相關性的變數轉換為一組線性不相關的變數,轉換後的這組變數叫主成分。
2、因子分析:
通過從變數群中提取共性因子,因子分析可在許多變數中找出隱藏的具有代表性的因子。
3、對應分析:
通過分析由定性變數構成的交互匯總表來揭示變數。
二、作用體現不同:
1、主成分分析:
主成分分析作為基礎的數學分析方法,其實際應用十分廣泛,比如人口統計學、數量地理學、分子動力學模擬、數學建模、數理分析等學科中均有應用。
2、因子分析:
因子分析在市場調研中有著廣泛的應用,主要包括消費者習慣和態度研究、品牌形象和特性研究、服務質量調查、個性測試。
3、對應分析:
能把眾多的樣品和眾多的變數同時作到同一張圖解上,將樣品的大類及其屬性在圖上直觀而又明了地表示出來,具有直觀性。另外,它還省去了因子選擇和因子軸旋轉等復雜的數學運算及中間過程,可以從因子載荷圖上對樣品進行直觀的分類,是一種直觀、簡單、方便的多元統計方法。
(3)主成分析方法哪個方面好擴展閱讀
主成分分析對於原先提出的所有變數,將重復的變數(關系緊密的變數)刪去多餘,建立盡可能少的新變數,使得這些新變數是兩兩不相關的,而且這些新變數在反映課題的信息方面盡可能保持原有的信息。
對應分析是由法國人Benzenci於1970年提出的,起初在法國和日本最為流行,然後引入到美國。對應分析法是在R型和Q型因子分析的基礎上發展起來的一種多元統計分析方法,因此對應分析又稱為R-Q型因子分析。
在因子分析中,如果研究的對象是樣品,則需採用Q型因子分析;如果研究的對象是變數,則需採用R型因子分析。但是,這兩種分析方法往往是相互對立的,必須分別對樣品和變數進行處理。
㈣ 主成分分析方法適用哪個方面研究
主成分分析也稱主分量分析,旨在利用降維的思想,把多指標轉化為少數幾個綜合指標(即主成分),其中每個主成分都能夠反映原始變數的大部分信息,且所含信息互不重復。這種方法在引進多方面變數的同時將復雜因素歸結為幾個主成分,使問題簡單化,同時得到的結果更加科學有效的數據信息。在實際問題研究中,為了全面、系統地分析問題,我們必須考慮眾多影響因素。這些涉及的因素一般稱為指標,在多元統計分析中也稱為變數。因為每個變數都在不同程度上反映了所研究問題的某些信息,並且指標之間彼此有一定的相關性,因而所得的統計數據反映的信息在一定程度上有重疊。主要方法有特徵值分解,SVD,NMF等。
㈤ 主成分分析法適用於哪些問題
主成分分析法適用於人口統計學、數量地理學、分子動力學模擬、數學建模、數理分析等問題,是一種常用的多變數分析方法。主成分分析作為基礎的數學分析方法,其實際應用十分廣泛。
主成分分析,是一種統計方法。通過正交變換將一組可能存在相關性的變數轉換為一組線性不相關的變數,轉換後的這組變數叫主成分。在實際課題中,為了全面分析問題,往往提出很多與此有關的變數或因素,因為每個變數都在不同程度上反映這個課題的某些信息。
主成分分析法原理
在用統計分析方法研究多變數的課題時,變數個數太多就會增加課題的復雜性。人們自然希望變數個數較少而得到的信息較多。在很多情形,變數之間是有一定的相關關系的,當兩個變數之間有一定相關關系時,可以解釋為這兩個變數反映此課題的信息有一定的重疊。
主成分分析是對於原先提出的所有變數,將重復的變數關系緊密的變數刪去多餘,建立盡可能少的新變數,使得這些新變數是兩兩不相關的,而且這些新變數在反映課題的信息方面盡可能保持原有的信息。
設法將原來變數重新組合成一組新的互相無關的幾個綜合變數,同時根據實際需要從中可以取出幾個較少的綜合變數盡可能多地反映原來變數的信息的統計方法叫做主成分分析或稱主分量分析,也是數學上用來降維的一種方法。