㈠ 幾種數據結構的轉換分析
文章摘要: 結合概念,運用動態圖形,用通俗的語言對三種數據結構的進行轉換分析,即:二叉樹與樹和森林的相互轉換;圖的最小生成樹的畫法;二又排序樹轉換戍平衡二叉樹。 (共2頁)
㈡ 轉換波傳播特性的分析方法
轉換波在地下介質中傳播時,具有與縱波不一樣的傳播特性,如,橫波分裂現象、各向異性等特性。轉換波傳播理論復雜,有關其特性研究方面的相關文獻或參閱資料非常少。
(1)轉換波傳播特性分析方法
目前,對於C波(轉換波)方位各向異性的研究,報道還比較少。原因之一是轉換波傳播理論復雜,對其傳播特性的研究具有較高的難度和前沿性。另一個重要的原因是寬方位的三維三分量地震勘探實例太少。
轉換波在不同類型、不同物性的各向異性介質中傳播時,將展現出不同的各向異性特徵。採用各向異性介質地震波正演模擬手段,可以研究轉換波的方位各向異性特徵和橫波分裂現象。
採用正演模擬手段研究轉換波傳播特性(尤指方位各向異性、橫波分裂)的主要思路,可以概括為:
1)建立各向異性介質(如HTI、TTI)數值模型;
2)選擇適當的入射角,設置圓形的接收點分布,並在圓上等間距安放檢波器,以固定入射角度和偏移距;
3)以縱波激發,進行轉換波正演模擬計算,獲得X、Y、Z三分量地震記錄;
4)對X、Y分量進行處理,形成寬方位或全方位的R、T分量地震數據;
5)基於R、T分量地震數據,分析轉換波傳播特性,如轉換波分裂、方位各向異性等。
(2)實例
下面,結合一個轉換波正演模擬的實例,介紹轉換波方位各向異性的分析方法。
為便於對比分析,建立各向同性和含裂縫(裂縫走向為平行於x軸,即0°方向)的各向異性介質數值模型。設置採集與觀測系統,選擇在1000m的圓形偏移距、在360°的方位角方位內每間隔10°設一個接收點,並完成地震波傳播正演數值模擬計算。分析C波走時和振幅隨方位角的變化關系。
圖6.2.1為在各向同性介質中C波的走時和振幅隨方位角的變化。從圖中可以看出,在各向同性介質中C波的走時和振幅沒方位變化,其軌跡表現為一圓形。
圖6.2.1 各向同性介質C波走時(a)和振幅(b)隨方位角的變化
圖6.2.2為在各向異性介質中C波的走時和振幅隨方位角的變化。從圖中可以看出,在各向異性介質中C波的走時和振幅隨方位角變化,其軌跡表現為一橢圓,其橢圓的長軸平行於裂縫走向,而短軸垂直於裂縫走向。
如果採用相同的方法獲得P波的走時,並與C波走時進行對比,將發現,C波的走時要略長於P波的走時,而且C波的方位橢圓的長軸與短軸之比大於P波的方位橢圓的長軸和短軸之比。這表明,相同條件的裂縫介質中,C波的各向異性特徵明顯強於P波。
利用Christoffel方程,可以模擬各向同性和各向異性介質中C波的相速度隨方位角的變化特徵。由於在裂縫介質中,C波穿過裂縫時會分裂為平行於裂縫的快波和垂直於裂縫的慢波,所以,在裂縫介質中具有兩種橫波,即擬快橫波qs1和擬慢橫波qs2。
圖6.2.3為在各向同性、含氣裂隙中C波相速度隨方位角的變化。從圖中可以看出,在各向同性介質中,C波速度沒有方位特徵,其軌跡表現為一圓形;在含氣裂隙中qs1波速度表現為較強的方位各向異性特徵,其軌跡表現為一橢圓形,橢圓長軸方向平行於裂隙走向,而短軸方向垂直於裂隙。
圖6.2.4所示為正演數值模擬R、T分量地震數據中的各向異性特徵。圖中為對裂縫走向為60°的各向異性數值模型進行正演數值模擬獲得的R、T分量地震剖面,方位0°~360°,每道間隔10°。圖中顯示,R分量反射同相軸呈「正弦」變化,T分量反射同相軸每隔90°發生一次極性反轉。T分量上出現強反射,即為橫波分裂現象。T分量發生極性反轉與裂縫走向有關。無論T分量的強反射還是極性反轉,都說明了裂縫的存在
圖6.2.2 各向異性介質C波走時(a)和振幅(b)隨方位角的變化
圖6.2.3 各向同性(a)、含氣裂隙(b)介質中C波速度隨方位角的變化
圖6.2.4 正演模擬地震數據中的方位各向異性
㈢ 議論文的例後分析法
1、概念分析法。這里的概念指的是文章中心論點中的關鍵詞語,對這些詞語加以分析,明確其內涵和外延,有助於我們對中心論點進行分解。如「說『面子 』」,有篇文章論證的中心是「維護國家人民尊嚴的『面子』不可丟,太看重個人『面子』的思想不可留」。要論述這個中心,必須分兩層來說:一是強調要維護國 家和人民的尊嚴;二是強調不要太注重個人的虛榮。這就是從中心論點中分解出來的兩個分論點。
2、因果分析法。這里的「因」是指分論點,「果」是指中心論點。在確立了中心論點(果)後,再來分析達成這個結果的原因。如要論證「青年時代是黃金時 代」,可以先提問一下,為什麼說青年時代是黃金時代呢?可以列出下面幾個分論點:①青年時代是體力充沛,精力旺盛的時代;②青年時代是積累知識,增長才幹 的時代;③青年時代是建功立業的時代。這三個分論點分別從三個不同角度證明了中心論點。
3、辯證分析法。它包括兩個方面:①對中心論點進行正反對照分析,②對中心論點進行一分為二的分析。①正反對照分析,如要證明「實踐出真知」,我們可 以從正反兩個方面立論:a、只有通過實踐才能認識事物,把握事物的發展規律;b、不參與實踐,不從實際出發,閉門造車,就不能尋找到解決問題的關鍵。這樣 正反對照,就可以進一步明確「實踐出真知」的觀點。②一分為二地分析,如要論證 「成才的關鍵不在於逆境」,便應該一分為二地分析:a、逆境可以造就人才,古今中外有許多事實證明了這一點;b、並非所有的逆境都可以造就人才。這兩個論 點看似矛盾,但都統一在「逆境能否出人才」的總論點之下。
4、條件分析法。這里的中心論點是指結果,而分論點是指滿足結果的「條件」。如要論證「爭做跨世紀的接班人」,對於這個題目就可以採用條件分析的方 法,先設想一下,「要做跨世紀的接班人需要具備什麼條件?」,這樣就可以得到下列三個分論點:①要有報效祖國的決心,②要有過硬的本領,③要有良好的心理 素質。
5、比較分析法。這是將中心論點展開為分論點常用的比較簡易的一種方法。如「常立志與立常志」,這篇文章的中心是提倡樹立遠大志向,而不能三天打魚, 兩天曬網。在論述時,可以把「常立志」和「立常志」這兩種做法進行比較,分析它們各自的特徵和不同的結果,通過比較闡明只有樹立遠大的理想,並且為之奮斗 才能有所建樹。
以上是我們常用的幾種方法,如果一時想不到好的分析方法,我們還可以採用一種常規的分析方法,即面對論題,可以提一些問題,如「是什麼?」,「為什 么?」,「怎麼辦?」,就此列出分論點,然後再進行篩選。南師大文學院何永康先生曾經說過:「在高考作文中,由於通篇字數有限,每一小論點的闡述最好控制 在260字左右,大體闡述過程是:先用幾句話點明小論點,然後再簡要地分析議論一番,接下去可聯系實際,擺出事實,最後收攏。」這段話較具體地講明了一個 分論點的實施過程。
㈣ 數據分析常用的4大分析方法
1. 描述型分析:發生了什麼?
這是最常見的分析方法。在業務中,這種方法向數據分析師提供了重要指標和業務的衡量方法。
例如,每月的營收和損失賬單。數據分析師可以通過這些賬單,獲取大量的客戶數據。了解客戶的地理信息,就是“描述型分析”方法之一。利用可視化工具,能夠有效的增強描述型分析所提供的信息。
2. 診斷型分析:為什麼會發生?
描述性數據分析的下一步就是診斷型數據分析。通過評估描述型數據,診斷分析工具能夠讓數據分析師深入地分析數據,鑽取到數據的核心。
良好設計的BI dashboard能夠整合:按照時間序列進行數據讀入、特徵過濾和鑽取數據等功能,以便更好的分析數據。
3. 預測型分析:可能發生什麼?
預測型分析主要用於進行預測。事件未來發生的可能性、預測一個可量化的值,或者是預估事情發生的時間點,這些都可以通過預測模型來完成。
預測模型通常會使用各種可變數據來實現預測。數據成員的多樣化與預測結果密切相關。在充滿不確定性的環境下,預測能夠幫助做出更好的決定。預測模型也是很多領域正在使用的重要方法。
4. 指令型分析:需要做什麼?
數據價值和復雜度分析的下一步就是指令型分析。指令模型基於對“發生了什麼”、“為什麼會發生”和“可能發生什麼”的分析,來幫助用戶決定應該採取什麼措施。通常情況下,指令型分析不是單獨使用的方法,而是前面的所有方法都完成之後,最後需要完成的分析方法。
關於數據分析常用的4大分析方法的內容,青藤小編就和您分享到這里了。如果您對大數據工程有濃厚的興趣,希望這篇文章可以為您提供幫助。如果您還想了解更多關於數據分析師、大數據工程師的技巧及素材等內容,可以點擊本站的其他文章進行學習。
㈤ 用轉換方法分析歧義句的步驟有哪些
所謂句子的歧義,就是指一種語言表達形式產生兩種或兩種以上可能的理解。今天小編給大家分享一些小學語文做歧義句的方法,希望對您有所幫助!
1、藉助口語方法消除歧義
譬如可以利用句子中詞語讀音的變化、重音的差異和停頓的不同等方法來消除歧義。例如:
小學語文做歧義句的方法
①他一個星期就寫了三封信。
可以利用重音的方法把句子的意思表達清楚。「他一個星期就寫了三封信」或「他一個星期就寫了三封信」。前者表示「只寫了三封信,其他什麼事情也沒做」;後者表示「他一個星期里寫信的數量多」。
②這種糖五毛五十粒。
可以利用停頓的方法把句子的意思表達清楚。「這種糖五毛 / 五十粒」或「這種糖五毛五 / 十粒」。
2、藉助書面方法消除歧義
譬如可以通過增設語境、調換詞語、變更語序、增加修飾語、添加標點符號和添加關聯詞等方法來消除歧義。例如:
①我去上課。
可以利用加插詞語的方法把句子的意思表達清楚。「我去(給學生)上課」或「我去(聽老師)上課」。
②他站在廣場上,一邊站著一個孩子。
可以利用改換詞語的方法把句子的意思表達清楚,「他站在廣場上,兩邊各站著一個孩子」或「他站在廣場上,旁邊站著一個孩子」。
③我要熱飯。
可以利用創設語境的方法把句子的意思表達清楚。「我要熱飯,(不去洗菜)」或「我要熱飯,(不要冷飯)」。
④圍剿土匪的部隊。
可以利用改變結構的方法把句子的意思表達清楚。「土匪的部隊被圍剿」或「部隊圍剿土匪」。
我想,只要我們熟練地掌握有關歧義知識,弄清歧義產生的常見原因,在閱讀中能識別歧義句,在自己平時寫作過程中避免出現歧義現象,做到邏輯思維嚴密,用語科學准確,就必定可以提高自身的語言修養,靈活地解決有關歧義問題。
2
小學語文做歧義句的方法一
一、停頓不確定引起歧義
停頓歧義指的是,說話或朗讀時,需要在句子中間作停頓,停頓的地方不同,往往會引起句子意思上的差別,從而導致歧義,如:
1、山上的水寶貴,我們把它留給晚上來的人喝。
分析:本句中「晚上」停頓不同,存在歧義。「晚」和「上」連讀,意與「白天」相對;「上」和「來」連讀,意即「後上來的」。
2、要說小莉的媽媽不愛她家裡人誰也不相信。
分析:例句後半部分由於停頓位置不確定,既可以理解成「要說小莉的媽媽不愛她,家裡人誰也不相信」,也可以理解成「要說小莉的媽媽不愛她家裡人,誰也不相信」。
二、重音不同產生歧義
重音一般分為兩種,一種是語法重音,一種是邏輯重音,我們平常所說的重音通常指邏輯重音。重音不同,語意的側重點往往不同。
1、我想起來了。
分析:例句中「起來」讀qǐlǎi時,表示「我想起身了」;若讀qilai時,表示「我想到了」。
2、一個季度就生產了五百台錄音機。
分析:重音落在「就」字上,表示生產太少了;重音落在「五百台」上,則表示生產太多了
㈥ 方差分析有哪些基本假定為什麼有些數據需要經過轉換才能方差分析有哪幾種轉化方法
方差分析的基本假定:正態性、可加性、方差同質性。
方差的有效性建立在這三個基本假定上,如果分析的數據不符合這些基本假定,得出的結論就不會正確。當遇到一些樣本,其所來自的總體和這三個基本假定相抵觸時,這些數據在進行方差分析之前必須經過適當處理即數據轉換。
㈦ 對正交變換進行簡述,有幾種實現途徑,對不同方法的優劣進行分析
1. 因子分析模型 因子分析法是從研究變數內部相關的依賴關系出發,把一些具有錯綜復雜關系的變數歸結為少數幾個綜合因子的一種多變數統計分析方法.它的基本思想是將觀測變數進行分類,將相關性較高,即聯系比較緊密的分在同一類中,而不同類變數之間的相關性則較低,那麼每一類變數實際上就代表了一個基本結構,即公共因子.對於所研究的問題就是試圖用最少個數的不可測的所謂公共因子的線性函數與特殊因子之和來描述原來觀測的每一分量. 因子分析的基本思想: 把每個研究變數分解為幾個影響因素變數,將每個原始變數分解成兩部分因素,一部分是由所有變數共同具有的少數幾個公共因子組成的,另一部分是每個變數獨自具有的因素,即特殊因子 因子分析模型描述如下: (1)X = (x1,x2,…,xp)¢是可觀測隨機向量,均值向量E(X)=0,協方差陣Cov(X)=∑,且協方差陣∑與相關矩陣R相等(只要將變數標准化即可實現). (2)F = (F1,F2,…,Fm)¢ (m<p)是不可測的向量,其均值向量E(F)=0,協方差矩陣Cov(F) =I,即向量的各分量是相互獨立的. (3)e = (e1,e2,…,ep)¢與F相互獨立,且E(e)=0, e的協方差陣∑是對角陣,即各分量e之間是相互獨立的,則模型: x1 = a11F1+ a12F2 +…+a1mFm + e1 x2 = a21F1+a22F2 +…+a2mFm + e2 ……… xp = ap1F1+ ap2F2 +…+apmFm + ep 稱為因子分析模型,由於該模型是針對變數進行的,各因子又是正交的,所以也稱為R型正交因子模型. 其矩陣形式為: x =AF + e . 其中: x=,A=,F=,e= 這里, (1)m £ p; (2)Cov(F,e)=0,即F和e是不相關的; (3)D(F) = Im ,即F1,F2,…,Fm不相關且方差均為1; D(e)=,即e1,e2,…,ep不相關,且方差不同. 我們把F稱為X的公共因子或潛因子,矩陣A稱為因子載荷矩陣,e 稱為X的特殊因子. A = (aij),aij為因子載荷.數學上可以證明,因子載荷aij就是第i變數與第j因子的相關系數,反映了第i變數在第j因子上的重要性. 2. 模型的統計意義 模型中F1,F2,…,Fm叫做主因子或公共因子,它們是在各個原觀測變數的表達式中都共同出現的因子,是相互獨立的不可觀測的理論變數.公共因子的含義,必須結合具體問題的實際意義而定.e1,e2,…,ep叫做特殊因子,是向量x的分量xi(i=1,2,…,p)所特有的因子,各特殊因子之間以及特殊因子與所有公共因子之間都是相互獨立的.模型中載荷矩陣A中的元素(aij)是為因子載荷.因子載荷aij是xi與Fj的協方差,也是xi與Fj的相關系數,它表示xi依賴Fj的程度.可將aij看作第i個變數在第j公共因子上的權,aij的絕對值越大(|aij|£1),表明xi與Fj的相依程度越大,或稱公共因子Fj對於xi的載荷量越大.為了得到因子分析結果的經濟解釋,因子載荷矩陣A中有兩個統計量十分重要,即變數共同度和公共因子的方差貢獻. 因子載荷矩陣A中第i行元素之平方和記為hi2,稱為變數xi的共同度.它是全部公共因子對xi的方差所做出的貢獻,反映了全部公共因子對變數xi的影響.hi2大表明x的第i個分量xi對於F的每一分量F1,F2,…,Fm的共同依賴程度大. 將因子載荷矩陣A的第j列( j =1,2,…,m)的各元素的平方和記為gj2,稱為公共因子Fj對x的方差貢獻.gj2就表示第j個公共因子Fj對於x的每一分量xi(i= 1,2,…,p)所提供方差的總和,它是衡量公共因子相對重要性的指標.gj2越大,表明公共因子Fj對x的貢獻越大,或者說對x的影響和作用就越大.如果將因子載荷矩陣A的所有gj2 ( j =1,2,…,m)都計算出來,使其按照大小排序,就可以依此提煉出最有影響力的公共因子. 3. 因子旋轉 建立因子分析模型的目的不僅是找出主因子,更重要的是知道每個主因子的意義,以便對實際問題進行分析.如果求出主因子解後,各個主因子的典型代表變數不很突出,還需要進行因子旋轉,通過適當的旋轉得到比較滿意的主因子. 旋轉的方法有很多,正交旋轉(orthogonal rotation)和斜交旋轉(oblique rotation)是因子旋轉的兩類方法.最常用的方法是最大方差正交旋轉法(Varimax).進行因子旋轉,就是要使因子載荷矩陣中因子載荷的平方值向0和1兩個方向分化,使大的載荷更大,小的載荷更小.因子旋轉過程中,如果因子對應軸相互正交,則稱為正交旋轉;如果因子對應軸相互間不是正交的,則稱為斜交旋轉.常用的斜交旋轉方法有Promax法等. 4.因子得分 因子分析模型建立後,還有一個重要的作用是應用因子分析模型去評價每個樣品在整個模型中的地位,即進行綜合評價.例如地區經濟發展的因子分析模型建立後,我們希望知道每個地區經濟發展的情況,把區域經濟劃分歸類,哪些地區發展較快,哪些中等發達,哪些較慢等.這時需要將公共因子用變數的線性組合來表示,也即由地區經濟的各項指標值來估計它的因子得分. 設公共因子F由變數x表示的線性組合為: Fj = uj1 xj1+ uj2 xj2+…+ujpxjp j=1,2,…,m 該式稱為因子得分函數,由它來計算每個樣品的公共因子得分.若取m=2,則將每個樣品的p個變數代入上式即可算出每個樣品的因子得分F1和F2,並將其在平面上做因子得分散點圖,進而對樣品進行分類或對原始數據進行更深入的研究. 但因子得分函數中方程的個數m小於變數的個數p,所以並不能精確計算出因子得分,只能對因子得分進行估計.估計因子得分的方法較多,常用的有回歸估計法,Bartlett估計法,Thomson估計法. (1)回歸估計法 F = X b = X (X ¢X)-1A¢ = XR-1A¢ (這里R為相關陣,且R = X ¢X ). (2)Bartlett估計法 Bartlett估計因子得分可由最小二乘法或極大似然法導出. F = [(W-1/2A)¢ W-1/2A]-1(W-1/2A)¢ W-1/2X = (A¢W-1A)-1A¢W-1X (3)Thomson估計法 在回歸估計法中,實際上是忽略特殊因子的作用,取R = X ¢X,若考慮特殊因子的作用,此時R = X ¢X+W,於是有: F = XR-1A¢ = X (X ¢X+W)-1A¢ 這就是Thomson估計的因子得分,使用矩陣求逆演算法(參考線性代數文獻)可以將其轉換為: F = XR-1A¢ = X (I+A¢W-1A)-1W-1A¢ 5. 因子分析的步驟 因子分析的核心問題有兩個:一是如何構造因子變數;二是如何對因子變數進行命名解釋.因此,因子分析的基本步驟和解決思路就是圍繞這兩個核心問題展開的. (i)因子分析常常有以下四個基本步驟: (1)確認待分析的原變數是否適合作因子分析. (2)構造因子變數. (3)利用旋轉方法使因子變數更具有可解釋性. (4)計算因子變數得分. (ii)因子分析的計算過程: (1)將原始數據標准化,以消除變數間在數量級和量綱上的不同. (2)求標准化數據的相關矩陣; (3)求相關矩陣的特徵值和特徵向量; (4)計算方差貢獻率與累積方差貢獻率; (5)確定因子: 設F1,F2,…, Fp為p個因子,其中前m個因子包含的數據信息總量(即其累積貢獻率)不低於80%時,可取前m個因子來反映原評價指標; (6)因子旋轉: 若所得的m個因子無法確定或其實際意義不是很明顯,這時需將因子進行旋轉以獲得較為明顯的實際含義. (7)用原指標的線性組合來求各因子得分: 採用回歸估計法,Bartlett估計法或Thomson估計法計算因子得分. (8)綜合得分 以各因子的方差貢獻率為權,由各因子的線性組合得到綜合評價指標函數. F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm ) 此處wi為旋轉前或旋轉後因子的方差貢獻率. (9)得分排序:利用綜合得分可以得到得分名次. 在採用多元統計分析技術進行數據處理、建立宏觀或微觀系統模型時,需要研究以下幾個方面的問題: · 簡化系統結構,探討系統內核.可採用主成分分析、因子分析、對應分析等方法,在眾多因素中找出各個變數最佳的子集合,從子集合所包含的信息描述多變數的系統結果及各個因子對系統的影響.「從樹木看森林」,抓住主要矛盾,把握主要矛盾的主要方面,舍棄次要因素,以簡化系統的結構,認識系統的內核. · 構造預測模型,進行預報控制.在自然和社會科學領域的科研與生產中,探索多變數系統運動的客觀規律及其與外部環境的關系,進行預測預報,以實現對系統的最優控制,是應用多元統計分析技術的主要目的.在多元分析中,用於預報控制的模型有兩大類.一類是預測預報模型,通常採用多元線性回歸或逐步回歸分析、判別分析、雙重篩選逐步回歸分析等建模技術.另一類是描述性模型,通常採用聚類分析的建模技術. · 進行數值分類,構造分類模式.在多變數系統的分析中,往往需要將系統性質相似的事物或現象歸為一類.以便找出它們之間的聯系和內在規律性.過去許多研究多是按單因素進行定性處理,以致處理結果反映不出系統的總的特徵.進行數值分類,構造分類模式一般採用聚類分析和判別分析技術. 如何選擇適當的方法來解決實際問題,需要對問題進行綜合考慮.對一個問題可以綜合運用多種統計方法進行分析.例如一個預報模型的建立,可先根據有關生物學、生態學原理,確定理論模型和試驗設計;根據試驗結果,收集試驗資料;對資料進行初步提煉;然後應用統計分析方法(如相關分析、逐步回歸分析、主成分分析等)研究各個變數之間的相關性,選擇最佳的變數子集合;在此基礎上構造預報模型,最後對模型進行診斷和優化處理,並應用於生產實際. Rotated Component Matrix,就是經轉軸後的因子負荷矩陣, 當你設置了因子轉軸後,便會產生這結果. 轉軸的是要得到清晰的負荷形式,以便研究者進行因子解釋及命名. SPSS的Factor Analysis對話框中,有個Rotation鈕,點擊便會彈出Rotation對話框, 其中有5種因子旋轉方法可選擇: 1.最大變異法(Varimax):使負荷量的變異數在因子內最大,亦即,使每個因子上具有最高載荷的變數數最少. 2.四次方最大值法(Quartimax):使負荷量的變異數在變項內最大,亦即,使每個變數中需要解釋的因子數最少. 3.相等最大值法(Equamax):綜合前兩者,使負荷量的變異數在因素內與變項內同時最大. 4.直接斜交轉軸法(Direct Oblimin):使因素負荷量的差積(cross-procts)最小化. 5.Promax 轉軸法:將直交轉軸(varimax)的結果再進行有相關的斜交轉軸.因子負荷量取2,4,6次方以產生接近0但不為0的值,藉以找出因子間的相關,但仍保有最簡化因素的特性. 上述前三者屬於「直交(正交)轉軸法」(Orthogonal Rotations),在直交轉軸法中,因子與因子之間沒有相關,因子軸之間的夾角等於90 度.後兩者屬於「斜交轉軸」(oblique rotations),表示因子與因子之間彼此有某種程度的相關,因素軸之間的夾角不是90度. 直交轉軸法的優點是因子之間提供的訊息不會重疊,受訪者在某一個因子的分數與在其他因子的分數,彼此獨立互不相關;缺點是研究迫使因素之間不相關,但這種情況在實際的情境中往往並不常存在.至於使用何種轉軸方式,須視乎研究題材、研究目的及相關理論,由研究者自行設定. 在根據結果解釋因子時,除了要看因子負荷矩陣中,因子對哪些變數呈高負荷,對哪些變數呈低負荷,還須留意之前所用的轉軸法代表的意義. 2,主成分分析(principal component analysis) 將多個變數通過線性變換以選出較少個數重要變數的一種多元統計分析方法.又稱主分量分析.在實際課題中,為了全面分析問題,往往提出很多與此有關的變數(或因素),因為每個變數都在不同程度上反映這個課題的某些信息.但是,在用統計分析方法研究這個多變數的課題時,變數個數太多就會增加課題的復雜性.人們自然希望變數個數較少而得到的信息較多.在很多情形,變數之間是有一定的相關關系的,當兩個變數之間有一定相關關系時,可以解釋為這兩個變數反映此課題的信息有一定的重疊.主成分分析是對於原先提出的所有變數,建立盡可能少的新變數,使得這些新變數是兩兩不相關的,而且這些新變數在反映課題的信息方面盡可能保持原有的信息.主成分分析首先是由K.皮爾森對非隨機變數引入的,爾後H.霍特林將此方法推廣到隨機向量的情形.信息的大小通常用離差平方和或方差來衡量. (1)主成分分析的原理及基本思想. 原理:設法將原來變數重新組合成一組新的互相無關的幾個綜合變數,同時根據實際需要從中可以取出幾個較少的總和變數盡可能多地反映原來變數的信息的統計方法叫做主成分分析或稱主分量分析,也是數學上處理降維的一種方法. 基本思想:主成分分析是設法將原來眾多具有一定相關性(比如P個指標),重新組合成一組新的互相無關的綜合指標來代替原來的指標.通常數學上的處理就是將原來P個指標作線性組合,作為新的綜合指標.最經典的做法就是用F1(選取的第一個線性組合,即第一個綜合指標)的方差來表達,即Var(F1)越大,表示F1包含的信息越多.因此在所有的線性組合中選取的F1應該是方差最大的,故稱F1為第一主成分.如果第一主成分不足以代表原來P個指標的信息,再考慮選取F2即選第二個線性組合,為了有效地反映原來信息,F1已有的信息就不需要再出現再F2中,用數學語言表達就是要求Cov(F1, F2)=0,則稱F2為第二主成分,依此類推可以構造出第三、第四,……,第P個主成分. (2)步驟 Fp=a1mZX1+a2mZX2+……+apmZXp 其中a1i, a2i, ……,api(i=1,……,m)為X的協方差陣∑的特徵值多對應的特徵向量,ZX1, ZX2, ……, ZXp是原始變數經過標准化處理的值,因為在實際應用中,往往存在指標的量綱不同,所以在計算之前須先消除量綱的影響,而將原始數據標准化,本文所採用的數據就存在量綱影響[註:本文指的數據標准化是指Z標准化]. A=(aij)p×m=(a1,a2,…am,),Rai=λiai,R為相關系數矩陣,λi、ai是相應的特徵值和單位特徵向量,λ1≥λ2≥…≥λp≥0 . 進行主成分分析主要步驟如下: 1. 指標數據標准化(SPSS軟體自動執行); 2. 指標之間的相關性判定; 3. 確定主成分個數m; 4. 主成分Fi表達式; 5. 主成分Fi命名; 選用以上兩種方法時的注意事項如下: 1、因子分析中是把變數表示成各因子的線性組合,而主成分分析中則是把主成分表示成個變數的線性組合. 2、主成分分析的重點在於解釋個變數的總方差,而因子分析則把重點放在解釋各變數之間的協方差. 3、主成分分析中不需要有假設(assumptions),因子分析則需要一些假設.因子分析的假設包括:各個共同因子之間不相關,特殊因子(specific factor)之間也不相關,共同因子和特殊因子之間也不相關. 4、主成分分析中,當給定的協方差矩陣或者相關矩陣的特徵值是唯一的時候,的主成分一般是獨特的;而因子分析中因子不是獨特的,可以旋轉得到不同的因子. 5、在因子分析中,因子個數需要分析者指定(spss根據一定的條件自動設定,只要是特徵值大於1的因子進入分析),而指定的因子數量不同而結果不同.在主成分分析中,成分的數量是一定的,一般有幾個變數就有幾個主成分.和主成分分析相比,由於因子分析可以使用旋轉技術幫助解釋因子,在解釋方面更加有優勢.大致說來,當需要尋找潛在的因子,並對這些因子進行解釋的時候,更加傾向於使用因子分析,並且藉助旋轉技術幫助更好解釋.而如果想把現有的變數變成少數幾個新的變數(新的變數幾乎帶有原來所有變數的信息)來進入後續的分析,則可以使用主成分分析.當然,這中情況也可以使用因子得分做到.所以這中區分不是絕對的. 總得來說,主成分分析主要是作為一種探索性的技術,在分析者進行多元數據分析之前,用主成分分析來分析數據,讓自己對數據有一個大致的了解是非常重要的.主成分分析一般很少單獨使用:a,了解數據.(screening the data),b,和cluster analysis一起使用,c,和判別分析一起使用,比如當變數很多,個案數不多,直接使用判別分析可能無解,這時候可以使用主成份發對變數簡化.(rece dimensionality)d,在多元回歸中,主成分分析可以幫助判斷是否存在共線性(條件指數),還可以用來處理共線性. 在演算法上,主成分分析和因子分析很類似,不過,在因子分析中所採用的協方差矩陣的對角元素不在是變數的方差,而是和變數對應的共同度(變數方差中被各因子所解釋的部分). (1)了解如何通過SPSS因子分析得出主成分分析結果.首先,選擇SPSS中Analyze-Data Rection-Factor…,在Extraction…對話框中選擇主成分方法提取因子,選擇好因子提取個數標准後點確定完成因子分析.打開輸出結果窗口後找到Total Variance Explained表和Component Matrix表.將Component Matrix表中第一列數據分別除以Total Variance Explained表中第一特徵根值的開方得到第一主成分表達式系數,用類似方法得到其它主成分表達式.打開數據窗口,點擊菜單項的Analyze-Descriptive Statistics-Descriptives…,在打開的新窗口下方構選Save standardized values as variables,選定左邊要分析的變數.點擊Options,只構選Means,點確定後既得待分析變數的標准化新變數. 選擇菜單項Transform-Compute…,在Target Variable中輸入:Z1(主成分變數名,可以自己定義),在Numeric Expression中輸入例如:0.412(剛才主成分表達式中的系數)*Z人口數(標准化過的新變數名)+0.212*Z第一產業產值+…,點確定即得到主成分得分.通過對主成分得分的排序即可進行各個個案的綜合評價.很顯然,這里的過程分為四個步驟: Ⅰ.選主成分方法提取因子進行因子分析. Ⅱ.計算主成分表達式系數. Ⅲ.標准化數據. Ⅳ.計算主成分得分. 我們的程序也將依該思路展開開發. (2)對為何要將Component Matrix表數據除以特徵根開方的解釋 我們學過主成分分析和因子分析後不難發現,原來因子分析時的因子載荷矩陣就是主成分分析特徵向量矩陣乘以對應特徵根開方值的對角陣.而Component Matrix表輸出的恰是因子載荷矩陣,所以求主成分特徵向量自然是上面描述的逆運算. 成功啟動程序後選定分析變數和主成分提取方法即可在數據窗口輸出得分和在OUTPUT窗口輸出主成分表達式. 3,聚類分析(Cluster Analysis) 聚類分析是直接比較各事物之間的性質,將性質相近的歸為一類,將性質差別較大的歸入不同的類的分析技術 . 在市場研究領域,聚類分析主要應用方面是幫助我們尋找目標消費群體,運用這項研究技術,我們可以劃分出產品的細分市場,並且可以描述出各細分市場的人群特徵,以便於客戶可以有針對性的對目標消費群體施加影響,合理地開展工作. 4.判別分析(Discriminatory Analysis) 判別分析(Discriminatory Analysis)的任務是根據已掌握的1批分類明確的樣品,建立較好的判別函數,使產生錯判的事例最少,進而對給定的1個新樣品,判斷它來自哪個總體.根據資料的性質,分為定性資料的判別分析和定量資料的判別分析;採用不同的判別准則,又有費歇、貝葉斯、距離等判別方法. 費歇(FISHER)判別思想是投影,使多維問題簡化為一維問題來處理.選擇一個適當的投影軸,使所有的樣品點都投影到這個軸上得到一個投影值.對這個投影軸的方向的要求是:使每一類內的投影值所形成的類內離差盡可能小,而不同類間的投影值所形成的類間離差盡可能大.貝葉斯(BAYES)判別思想是根據先驗概率求出後驗概率,並依據後驗概率分布作出統計推斷.所謂先驗概率,就是用概率來描述人們事先對所研究的對象的認識的程度;所謂後驗概率,就是根據具體資料、先驗概率、特定的判別規則所計算出來的概率.它是對先驗概率修正後的結果. 距離判別思想是根據各樣品與各母體之間的距離遠近作出判別.即根據資料建立關於各母體的距離判別函數式,將各樣品數據逐一代入計算,得出各樣品與各母體之間的距離值,判樣品屬於距離值最小的那個母體. 5.對應分析(Correspondence Analysis) 對應分析是一種用來研究變數與變數之間聯系緊密程度的研究技術. 運用這種研究技術,我們可以獲取有關消費者對產品品牌定位方面的圖形,從而幫助您及時調整營銷策略,以便使產品品牌在消費者中能樹立起正確的形象. 這種研究技術還可以用於檢驗廣告或市場推廣活動的效果,我們可以通過對比廣告播出前或市場推廣活動前與廣告播出後或市場推廣活動後消費者對產品的不同認知圖來看出廣告或市場推廣活動是否成功的向消費者傳達了需要傳達的信息.
㈧ 舉例說明心理學研究中,數據轉換的方法和作用
數據轉換是為了方便進行不同的統計分析,得到更精確的統計方法。轉換方法很多,可以將測量數據轉換為等級數據,也可以轉化為百分等級數據,還可以轉換為Z分數等等。
㈨ 方差分析中,常用的數據轉換方法有哪四個
方差分析中常用的數據轉換的方法應該是它的平均值或者是他的平均差都是在那的,這段話也可以通過這種進行曲法進行方差的分析。