㈠ 問卷調查所能用的統計方法有哪些
1. 調查的樣本量太小,計算出的結論可靠性不高。
例如看到一些研究生的論文,只發了幾十份問卷調查表,就根據統計到的百分比寫下十分肯定的結論。其實,是有問題的。
例如:調查「你對××活動喜歡的程度」,調查了45人。調查結果:非常喜歡2人,喜歡5人,一般10人,不太喜歡13人,不喜歡15人。作者統計出:喜歡和非常喜歡的共7人占調查人數45人的15.5%,不太喜歡和不喜歡的共28人,佔62.2%。並根據15.5%和62.2%來進一步寫結論。
但是,他忽略了調查的樣本計算出率以後,還應該計算率的標准誤和置信區間。如本例喜歡率為15.5%。還應該計算率的標准誤Sp。
_________ _________________
本例,喜歡率的標准誤 Sp =√P(1-P)/n = √15.5(100-15.5)/45 = 5.39 %
按樣本量n,查t值表上, n-1的t0.01和t0.05 的值,查得t0.05=2.02 , t0.01=2.69, 根據喜歡率15.5 %、標准誤5.39 % 和t0.05的值,可計算出:
95% 置信區間:15.5±2.02×5.39=4.6%~26.4%。(置信區間上下限的差值高達21.8%)。
95% 置信區間的含義是,如果用樣本的喜歡率15.5%來估計總體的喜歡率時,有95%的可能是在4.6%~26.4%的區間之間。這樣高達21.8%的區間意味著15.5%是不太可信的。
但是,如果擴大樣本量到450人,4500人,而統計出的喜歡率也是15.5%。由於調查的樣本量擴大了,標准誤 Sp會縮小,計算出的95% 置信區間也就縮小為12.2%~18.8%和14.4%~16.6%。這時用樣本率估計總體率時,上下限的差值很接近15.5%,才是可信的。
2. 調查數據的統計分析過於簡單。
目前看到的調查數據統計分析大都比較簡單。只是計算各個問卷指標的百分比,如上面舉例的喜歡率15.5%等等。
要避免統計分析過於簡單,首先,在做調查表設計時,就事先要考慮好調查數據的統計分析方法。例如同樣是調查「你對××活動喜歡的程度」,除了要擴大調查樣本量外,在調查表中增加調查性別和年齡。這樣就可以採用一種較為復雜的方法——交叉分析。交叉分析是分析「年齡」、 「性別」和「對××活動喜歡程度」三個變數之間的關系。假設不分類統計時,喜歡率是15.5%。交叉分析後就會發現由於性別的不同,年齡段的不同喜歡率是不同的。
例如:2005年國民體質監測問卷調查中,對「睡眠時間」的統計分析,如果只是簡單地計算某市成年男子2473人的問卷,只能統計出:睡眠6小時以下的人為13.4%,睡眠6~9小時的73.6%,睡眠9小時以上的13%。但是,如果增加年齡因素,分年齡段進行統計就可以看到,各年齡段的百分比是不同的(統計表略)。利用分年齡段的百分比還可以畫出折線圖(圖略)。從圖上更可以清楚的顯示出:隨著年齡增加,睡眠時間逐漸減少的趨勢。
上述統計分析方法比較簡單。但是,僅靠簡單的統計方法來處理問卷調查數據是十分可惜的,因為大量的數據信息還沒有充分利用。所以,設計問卷時,就應該注意到,讓收集到的調查數據能做多因素統計分析(如:回歸分析,因子分析等)。下面是我幫助或指導有關單位做過的統計分析實例:
例1:2005年國民體質監測的調查問卷內容中,包括了各人的文化程度,職業,工作、生活和體育鍛煉等方面的許多問題。為了分析這些調查內容和各人的體質有什麼關系,找出哪些因素對體質的好壞特別有關?在進行統計分析時,就需要把體質監測的指標和問卷調查的內容聯系起來進行統計。
在成年組調查問卷內容中可進行計算的12個問題是:受教育程度,職業,平均每周工作時間,平均每天睡眠時間,睡眠質量,平均每天步行時間,平均每天坐姿活動時間,吸煙狀況,運動感受,平均每周鍛煉次數,平均每次鍛煉時間,堅持鍛煉時間。把這些作為X1, X2, ……X12,再把每個人體質監測中的體質總分作為Y,就可以進行逐步回歸分析計算。
某省成年男甲組4242人的數據用逐步回歸分析計算結果是:從12個指標中依次選出了X 1 (受教育程度),X12 (堅持鍛煉時間), X10(平均每周鍛煉次數),X7(平均每天坐姿活動時間) 4個指標。得到回歸方程:
Y = 21.85+ 1.02 X 1 -0.20 X7+ 0.34 X10 + 0.28 X12 F=101.92 (P<0.01)
復相關系數 R= 0.296
根據回歸方程的系數就可以知道:受教育程度高,平均每周鍛煉次數多,堅持鍛煉時間長,平均每天坐姿活動時間少的人體質總分就高。反之就低。而這個結論只做一般的調查表百分比統計,是得不到的。
例2:某市開展《超重與肥胖人群運動與營養綜合干預實驗研究》12周後,對參加者進行了問卷調查,內容有:每天進餐情況(分為:五分飽,八分飽,十分飽),每周快走次數(分為:3次以下,3次,4次,5次及以上),每次快走時間(分為:30分鍾以內,30~60分鍾,60~90分鍾,90分鍾以上),每次快走距離(分為:3公里以下,3~4公里,5公里及以上)等。
如果僅統計各個問卷內容的百分比,只能計算出如:每次快走時間30分鍾以內的29人佔22.1%,30~60分鍾的47人佔35.9%,60~90分鍾的19人佔14.5%,90分鍾以上的36人佔27.5% 等等,這樣的統計結果並不能說明什麼問題。更無法分析出哪些是對減肥有效果的因素。
但是,把問卷調查的內容與參加12周實驗後各人體重下降值聯系起來統計,情況就不同了。如可以分別計算出:每周快走次數、每次快走時間等指標與體重下降值的相關系數。當計算出以上指標都和體重下降值呈中度或低度相關時,還可以進一步用回歸分析的方法計算出標准回歸系數或偏回歸平方和來分析各指標對體重下降的作用大小。
本例有131人參加實驗,為了用數學表達式來描述:飲食、運動量和降體重的關系。把調查表內容轉換成數字後,選擇了X1(每天進餐情況)、X2(每周快走次數)、X3(每次快走距離)與Y(體重下降值)計算出三元回歸方程:
Y= 1.26-1.30 X1 +0.59 X2 +1.70 X3 F =13.855 (P<0.01)
復相關系數 R = 0.4966
從回歸方程可以看到,在吃八分飽的情況下,增加每周快走次數和每次快走距離,降體重的效果更好。
可見,當採用了多元回歸分析方法後,可以充分利用調查表裡的信息從而獲得比簡單的統計百分比更多的研究結果。
例3:某市對學生體質下降原因進行調研時,設計的調查表內容包括:學生、家長、學校等方面30多項指標。為了分析調查的各指標對學生身體素質影響的主次關系,從調查表中選出可進行因子分析計算的26個指標進行了R型因子分析計算。
R型因子分析通過計算,可找出控制著所有指標的幾個主要因素。計算後,原來的許多指標重新組合成較少的幾個新的綜合指標──公因子。這些公因子相互獨立而且反映了原來指標的絕大部分信息。通過R型因子分析的結果,可以看出哪些指標是同一類的,每一個指標以哪一公因子為主,其他公因子所佔比例如何,從而分析該指標的特點。還可根據貢獻率較大的幾個公因子中所包括的指標,來分析出各指標的主次關系。
對3699名中學生的調查數據作R型因子分析計算後,從貢獻率最大的5個公因子所包括的調查指標看,歸入第1公因子的7個指標,都和參加體育活動有關,因此把第一公因子命名為體育活動因子,歸入第2公因子的2個指標,是反映學生家長文化水平的學歷,歸入第3公因子的2個指標,是反映學生是否關心自己體質、健康的指標,歸入第4公因子的2個指標,是反映學校是否關心和組織學生體育活動的指標,歸入第5公因子的2個指標,是反映學生家長對體育運動的態度的指標。
從而可以分析出,對學生體質影響最大的第一因素是學生參加體育活動的情況,第二因素是家長的文化水平高低,第三因素是學生自己是否關心自己的體質、健康情況。第四因素是學校是否關心和組織學生參加體育活動,第五因素是家長是否喜愛體育活動是否支持學生參加體育活動。
因子分析的優點在於用一個或少數幾個綜合指標概括原始數據中盡量多的信息,它能夠實現對問題的高度概括,並揭示出一般的特徵和規律。本例通過因子分析的統計方法,從學生填在26個調查問卷中的信息,分析出了對學生體質影響的幾個主要因素。
㈡ 關於量表的描述統計
可以比較,這是典型的單樣本t檢驗的應用,t檢驗是專門用於均值檢驗的統計方法,而單樣本t檢驗又是專門用於將變數均值和固定數值作比較的檢驗方法(對於這個大凡統計教材都有介紹)。
一般用spss進行分析即可,在菜單中選擇 分析——均值比較——單樣本t檢驗,然後在彈出的對話框中將需要與3做比較的項目選入t檢驗框,再設定檢驗值為數字3,然後OK,即可得出結果。
結果看t值與sig值,若sig<0.05,表明所選項目的均值與3具有顯著差異,如果你要說這個結論是基於什麼統計學依據,那自然是小概率法則咯,所有經典統計學的假設檢驗都是依據這個,設定t檢驗的拒絕域為0.05,(項目均值-3)應該是來自標准正態分布的隨機數,那麼在這個分布中抽樣一次最有可能是抽到分布靠中間的數值,即靠近均值的數(很好理解,就如同隨便抽一次彩票基本不可能中大獎),可以認為一次抽樣基本不可能抽到位於分布尾端0.05百分位上的數,如果抽到,更合理的推斷是你檢驗的值並不是來自於你原先假設的分布,而是另一個分布,所以當項目均值-3的t檢驗結果的sig值超出原先假定的0.05拒絕域時,認為該項目均值應當本來是大於3或者小於3才合理。
最後提一下,這個不屬於描述統計,這已經是推斷統計的范疇了
㈢ 誰知道劉鳳斌的中醫健康量表使用方法
1.1 量表的研製原則
1.1.1 目的和構想 ①目的是按照國際病人報告的結局指標的定義和內涵,以中華文化為背景、以中醫理論為指導研製既具有中國文化特色又能反映中醫健康內涵的中醫健康狀況量表。②量表理論結構構想由精力、疼痛、大便、小便、睡眠、情緒、飲食、體質八個方面直接反映健康內涵[4]。每個方面應符合中醫理論,不背棄PRO的含義。③量表應簡明扼要,具有較強的實用性、科學性和可操作性。作為普適性量表,適用於一般人群和各種慢性病。④量表為自評式,各條目有4個等級回答選項。
1.1.2 條目的要求 ①根據方面發展條目,一個條目只明確地反映一個問題,條目敘述的語言簡潔、明了,避免模稜兩可,等級分明,容易判別。②條目應通俗易懂,便於理解和操作,每個被調查者均能對條目做出評價。
1.2 研究小組的建立
參照國際量表研製模式和設計方法[5,6],成立研究小組,由中醫、統計和生存質量專家共同組成,共同組織和領導以後的量表發展、考核工作。
1.3 條目池的形成
1.3.1 理論結構模型的建立 研究小組根據PRO的概念內涵,結合中國文化特色、中醫理論關於健康的認識和相關研究經驗[7],在對專家調查的基礎上,提出了中醫健康狀況量表應包括精力、疼痛、大便、小便、睡眠、情緒、飲食、體質八個方面。
1.3.2 條目池的產生 條目主要由以下三個方面獲取:①以病人為中心提出條目。選擇了不同病種患者(內科慢性疾病)30例和健康人30例,分別由他們根據自己對健康認識的經驗和體會提出健康應該包括哪些方面和條目,再由課題組成員根據中醫理論和臨床實際對提出的條目進行整理修改、綜合和拆分,形成條目。②以 SF-36為基礎改造條目。SF-36 是國際著名的健康狀況量表,我們把SF-36條目和一些背景材料,提供給有關中醫專家,請中醫專家們提出中醫健康量表應該具備的條目。從中醫角度來看SF-36量表缺了什麼?請中醫專家補充中醫認為重要的,而此量表未反映的條目。專家意見表收集後,逐條討論各個專家的意見,發現專家在討論健康方面和條目時,完全按照中醫健康理論應包含的方面給出條目,認為SF-36不能反映中醫健康內涵,從而舍棄了以SF-36為基礎改造的條目。③根據理論模型提出條目。研究小組廣泛參考中醫健康狀況的內涵,通過認真閱讀中醫有關理論和臨床專業書,根據PRO的概念及其構成,提出條目,並逐條進行認真討論、修改、刪除和補充。將以上三方面來源的條目整理後,發往北京、銀川、成都、廣州、鄭州等地相關中醫專家(不同年齡和職稱結構)收集意見, 76個中醫專家對條目作了重要性評分,並提出了修改意見。將中醫專家反饋回來的重要性評分結果作統計分析,計算得分值的均數、標准差、中位數和四分位數間距等統計指標,將均數或中位數得分較低的條目剔除,修改後作為量表初稿,計有40個條目。結合中醫理論和臨床實際情況,經專家逐條討論將每個條目回答選項根據臨床表現的不同程度分為4級。如有關精神的條目分級為:精神飽滿、精神欠佳、精神疲倦、精神極差4個等級;關於頭暈的條目分級為無頭暈、輕微頭暈,可堅持日常工作和活動、頭暈,不能行走、頭暈,不能站立4個等級。
1.4 調查量表的確定
1.4.1 小范圍測試(語言調試)和條目再改造 選擇50位文化程度中等的健康人和患者(內科慢性疾病),用量表初稿進行小范圍測試,健康人及患者填寫量表後,針對其填寫內容進行詳細詢問,主要考評無論是健康人還是患者是否能回答條目?是否理解條目?如何理解條目?其理解是否與我們設計的內容一致?等等。刪除或修改了難於理解或不同患者理解相差較大的條目。
1.4.2 初步調查量表 量表初稿語言測試完成後,進一步對條目進行分析比較、討論、修改,整理製成預調查量表,保留了35個條目作為初步調查量表,其中包括:精神、目光、反應、體力、記憶力、疲倦、氣促、頭暈、疼痛程度、疼痛頻度、食慾、飯量、口乾、口苦、口淡、大便干、大便次數、大便稀、大便爛、大便不暢、放屁、小便黃、夜尿多、小便不暢、難以入睡、睡不安寧、多夢、易感冒、手腳心發熱、怕冷、體重減輕、心煩、急躁、心神不寧、情緒低落。
1.5 臨床調查
1.5.1 臨床調查的實施 2004年~2006年間用初步調查量表在廣東省和寧夏自治區隨機選擇300名(100名健康人、100名門診病人和100名住院病人)受試者進行調查,病種以慢性疾病為主;採用自測量表的形式;文化層次要求調查對象能夠獨立完成量表填寫;招聘調查員,要求具有認真和誠實的品格;起草調查員指南和實施手冊,進行調查員培訓;調查員以醫生身份出現,逐一訪問受試者,作簡要說明,請他們逐次填完量表。同時發放WHOQOL-100、SF-36、CH-QOL,最後回收問卷273份,回收率91%。
1.5.2 被調查者一般情況 273例調查對象中,年齡18 ~ 65歲(平均39.6歲,S=14.1),分為18 ~ 39歲和40 ~ 65歲兩組。寧夏101例,廣東172例;男性137例,女性136例;健康人80例,門診患者91例,住院患者102例;初高中文化者123例,中專以上文化者150例;農村戶口這43例,縣鎮66例,城市169例。完全健康者76例,有病並穩定者56例,有病並正在治療者139例。
1.6 統計學方法
統計分析藉助SPSS 11.0、SAS 8.1和EQS 6.1(結構方程分析) 軟體包完成。條目篩選用離散趨勢法、方差分析、證實性因子分析、相關系數、克朗巴赫系數法等統計分析方法。量表的考核用證實性因子分析、克朗巴赫系數法和方差分析。
2 結果
2.1 條目分析
按照量表研製的一套程序和方法,對預調查量表的條目進行篩選。包括條目的困難度、反應度分析等,結果顯示患者基本上能夠理解和獨自完成量表。具有較適宜的難易度和較好反應度,沒有出現天花板(全部打最高分)或地板效應(全部打最低分)。
2.2 篩選條目結果
採用不同統計分析方法進一步篩選條目。①離散趨勢法(變異系數法)。該方法是從敏感性角度挑選指標,生存質量測定中,可直接用標准差來反映離散趨勢。但若各條目計分值不呈正態分布則應先作變數變換使之成為正態分布。計算各條目的標准差(各條目量綱相同,直接用標准差來比較變異度),挑選標准差最大的3個指標,結果選出22個條目。②方差分析。該方法也是從敏感性角度挑選指標。以P < 0.05為標准,最終選出27個條目。③證實性因子分析。從量表的結構角度篩選條目,首先計算方面的CFI,然後與去掉方面中的任一條目後的CFI進行比較,如果某條目去掉後CFI有較大上升,則說明該條目的存在有降低該方面有負面影響,應該去掉,反之則保留。最後保留22個條目。④方面總分與條目的相關系數。通過計算方面總分,計算各條目與總分的相關系數,以0.5為界,若相關系數高於0.5者,表明該條目貢獻比較大,否則刪除。最後保留23個條目。⑤克朗巴赫系數法。從內部一致性的角度對條目進行篩選。首先計算某一方面總的Cronbach′s α系數,然後與去掉其中任一條目後的Cronbach′s α系數進行比較,如果某條目去掉後Cronbach′s α系數有較大上升,則說明該條目的存在有降低該方面內部一致性的作用,應該去掉,反之則保留。最終保留22條。從以上條目篩選的統計分析結果可以看出,5種不同的方法篩選出的條目不盡相同,被4種以上方法篩選掉的條目包括2,3,21,24,31等5個條目。
2.3 量表的考核
通過對保留的30個條目的量表結構的證實性因子分析結果顯示CFI=0.919,證明其具有良好的結構效度。精力、疼痛、飲食、大便、小便、睡眠、情緒、體質8個方面的克朗巴赫系數分別為0.8102、0.8298、0.7885、 0.6331、 0.5253、 0.8161、 0.8701、0.5638,可見除在大、小便和體質方面的克朗巴赫系數稍差外,其它六個方面均體現了較好的信度。健康人與門診患者和住院患者的8個方面方差分析表明P值均 < 0.01,說明了量表具有區分健康者與門診和住院患者之間病情差別的能力。
2.4 正式調查量表
根據統計分析和量表考核的結果最終確立量表的結構模型為:方面反映健康狀況,即本量表的結構為中醫健康狀況直接由精力、疼痛、大便、小便、睡眠、情緒 飲食、體質八個方面來反映,保留了30個條目。其中精力6條、疼痛2條、飲食5條、大便5條、小便2條、睡眠3條、體質3條、情緒4條,形成中醫健康狀況量表正式版
㈣ 量表的評價主要包括什麼和什麼兩方面
科研實務 | 量表的信度評價(案例實操)
AideEdit艾德護理
2019年08月15日
編者按
對於已有的量表,如何評價一個量表的好壞?通過哪些指標來說明量表是否可靠?量表的評價主要包括兩個方面內容:①信度(reliability),反映量表是否穩定;②效度(validity)反映量表是否准確。
今天先來講解一下什麼是信度。信度,反映量表的一致性和穩定性。即在不同的主試者、評分者、時間、情境或使用類似的問題,其所得的分數是否一致。主要反映了測量誤差所造成的影響有多大。常用的信度評價指標有:重測信度、復本信度、內部一致性方法(分半信度、克朗巴赫系數)
重測信度
重測信度是指用同一份量表,對同一群受訪者,在兩次不同的時間進行調查,根據兩次測量結果,計算相關系數,以此來評估測量信度。
重測的間隔時間一般視工具用途來決定間隔時間。重測信度的缺點是:①易受練習與記憶的影響;②某些題目的性質因重測而改變,如推理題變成記憶題;③無法復制相同的情境而產生的誤差。
注意
重測信度的度量:相關系數,如果①資料為連續資料,且符合正態分布,通常採用Pearson相關系數;②資料不滿足正態分布,或者為有序資料,通常採用Spearman相關系數。
具體JMP軟體操作步驟如下:
該資料為連續性資料,符合正態分布,採用Pearson相關性分析:Pearson相關系數為0.94.提示兩次重復測量的相關性很強,重測信度好。
分半信度
分半信度是指將量表的題目分成兩部分分半計分,根據受試者在兩半題項上所得分數,計算兩者的相關系數。如果實際中很難做到重測,可採用該方法評價信度。
如何分半?
分半一般有兩種方法,①隨機分半:採用隨機數字法,將量表的問題隨機分為兩部分。如有30個條目,可隨機產生30個隨機數字,隨機數字1-15所對應的條目昨晚一部分,所及數字16-30所對應的數字作為另一部分。②奇偶分半:根據條目的奇偶數分半,1、3、5.....作為一部分,2、4、6.....作為另一部分。
具體JMP軟體操作步驟如下:
新增一列「隨機分組」,其值只有0和1,各佔50%。再選擇「表」——「拆分」。
隨機分組作為拆分依據;合計作為拆分的列。
新產生的數據,即隨機分為兩部分的量表得分。
對新產生的兩個變數質性相關分析即可。(選擇「分析」——「多元」)
克朗巴赫系數
克朗巴赫系數是實際中最常用的一個信度指標。克朗巴赫系數相當於是把所有的分半信度求一個平均值。一次分半信度有時如果分的不合適,可能計算的結果不一定合理,比如兩組方差相差較大,等等。把所有的分半信度都計算出來,再求其平均值,這就是克朗巴赫系數,因而其結果更為合理。
克朗巴赫系數評價標准(Devellis,1991)
克朗巴赫系數與條目數有關,一般條目越多,系數越大。具體JMP軟體操作步驟見(科研實務 | 量表條目的篩選(案例實操))#清風計劃#
㈤ 數據分析中有哪些篩選關鍵因素的方法
很多朋友還沒有接觸過大數據分析方案,認為其僅僅算是個願景而非現實——畢竟能夠證明其可行性與實際效果的案例確實相對有限。但可以肯定的是,實時數據流中包含著大量重要價值,足以幫助企業及人員在未來的工作中達成更為理想的結果。那麼,那些領域需要實時的數據分析呢?
㈥ 問卷統計分析方法,如何進行調查問卷統計分析
第一,定性分析法
定性分析是調研工作中的一種探索性分析方法。定性分析方法是先要對問題進行定位,對問題進行深層次的認識和理解。這種方法一般只適用於專業人員,因為這種方法是要對調研的問題有深入的了解和較高的專業水平。
第二,定量分析法
定量分析首先要對問卷進行數量化,利用量化後的數據對資料進行分析。這里涉及到兩個方面:一是簡單的定量分析;二是復雜的定量分析。
1.簡單的定量分析是對調查問卷進行一些相對比較得單的數據分析,最常用的有百分比、頻數、平均數分析法。
2.復雜定量分析法
復雜定量分析是相對於簡單的定量分析而言的,由於在問卷中的變數較多,不是簡單的一個或兩個,而是多個,這時就需要用復雜的分析方法,復雜分析方法又分為多元分析和聚類分析。
多元分析是通過分析數據由表到里,由外到內的一種分析方法,通過變數之間的規律變化而從中找出一定的規律性。
聚類分析是根據一定的規則把應答者進行劃分成為相對類似的群組,然後把群組進行具體的分析。
無論採用哪種方法對問卷進行分析,我們首先需要掌握好問卷的信度問題,如查問卷的可信度低,那麼用哪一種方法進行分析都是徒勞的。
㈦ 方積乾的已發表論文
[1]黃瑋俊 李彩霞 拉布 周雁 黎培興 胡彬 普布卓瑪 格桑卓嘎 方積乾 王一鳴.藏族人群15號染色體中心粒區域基因的高精度連鎖不平衡和單體型圖譜及其與漢族人群的比較[J].科學通報,2006,51(3):283~
[2]王蓓 高海蓮 劉雪琴 郝元濤 馮桂蘭 方積乾.WHO生存質量量表老年模塊在我國前列腺增生症患者中的適用性研究[J].中華護理雜志,2006,41(8):687~
[3]凌莉 劉軍 韓璐 唐廣心 方積乾.廣州市農村流動人口衛生服務需求與利用分析[J].華南預防醫學,2006,32(2):1~
[4]王心旺 方積乾.廣東省居民健康、傷殘、死亡三者間的量效關系研究[J].中國老年學雜志,2006,26(4):445~
[5]郝元濤 方積乾 宋心遠 朱淑明 吳少敏.非線性因子分析模型參數估計研究[J].中國衛生統計,2006,23(2):108~
[6]王心旺 方積乾.基於混合正態模型的糖尿病住院病人醫療保險設計[J].中國衛生統計,2006,23(2):118~
[7]李彩霞 黎培興 方積乾.傳遞不平衡的對稱性檢驗的適用性[J].中國衛生統計,2006,23(1):16~
[8]顏傑 相麗馳 方積乾.灰色預測模型及SAS實現[J].中國衛生統計,2006,23(1):75~
[9]何春 方積乾.極大似然估計和擬極大似然估計模擬之比較[J].廣東工業大學學報,2006,23(1):114~
[10]郝元濤 方積乾 Power MJ 吳少敏 朱淑明.WHO生存質量評估簡表的等價性評價[J].中國心理衛生雜志,2006,20(2):71~
[11]劉清海 方積乾.醫學期刊統計學誤用現狀、趨勢與對策[J].中國科技期刊研究,2006,17(4):549~
[12]趙利 劉鳳斌 梁國輝 陳金泉 方積乾.中華生存質量量表的信度和效度[J].中國臨床康復,2006,10(8):1~
[13]王心旺 方積乾.基於分類風險模型的最優獎懲系統設計及在特定疾病保險中的應用[J].中國自然醫學雜志,2006,8(3):185~
[14]麥勁壯 李河 方積乾 劉小清 饒栩栩.Meta分析中失安全系數的估計[J].循證醫學,2006,6(5):297~
[15]李彩霞 黎培興 方積乾.家系數據緊密連鎖位點的單體型頻率估計[J].中山大學學報:自然科學版,2005,44(3):9~
[16]凌莉 劉軍 韓璐 唐廣心 方積乾.廣州市流動人口的衛生服務需求與利用[J].中華預防醫學雜志,2005,39(6):395~
[17]王心旺 楊哲 方積乾.廣東省衛生行業科學研究與試驗發展投入產出效益分析[J].廣州醫學院學報,2005,33(1):9~
[18]萬崇華 方積乾 湯學良 張燦珍 盧玉波 孟瓊 高麗.SF-36量表用於肝癌患者生活質量測定的效果評價[J].腫瘤,2005,25(5):492~
[19]李彩霞 黎培興 關永源 方積乾.離子通道的混合密度參數估計與狀態判別[J].數理統計與管理,2005,24(6):62~
[20]顏傑 黨容 方積乾.配對設計兩組多分類頻數分布的比較方法[J].中國衛生統計,2005,22(5):306~
[21]顏傑 謝薇 方積乾.SPSS中隨機抽樣的精確實現[J].中國衛生統計,2005,22(4):255~
[22]匡莉 方積乾 徐淑一.醫院規模經濟與成本函數研究進展[J].國外醫學:衛生經濟分冊,2005,22(3):111~
[23]金華 方積乾.多維協變數具有測量誤差的結構回歸模型[J].生物數學學報,2005,20(1):77~
[24]劉清海 方積乾.醫學論文統計學報告指南的綜述與思考[J].中國科技期刊研究,2005,16(4):448~
[25]黃瑋俊 李彩霞 陳素琴 孫健冬 周雁 方積乾 王一鳴.中國漢族人群15號染色體中心粒區域5個基因的高精度單倍型及單倍型域構建[J].科學通報,2004,49(7):649~
[26]李彩霞 黎培興 關永源 方積乾.單離子通道潛在信號的馬氏距離判別[J].中山大學學報:自然科學版,2004,43(3):111~
[27]王心旺 劉淑霞 方積乾.健康期望壽命的綜合評價[J].廣州醫學院學報,2004,32(4):29~
[28]王心旺 楊哲 方積乾.糖尿病保險費精算模型研究[J].廣州醫學院學報,2004,32(3):7~
[29]王心旺 楊哲 方積乾.廣東省居民6種疾病負擔研究[J].廣州醫學院學報,2004,32(2):21~
[30]杜勇 李幼姬 李彩霞 郭輝 JosephCKLeung ManFLam 楊念生 黃鋒先 方積乾 PatrickHMaxweⅡ 黎嘉能 王一鳴.Uteroglobin基因G38A多態性與IgA腎病相關關系[J].中山大學學報:醫學科學版,2004,25(3):200~
[31]趙利 陳金泉 梁國輝 劉鳳斌 方積乾.因子分析法在生存質量測定量表研製中的應用[J].中國中西醫結合雜志,2004,24(11):965~
[32]郝元濤 孫希鳳 方積乾 吳少敏 朱淑明.量表條目篩選的統計學方法研究[J].中國衛生統計,2004,21(4):209~
[33]何春 方積乾.多維平均處理效應極大似然估計的模擬研究[J].廣東工業大學學報,2004,21(4):97~
[34]顏傑 李彩霞 曾芳芳 方積乾.如何控制SAS結果的輸出[J].中國衛生統計,2004,21(2):119~
[35]張晉昕 方積乾 凌莉 陳雄飛 黨容.基於預報效果的ARIMA模型篩選[J].中國衛生統計,2004,21(1):6~
[36]顏傑 李彩霞 方積乾 丁守鑾.完全隨機設計兩組t檢驗與秩和檢驗的功效比較[J].中國衛生統計,2004,21(1):10~
[37]劉顏 李一明 伍友春 方積乾.深圳市居民對社區衛生服務需求及相關因素研究[J].中國初級衛生保健,2004,18(10):41~
[38]孫希鳳 郝元濤 方積乾.老年人生存質量量表條目的初步篩選[J].中國心理衛生雜志,2004,18(7):455~
[39]李彩霞 黎培興 關永源 方積乾.單離子通道潛在信號的閾值[J].數理醫葯學雜志,2004,17(4):294~
[40]劉鳳斌 方積乾 王建華.中醫葯臨床療效評價的探討[J].中葯新葯與臨床葯理,2004,15(4):290~
[41]劉顏 李一明 伍友春 方積乾.深圳市居民對社區衛生服務的認識程度及影響因素研究[J].中國行為醫學科學,2004,13(5):576~
[42]趙利 劉鳳斌 梁國輝 方積乾 林麗珠 陳金泉.中華生存質量量表的理論結構模型研製探討[J].中國臨床康復,2004,8(16):3132~
[43]金華 何春 方積乾.可交換條件下的結構回歸模型[J].中山大學學報:自然科學版,2003,42(3):4~
[44]黎培興 李彩霞 方積乾 關永源.單離子通道的隱馬氏模型與狀態的還原[J].中山大學學報:自然科學版,2003,42(2):9~
[45]方積乾 宇傳華.第十三講 如何處理隨訪資料[J].中華預防醫學雜志,2003,37(1):63~
[46]王心旺 楊哲 劉淑霞 方積乾.廣東省居民健康期望壽命研究[J].中山大學學報:醫學科學版,2003,24(3):F002~
[47]王心旺 方積乾.健康-疾病負擔測量與醫療保險精算方法研究[J].中山大學學報論叢,2003,23(6):1~
[48]凌莉 方積乾.三級醫院病人就診流向探討[J].中國醫院管理,2003,23(3):11~
[49]孫希鳳 方積乾.老年人生存質量的影響因素[J].中華老年醫學雜志,2003,22(8):508~
[50]陳雄飛 董曉梅 汪寧 方積乾.多因子共線性的主成分logistic回歸分析[J].中國衛生統計,2003,20(4):212~
[51]郝元濤 方積乾.證實性因子分析在量表等價性評價中的應用研究[J].中國衛生統計,2003,20(3):130~
[52]張晉昕 方積乾 趙曉華 陳雄飛 凌莉.醫學時間序列譜分析中的日歷因素及修正方法[J].中華醫院管理雜志,2003,19(11):690~
[53]倪濤洋 黎黎 劉顏 方積乾 關永源.時間序列數據記憶性的判別方法[J].生物數學學報,2003,18(4):502~
[54]何春 方積乾.可交換條件下多維結構回歸模型總體平均處理效應的估計[J].生物數學學報,2003,18(3):321~
[55]許宗利 方淯靖 方積乾.多元性狀同胞對連鎖分析方法及其在原發性高血壓基因定位數據中的應用[J].生物數學學報,2003,18(2):176~
[56]許宗利 方積乾.一般家系二分類性狀的貝葉斯連鎖分析方法[J].生物數學學報,2003,18(1):15~
[57]郝元濤 方積乾.生存質量測定量表等價性評價研究[J].中國行為醫學科學,2003,12(3):338~
[58]郝元濤 方積乾.結構方程模型及其在醫學中的應用研究[J].中國醫院統計,2003,10(4):240~
[59]方積乾 王顯紅.骨密度測量的統計質量控制[J].中國骨質疏鬆雜志,2003,9(3):273~
[60]許宗利 方積乾.適宜於連鎖分析文獻的Meta分析方法[J].中華預防醫學雜志,2002,36(3):196~
[61]劉鳳斌 方積乾.醫學教育與生存質量[J].現代預防醫學,2002,29(2):206~
[62]周旭毓 方積乾.Gibbs岳樣在HBV、HCV感染與肝癌關系的病例—對照研究meta分析中的應用[J].中山醫科大學學報,2002,23(3):165~
[63]凌莉 方積乾.調整資源結構後醫院的成本效益評價[J].中國衛生統計,2002,19(4):214~
[64]周旭毓 方積乾.Meta分析中隨機效應模型的Gibbs抽樣及其應用[J].中國衛生統計,2002,19(4):204~
[65]方積乾 周鳳瓊 等.試論醫院服務質量的評價與保障[J].中華醫院管理雜志,2002,18(10):630~
[66]凌莉 方積乾.衛生資源供給結構調整的方法學研究[J].中華醫院管理雜志,2002,18(6):351~
[67]鄭迎東 方積乾.含有重度缺失的多維時間序列補缺方法及其在環境監測中的應用[J].中國公共衛生,2002,18(1):118~
[68]凌莉 方積乾.世界衛生資源配置模式探討[J].衛生軟科學,2002,16(2):34~
[69]方積乾 柳青.我國惡性腫瘤篩查的問題與對策[J].中國腫瘤,2002,11(1):10~
[70]凌莉 方積乾.病人就診流向及醫療費用的變化[J].中國醫院統計,2002,9(4):219~
[71]宇傳華 方積乾.骨質疏鬆症臨床試驗設計的統計學要點及相關問題[J].中國骨質疏鬆雜志,2002,8(2):183~
[72]周旭毓 方積乾.Meta分析的常見偏倚[J].循證醫學,2002,2(4):216~
[73]方積乾.腫瘤篩查之我見[J].抗癌,2002,(2):32~
[74]高桂明 方積乾 等.腫瘤發病人數估計的分層捕獲—再捕獲方法[J].中華流行病學雜志,2001,22(3):223~
[75]金華 方積乾.因果推斷中的混雜控制[J].生物數學學報,2001,16(3):362~
[76]鄭迎東 方積乾.空氣污染與健康時間序列資料的傳遞函數模型的識別和建立[J].數理醫葯學雜志,2001,14(4):292~
[77]方積乾 郝元濤.生存質量研究的設計與實施[J].中國腫瘤,2001,10(2):69~
[78]郝元濤 方積乾.生存質量研究資料的統計分析[J].中國腫瘤,2001,10(2):72~
[79]凌莉 方積乾.腫瘤發病和死亡資料的時間趨勢分析[J].中國腫瘤,2001,10(1):24~
[80]凌莉 方積乾 等.骨密度檢測質量控制研究[J].中國骨質疏鬆雜志,2001,7(3):281~
[81]許宗利 方積乾.連鎖分析研究的Meta分析方法[J].生命科學研究,2001,5(4):308~
[82]楊哲 方積乾.廣東省衛生人力供需現狀評價[J].中國衛生統計,2000,17(4):224~
[83]萬崇華 方積乾.縱向資料分析的衍生變數法及其在生命質量資料分析中的應用[J].中華醫院管理雜志,2000,16(4):255~
[84]秦學軍 方積乾.隨機漂移亞群體等位基因頻率分布的假定及在DNA指紋數據中?…[J].生物數學學報,2000,15(2):227~
[85]金華 方積乾.空氣污染對小學生肺功能水平的個體效應估計[J].數理醫葯學雜志,2000,13(4):330~
[86]萬崇華 方積乾 等.FLIC量表用於肝癌患者生命質量測定的對比研究[J].中國行為醫學科學,2000,9(5):321~
[87]萬崇華 方積乾.WHOQOL—100量表用於葯物成癮者生命質量測定的對比研究[J].中國行為醫學科學,2000,9(4):241~
[88]方積乾 萬崇華.生存質量研究概況與測定量表[J].現代康復,2000,4(8):1123~
[89]郝元濤 方積乾.世界衛生組織生存質量測定量表中文版介紹及其使用說明[J].現代康復,2000,4(8):1127~
[90]凌莉 方積乾 劉顏 柳青 湯澤群 傅承主 楊哲 張壽生.衛生資源配置的區域分類標志值測算方法[J].中國衛生資源,2000,3(2):85~
[91]楊哲 張壽生 湯澤群 傅承主 方積乾 柳青 凌莉 劉顏.廣東省衛生人力供需現狀評價[J].中國衛生資源,2000,3(1):13~
[92]萬崇華 方積乾.生存質量作為時變協變數的Cox回歸分析及應用[J].中華預防醫學雜志,1999,33(3):143~
[93]洪明晃 方積乾.試論腫瘤「早診方法」的流行病學與臨床意義[J].中華腫瘤雜志,1999,21(1):73~
[94]方積乾 張敏瑞.醫學論文中常見統計錯誤及其糾正[J].中山醫科大學學報,1999,20(4):314~
[95]萬崇華 方積乾.縱向生命質量資料分析的Markov過程法及其應用[J].中華流行病學雜志,1999,20(3):162~
[96]趙會仁 方積乾.細胞膜K離子通道的動力學模型的參數估計[J].錦州醫學院學報,1999,20(1):27~
[97]方積乾 劉向明.離子通道門控動力學研究[J].中山醫科大學學報,1999,20(1):9~
[98]萬崇華 方積乾.縱向資料的裂區設計方差分析法及其在吸毒者生命質量評價中的應用[J].數理統計與管理,1999,18(1):1~
[99]林愛華 方積乾.兩地孕產婦產前檢查方案的成本效果比較[J].中國衛生統計,1999,16(3):157~
[100]方積乾 郝元濤.世界衛生組織生活質量量表中文版的信度與效度[J].中國心理衛生雜志,1999,13(4):203~
[101]劉顏 方積乾.農村初級衛生保健的信息管理[J].醫學信息(雲南),1999,12(8):30~
[102]孫曉武 方積乾.測量誤差非線性職業暴露效應模型參數估計的MCMC方法[J].數理醫葯學雜志,1999,12(2):110~
[103]林愛華 方積乾.兩地孕產婦產前檢查方案的成本效果比較[J].中國醫院統計,1999,6(3):148~
[104]楊哲 方積乾.廣東省醫院床位供需現狀評價[J].中國衛生事業管理,1999,(12):638~
[105]洪明晃 方積乾.腫瘤的分層分析和分層治療[J].中華腫瘤雜志,1998,20(5):373~
[106]洪明晃 方積乾.應用無復發生存率和無遠處轉移生存率進行腫瘤預後的評價:附411例鼻咽癌…[J].癌症,1998,17(2):118~
[107]秦學軍 方積乾.隨機漂移亞群體的兩種模擬結果的比較[J].生物數學學報,1998,13(3):354~
[108]劉向明 方積乾.PC12細胞鉀離子通道門控動力學隨機建模與參數估計(Ⅰ)[J].生物數學學報,1998,13(3):372~
[109]秦學軍 方積乾.亞群體DNA指紋結構的模擬及參數估計[J].數理醫葯學雜志,1998,11(3):229~
[110]萬崇華 方積乾.MOS SF—36量表用於葯物成癮者生命質量測定的對比研究[J].中國行為醫學科學,1998,7(4):260~
[111]萬崇華 方積乾.肝癌患者生存質量測定量表的制定與考評[J].中國行為醫學科學,1998,7(3):170~
[112]萬崇華 方積乾.同一時點生命質量資料分析的TOPSIS法[J].中國醫院統計,1998,5(3):134~
[113]洪明晃 方積乾.無復發生存率和無轉移生存率在腫瘤研究中的作用[J].中華腫瘤雜志,1997,19(3):239~
[114]方積乾 柳青.醫學研究生統計課程綜合改革探討[J].中國衛生統計,1997,14(6):55~
[115]柳青 方積乾.鼻咽癌疾病自然史的隨機模型研究[J].中國衛生統計,1997,14(4):12~
[116]史明麗 方積乾.模糊綜合評價法在社區人群生存質量評價中的應用[J].中國衛生統計,1997,14(4):28~
[117]萬崇華 方積乾.葯物成癮者生存質量測定量表的制定及其考評[J].中國行為醫學科學,1997,6(3):169~
[118]方積乾 劉向明 劉士光 胡性本.離子通道門控動力學的隨機建模[J].自然雜志,1997,(2):86~
[119]傅承主 方積乾.鼻咽癌篩查資料中無發病數據的分析方法探討[J].中國衛生統計,1996,13(6):32~
[120]方積乾 廖瑞端.成對相依資料的回歸方法[J].中國衛生統計,1996,13(4):1~
[121]劉向明 方積乾.離子通道開放狀態檢測法的計算機模擬研究(Ⅰ)[J].生物數學學報,1996,11(2):60~
[122]方積乾 陳和年.醫學研究中logistic回歸模型的正確應用(二)[J].中國衛生統計,1993,10(5):61~
[123]方積乾 陳和年.醫學研究中logistic回歸模型的正確應用(一)[J].中國衛生統計,1993,10(4):54~
㈧ 衛生統計學學習指導與習題集的作者簡介
方積乾教授,1939年7月6日生於上海,祖籍浙江鎮海。1961年獲復旦大學數學學士學位,1982年至1985年在加利福尼亞大學伯克利分校,師從蔣慶琅教授,研究生命現象的隨機過程模型,獲生物統計學博士。1985年在北京醫科大學由講師直接提升為教授。1991年至今,中山醫科大學(現為中山大學)公共衛生學院教授、主任、博士導師。國際生物統計學會中國組負責人;中國衛生統計學會副會長、廣東省衛生統計學會會長。
曾在英國肯特大學、澳大利亞國立大學講學,1993以來,任香港中文大學兼職教授。
二、主要著述
曾主編國家規劃教材《數理統計方法》和《高等數學》,主編第一本醫學計算機中文專著《電子計算機及其在醫學中的應用》,主編的醫學研究生教材《醫學統計學與電腦實驗》被列為教育部推薦教材,主編的《現代醫學統計學》受華夏英才基金資助,並由人民衛生出版社(2002)、InternationalSciencePress(2003)分別以中英文出版,主編的全國統編教材《衛生統計學(第五版)》於2003年由人民衛生出版社出版。
三、主要成果
序貫判別分析方法和多狀態生存分析的成果曾獲北京市和衛生部科技進步獎。曾先後主持國家自然科學基金課題《生命現象的隨機模型》和《離子通道門控動力學研究》、博士點基金課題《多狀態模型的Bootstrap研究》和《生存質量資料的統計分析方法》、國家「七五」攻關課題《適應於腫瘤預防研究的生物統計學理論與技術》(衛生部科技進步獎)、廣東省自然科學基金課題《細胞膜單離子通道的門控動力系統研究》和《空氣污染對健康損害的研究》以及與世界衛生組織合作課題《中國人生存質量的測定與應用》(國家統計局科研成果二等獎)等。現正主持國家自然科學基金課題《復雜性狀基因定位數據連鎖分析方法的研究》。
四、已發表論文
[1]黃瑋俊李彩霞拉布周雁黎培興胡彬普布卓瑪格桑卓嘎方積乾王一鳴.藏族人群15號染色體中心粒區域基因的高精度連鎖不平衡和單體型圖譜及其與漢族人群的比較[J].科學通報,2006,51(3):283~
[2]王蓓高海蓮劉雪琴郝元濤馮桂蘭方積乾.WHO生存質量量表老年模塊在我國前列腺增生症患者中的適用性研究[J].中華護理雜志,2006,41(8):687~
[3]凌莉劉軍韓璐唐廣心方積乾.廣州市農村流動人口衛生服務需求與利用分析[J].華南預防醫學,2006,32(2):1~
[4]王心旺方積乾.廣東省居民健康、傷殘、死亡三者間的量效關系研究[J].中國老年學雜志,2006,26(4):445~
[5]郝元濤方積乾宋心遠朱淑明吳少敏.非線性因子分析模型參數估計研究[J].中國衛生統計,2006,23(2):108~
[6]王心旺方積乾.基於混合正態模型的糖尿病住院病人醫療保險設計[J].中國衛生統計,2006,23(2):118~
[7]李彩霞黎培興方積乾.傳遞不平衡的對稱性檢驗的適用性[J].中國衛生統計,2006,23(1):16~
[8]顏傑相麗馳方積乾.灰色預測模型及SAS實現[J].中國衛生統計,2006,23(1):75~
[9]何春方積乾.極大似然估計和擬極大似然估計模擬之比較[J].廣東工業大學學報,2006,23(1):114~
[10]郝元濤方積乾PowerMJ吳少敏朱淑明.WHO生存質量評估簡表的等價性評價[J].中國心理衛生雜志,2006,20(2):71~
[11]劉清海方積乾.醫學期刊統計學誤用現狀、趨勢與對策[J].中國科技期刊研究,2006,17(4):549~
[12]趙利劉鳳斌梁國輝陳金泉方積乾.中華生存質量量表的信度和效度[J].中國臨床康復,2006,10(8):1~
[13]王心旺方積乾.基於分類風險模型的最優獎懲系統設計及在特定疾病保險中的應用[J].中國自然醫學雜志,2006,8(3):185~
[14]麥勁壯李河方積乾劉小清饒栩栩.Meta分析中失安全系數的估計[J].循證醫學,2006,6(5):297~
[15]李彩霞黎培興方積乾.家系數據緊密連鎖位點的單體型頻率估計[J].中山大學學報:自然科學版,2005,44(3):9~
[16]凌莉劉軍韓璐唐廣心方積乾.廣州市流動人口的衛生服務需求與利用[J].中華預防醫學雜志,2005,39(6):395~
[17]王心旺楊哲方積乾.廣東省衛生行業科學研究與試驗發展投入產出效益分析[J].廣州醫學院學報,2005,33(1):9~
[18]萬崇華方積乾湯學良張燦珍盧玉波孟瓊高麗.SF-36量表用於肝癌患者生活質量測定的效果評價[J].腫瘤,2005,25(5):492~
[19]李彩霞黎培興關永源方積乾.離子通道的混合密度參數估計與狀態判別[J].數理統計與管理,2005,24(6):62~
[20]顏傑黨容方積乾.配對設計兩組多分類頻數分布的比較方法[J].中國衛生統計,2005,22(5):306~
[21]顏傑謝薇方積乾.SPSS中隨機抽樣的精確實現[J].中國衛生統計,2005,22(4):255~
[22]匡莉方積乾徐淑一.醫院規模經濟與成本函數研究進展[J].國外醫學:衛生經濟分冊,2005,22(3):111~
[23]金華方積乾.多維協變數具有測量誤差的結構回歸模型[J].生物數學學報,2005,20(1):77~
[24]劉清海方積乾.醫學論文統計學報告指南的綜述與思考[J].中國科技期刊研究,2005,16(4):448~
[25]黃瑋俊李彩霞陳素琴孫健冬周雁方積乾王一鳴.中國漢族人群15號染色體中心粒區域5個基因的高精度單倍型及單倍型域構建[J].科學通報,2004,49(7):649~
[26]李彩霞黎培興關永源方積乾.單離子通道潛在信號的馬氏距離判別[J].中山大學學報:自然科學版,2004,43(3):111~
[27]王心旺劉淑霞方積乾.健康期望壽命的綜合評價[J].廣州醫學院學報,2004,32(4):29~
[28]王心旺楊哲方積乾.糖尿病保險費精算模型研究[J].廣州醫學院學報,2004,32(3):7~
[29]王心旺楊哲方積乾.廣東省居民6種疾病負擔研究[J].廣州醫學院學報,2004,32(2):21~
[30]杜勇李幼姬李彩霞郭輝JosephCKLeungManFLam楊念生黃鋒先方積乾PatrickHMaxweⅡ黎嘉能王一鳴.Uteroglobin基因G38A多態性與IgA腎病相關關系[J].中山大學學報:醫學科學版,2004,25(3):200~
[31]趙利陳金泉梁國輝劉鳳斌方積乾.因子分析法在生存質量測定量表研製中的應用[J].中國中西醫結合雜志,2004,24(11):965~
[32]郝元濤孫希鳳方積乾吳少敏朱淑明.量表條目篩選的統計學方法研究[J].中國衛生統計,2004,21(4):209~
[33]何春方積乾.多維平均處理效應極大似然估計的模擬研究[J].廣東工業大學學報,2004,21(4):97~
[34]顏傑李彩霞曾芳芳方積乾.如何控制SAS結果的輸出[J].中國衛生統計,2004,21(2):119~
[35]張晉昕方積乾凌莉陳雄飛黨容.基於預報效果的ARIMA模型篩選[J].中國衛生統計,2004,21(1):6~
[36]顏傑李彩霞方積乾丁守鑾.完全隨機設計兩組t檢驗與秩和檢驗的功效比較[J].中國衛生統計,2004,21(1):10~
[37]劉顏李一明伍友春方積乾.深圳市居民對社區衛生服務需求及相關因素研究[J].中國初級衛生保健,2004,18(10):41~
[38]孫希鳳郝元濤方積乾.老年人生存質量量表條目的初步篩選[J].中國心理衛生雜志,2004,18(7):455~
[39]李彩霞黎培興關永源方積乾.單離子通道潛在信號的閾值[J].數理醫葯學雜志,2004,17(4):294~
[40]劉鳳斌方積乾王建華.中醫葯臨床療效評價的探討[J].中葯新葯與臨床葯理,2004,15(4):290~
[41]劉顏李一明伍友春方積乾.深圳市居民對社區衛生服務的認識程度及影響因素研究[J].中國行為醫學科學,2004,13(5):576~
[42]趙利劉鳳斌梁國輝方積乾林麗珠陳金泉.中華生存質量量表的理論結構模型研製探討[J].中國臨床康復,2004,8(16):3132~
[43]金華何春方積乾.可交換條件下的結構回歸模型[J].中山大學學報:自然科學版,2003,42(3):4~
[44]黎培興李彩霞方積乾關永源.單離子通道的隱馬氏模型與狀態的還原[J].中山大學學報:自然科學版,2003,42(2):9~
[45]方積乾宇傳華.第十三講如何處理隨訪資料[J].中華預防醫學雜志,2003,37(1):63~
[46]王心旺楊哲劉淑霞方積乾.廣東省居民健康期望壽命研究[J].中山大學學報:醫學科學版,2003,24(3):F002~
[47]王心旺方積乾.健康-疾病負擔測量與醫療保險精算方法研究[J].中山大學學報論叢,2003,23(6):1~
[48]凌莉方積乾.三級醫院病人就診流向探討[J].中國醫院管理,2003,23(3):11~
[49]孫希鳳方積乾.老年人生存質量的影響因素[J].中華老年醫學雜志,2003,22(8):508~
[50]陳雄飛董曉梅汪寧方積乾.多因子共線性的主成分logistic回歸分析[J].中國衛生統計,2003,20(4):212~
[51]郝元濤方積乾.證實性因子分析在量表等價性評價中的應用研究[J].中國衛生統計,2003,20(3):130~
[52]張晉昕方積乾趙曉華陳雄飛凌莉.醫學時間序列譜分析中的日歷因素及修正方法[J].中華醫院管理雜志,2003,19(11):690~
[53]倪濤洋黎黎劉顏方積乾關永源.時間序列數據記憶性的判別方法[J].生物數學學報,2003,18(4):502~
[54]何春方積乾.可交換條件下多維結構回歸模型總體平均處理效應的估計[J].生物數學學報,2003,18(3):321~
[55]許宗利方淯靖方積乾.多元性狀同胞對連鎖分析方法及其在原發性高血壓基因定位數據中的應用[J].生物數學學報,2003,18(2):176~
[56]許宗利方積乾.一般家系二分類性狀的貝葉斯連鎖分析方法[J].生物數學學報,2003,18(1):15~
[57]郝元濤方積乾.生存質量測定量表等價性評價研究[J].中國行為醫學科學,2003,12(3):338~
[58]郝元濤方積乾.結構方程模型及其在醫學中的應用研究[J].中國醫院統計,2003,10(4):240~
[59]方積乾王顯紅.骨密度測量的統計質量控制[J].中國骨質疏鬆雜志,2003,9(3):273~
[60]許宗利方積乾.適宜於連鎖分析文獻的Meta分析方法[J].中華預防醫學雜志,2002,36(3):196~
[61]劉鳳斌方積乾.醫學教育與生存質量[J].現代預防醫學,2002,29(2):206~
[62]周旭毓方積乾.Gibbs岳樣在HBV、HCV感染與肝癌關系的病例—對照研究meta分析中的應用[J].中山醫科大學學報,2002,23(3):165~
[63]凌莉方積乾.調整資源結構後醫院的成本效益評價[J].中國衛生統計,2002,19(4):214~
[64]周旭毓方積乾.Meta分析中隨機效應模型的Gibbs抽樣及其應用[J].中國衛生統計,2002,19(4):204~
[65]方積乾周鳳瓊等.試論醫院服務質量的評價與保障[J].中華醫院管理雜志,2002,18(10):630~
[66]凌莉方積乾.衛生資源供給結構調整的方法學研究[J].中華醫院管理雜志,2002,18(6):351~
[67]鄭迎東方積乾.含有重度缺失的多維時間序列補缺方法及其在環境監測中的應用[J].中國公共衛生,2002,18(1):118~
[68]凌莉方積乾.世界衛生資源配置模式探討[J].衛生軟科學,2002,16(2):34~
[69]方積乾柳青.我國惡性腫瘤篩查的問題與對策[J].中國腫瘤,2002,11(1):10~
[70]凌莉方積乾.病人就診流向及醫療費用的變化[J].中國醫院統計,2002,9(4):219~
[71]宇傳華方積乾.骨質疏鬆症臨床試驗設計的統計學要點及相關問題[J].中國骨質疏鬆雜志,2002,8(2):183~
[72]周旭毓方積乾.Meta分析的常見偏倚[J].循證醫學,2002,2(4):216~
[73]方積乾.腫瘤篩查之我見[J].抗癌,2002,(2):32~
[74]高桂明方積乾等.腫瘤發病人數估計的分層捕獲—再捕獲方法[J].中華流行病學雜志,2001,22(3):223~
[75]金華方積乾.因果推斷中的混雜控制[J].生物數學學報,2001,16(3):362~
[76]鄭迎東方積乾.空氣污染與健康時間序列資料的傳遞函數模型的識別和建立[J].數理醫葯學雜志,2001,14(4):292~
[77]方積乾郝元濤.生存質量研究的設計與實施[J].中國腫瘤,2001,10(2):69~
[78]郝元濤方積乾.生存質量研究資料的統計分析[J].中國腫瘤,2001,10(2):72~
[79]凌莉方積乾.腫瘤發病和死亡資料的時間趨勢分析[J].中國腫瘤,2001,10(1):24~
[80]凌莉方積乾等.骨密度檢測質量控制研究[J].中國骨質疏鬆雜志,2001,7(3):281~
[81]許宗利方積乾.連鎖分析研究的Meta分析方法[J].生命科學研究,2001,5(4):308~
[82]楊哲方積乾.廣東省衛生人力供需現狀評價[J].中國衛生統計,2000,17(4):224~
[83]萬崇華方積乾.縱向資料分析的衍生變數法及其在生命質量資料分析中的應用[J].中華醫院管理雜志,2000,16(4):255~
[84]秦學軍方積乾.隨機漂移亞群體等位基因頻率分布的假定及在DNA指紋數據中?…[J].生物數學學報,2000,15(2):227~
[85]金華方積乾.空氣污染對小學生肺功能水平的個體效應估計[J].數理醫葯學雜志,2000,13(4):330~
[86]萬崇華方積乾等.FLIC量表用於肝癌患者生命質量測定的對比研究[J].中國行為醫學科學,2000,9(5):321~
[87]萬崇華方積乾.WHOQOL—100量表用於葯物成癮者生命質量測定的對比研究[J].中國行為醫學科學,2000,9(4):241~
[88]方積乾萬崇華.生存質量研究概況與測定量表[J].現代康復,2000,4(8):1123~
[89]郝元濤方積乾.世界衛生組織生存質量測定量表中文版介紹及其使用說明[J].現代康復,2000,4(8):1127~
[90]凌莉方積乾劉顏柳青湯澤群傅承主楊哲張壽生.衛生資源配置的區域分類標志值測算方法[J].中國衛生資源,2000,3(2):85~
[91]楊哲張壽生湯澤群傅承主方積乾柳青凌莉劉顏.廣東省衛生人力供需現狀評價[J].中國衛生資源,2000,3(1):13~
[92]萬崇華方積乾.生存質量作為時變協變數的Cox回歸分析及應用[J].中華預防醫學雜志,1999,33(3):143~
[93]洪明晃方積乾.試論腫瘤「早診方法」的流行病學與臨床意義[J].中華腫瘤雜志,1999,21(1):73~
[94]方積乾張敏瑞.近期醫學論文中常見統計錯誤及其糾正[J].中山醫科大學學報,1999,20(4):314~
[95]萬崇華方積乾.縱向生命質量資料分析的Markov過程法及其應用[J].中華流行病學雜志,1999,20(3):162~
[96]趙會仁方積乾.細胞膜K離子通道的動力學模型的參數估計[J].錦州醫學院學報,1999,20(1):27~
[97]方積乾劉向明.離子通道門控動力學研究[J].中山醫科大學學報,1999,20(1):9~
[98]萬崇華方積乾.縱向資料的裂區設計方差分析法及其在吸毒者生命質量評價中的應用[J].數理統計與管理,1999,18(1):1~
[99]林愛華方積乾.兩地孕產婦產前檢查方案的成本效果比較[J].中國衛生統計,1999,16(3):157~
[100]方積乾郝元濤.世界衛生組織生活質量量表中文版的信度與效度[J].中國心理衛生雜志,1999,13(4):203~
[101]劉顏方積乾.農村初級衛生保健的信息管理[J].醫學信息(雲南),1999,12(8):30~
[102]孫曉武方積乾.測量誤差非線性職業暴露效應模型參數估計的MCMC方法[J].數理醫葯學雜志,1999,12(2):110~
[103]林愛華方積乾.兩地孕產婦產前檢查方案的成本效果比較[J].中國醫院統計,1999,6(3):148~
[104]楊哲方積乾.廣東省醫院床位供需現狀評價[J].中國衛生事業管理,1999,(12):638~
[105]洪明晃方積乾.腫瘤的分層分析和分層治療[J].中華腫瘤雜志,1998,20(5):373~
[106]洪明晃方積乾.應用無復發生存率和無遠處轉移生存率進行腫瘤預後的評價:附411例鼻咽癌…[J].癌症,1998,17(2):118~
[107]秦學軍方積乾.隨機漂移亞群體的兩種模擬結果的比較[J].生物數學學報,1998,13(3):354~
[108]劉向明方積乾.PC12細胞鉀離子通道門控動力學隨機建模與參數估計(Ⅰ)[J].生物數學學報,1998,13(3):372~
[109]秦學軍方積乾.亞群體DNA指紋結構的模擬及參數估計[J].數理醫葯學雜志,1998,11(3):229~
[110]萬崇華方積乾.MOSSF—36量表用於葯物成癮者生命質量測定的對比研究[J].中國行為醫學科學,1998,7(4):260~
[111]萬崇華方積乾.肝癌患者生存質量測定量表的制定與考評[J].中國行為醫學科學,1998,7(3):170~
[112]萬崇華方積乾.同一時點生命質量資料分析的TOPSIS法[J].中國醫院統計,1998,5(3):134~
[113]洪明晃方積乾.無復發生存率和無轉移生存率在腫瘤研究中的作用[J].中華腫瘤雜志,1997,19(3):239~
[114]方積乾柳青.醫學研究生統計課程綜合改革探討[J].中國衛生統計,1997,14(6):55~
[115]柳青方積乾.鼻咽癌疾病自然史的隨機模型研究[J].中國衛生統計,1997,14(4):12~
[116]史明麗方積乾.模糊綜合評價法在社區人群生存質量評價中的應用[J].中國衛生統計,1997,14(4):28~
[117]萬崇華方積乾.葯物成癮者生存質量測定量表的制定及其考評[J].中國行為醫學科學,1997,6(3):169~
[118]方積乾劉向明劉士光胡性本.離子通道門控動力學的隨機建模[J].自然雜志,1997,(2):86~
[119]傅承主方積乾.鼻咽癌篩查資料中無發病數據的分析方法探討[J].中國衛生統計,1996,13(6):32~
[120]方積乾廖瑞端.成對相依資料的回歸方法[J].中國衛生統計,1996,13(4):1~
[121]劉向明方積乾.離子通道開放狀態檢測法的計算機模擬研究(Ⅰ)[J].生物數學學報,1996,11(2):60~
[122]方積乾陳和年.醫學研究中logistic回歸模型的正確應用(二)[J].中國衛生統計,1993,10(5):61~
[123]方積乾陳和年.醫學研究中logistic回歸模型的正確應用(一)[J].中國衛生統計,1993,10(4):54~
㈨ 統計學方法有哪些
一、描述統計
描述統計是通過圖表或數學方法,對數據資料進行整理、分析,並對數據的分布狀態、數字特徵和隨機變數之間關系進行估計和描述的方法。描述統計分為集中趨勢分析和離中趨勢分析和相關分析三大部分。
集中趨勢分析:集中趨勢分析主要靠平均數、中數、眾數等統計指標來表示數據的集中趨勢。例如被試的平均成績多少?是正偏分布還是負偏分布?
離中趨勢分析:離中趨勢分析主要靠全距、四分差、平均差、方差(協方差:用來度量兩個隨機變數關系的統計量)、標准差等統計指標來研究數據的離中趨勢。例如,我們想知道兩個教學班的語文成績中,哪個班級內的成績分布更分散,就可以用兩個班級的四分差或百分點來比較。
相關分析:相關分析探討數據之間是否具有統計學上的關聯性。這種關系既包括兩個數據之間的單一相關關系——如年齡與個人領域空間之間的關系,也包括多個數據之間的多重相關關系——如年齡、抑鬱症發生率、個人領域空間之間的關系;既包括A大B就大(小),A小B就小(大)的直線相關關系,也可以是復雜相關關系(A=Y-B*X);既可以是A、B變數同時增大這種正相關關系,也可以是A變數增大時B變數減小這種負相關,還包括兩變數共同變化的緊密程度——即相關系數。實際上,相關關系唯一不研究的數據關系,就是數據協同變化的內在根據——即因果關系。獲得相關系數有什麼用呢?簡而言之,有了相關系數,就可以根據回歸方程,進行A變數到B變數的估算,這就是所謂的回歸分析,因此,相關分析是一種完整的統計研究方法,它貫穿於提出假設,數據研究,數據分析,數據研究的始終。
例如,我們想知道對監獄情景進行什麼改造,可以降低囚徒的暴力傾向。我們就需要將不同的囚舍顏色基調、囚舍綠化程度、囚室人口密度、放風時間、探視時間進行排列組合,然後讓每個囚室一種實驗處理,然後用因素分析法找出與囚徒暴力傾向的相關系數最高的因素。假定這一因素為囚室人口密度,我們又要將被試隨機分入不同人口密度的十幾個囚室中生活,繼而得到人口密度和暴力傾向兩組變數(即我們討論過的A、B兩列變數)。然後,我們將人口密度排入X軸,將暴力傾向分排入Y軸,獲得了一個很有價值的圖表,當某典獄長想知道,某囚舍擴建到N人/間囚室,暴力傾向能降低多少。我們可以當前人口密度和改建後人口密度帶入相應的回歸方程,算出擴建前的預期暴力傾向和擴建後的預期暴力傾向,兩數據之差即典獄長想知道的結果。
推論統計:
推論統計是統計學乃至於心理統計學中較為年輕的一部分內容。它以統計結果為依據,來證明或推翻某個命題。具體來說,就是通過分析樣本與樣本分布的差異,來估算樣本與總體、同一樣本的前後測成績差異,樣本與樣本的成績差距、總體與總體的成績差距是否具有顯著性差異。例如,我們想研究教育背景是否會影響人的智力測驗成績。可以找100名24歲大學畢業生和100名24歲初中畢業生。採集他們的一些智力測驗成績。用推論統計方法進行數據處理,最後會得出類似這樣兒的結論:「研究發現,大學畢業生組的成績顯著高於初中畢業生組的成績,二者在0.01水平上具有顯著性差異,說明大學畢業生的一些智力測驗成績優於中學畢業生組。」
其中,如果用EXCEL 來求描述統計。其方法是:工具-載入宏-勾選"分析工具庫",然後關閉Excel然後重新打開,工具菜單就會出現"數據分析"。描述統計是「數據分析」內一個子菜單,在做的時候,記得要把方格輸入正確。最好直接點選。
2、正態性檢驗:很多統計方法都要求數值服從或近似服從正態分布,所以之前需要進行正態性檢驗。常用方法:非參數檢驗的K-量檢驗、P-P圖、Q-Q圖、W檢驗、動差法。
二、假設檢驗
1、參數檢驗
參數檢驗是在已知總體分布的條件下(一股要求總體服從正態分布)對一些主要的參數(如均值、百分數、方差、相關系數等)進行的檢驗。
1)U驗 :使用條件:當樣本含量n較大時,樣本值符合正態分布
2)T檢驗 使用條件:當樣本含量n較小時,樣本值符合正態分布
A 單樣本t檢驗:推斷該樣本來自的總體均數μ與已知的某一總體均數μ0 (常為理論值或標准值)有無差別;
B 配對樣本t檢驗:當總體均數未知時,且兩個樣本可以配對,同對中的兩者在可能會影響處理效果的各種條件方面扱為相似;
C 兩獨立樣本t檢驗:無法找到在各方面極為相似的兩樣本作配對比較時使用。
2、非參數檢驗
非參數檢驗則不考慮總體分布是否已知,常常也不是針對總體參數,而是針對總體的某些一股性假設(如總體分布的位罝是否相同,總體分布是否正態)進行檢驗。
適用情況:順序類型的數據資料,這類數據的分布形態一般是未知的。
A 雖然是連續數據,但總體分布形態未知或者非正態;
B 體分布雖然正態,數據也是連續類型,但樣本容量極小,如10以下;
主要方法包括:卡方檢驗、秩和檢驗、二項檢驗、遊程檢驗、K-量檢驗等。
三、信度分析
介紹:信度(Reliability)即可靠性,它是指採用同樣的方法對同一對象重復測量時所得結果的一致性程度。信度指標多以相關系數表示,大致可分為三類:穩定系數(跨時間的一致性),等值系數(跨形式的一致性)和內在一致性系數(跨項目的一致性)。信度分析的方法主要有以下四種:重測信度法、復本信度法、折半信度法、α信度系數法。
方法:(1)重測信度法編輯:這一方法是用同樣的問卷對同一組被調查者間隔一定時間重復施測,計算兩次施測結果的相關系數。顯然,重測信度屬於穩定系數。重測信度法特別適用於事實式問卷,如性別、出生年月等在兩次施測中不應有任何差異,大多數被調查者的興趣、愛好、習慣等在短時間內也不會有十分明顯的變化。如果沒有突發事件導致被調查者的態度、意見突變,這種方法也適用於態度、意見式問卷。由於重測信度法需要對同一樣本試測兩次,被調查者容易受到各種事件、活動和他人的影響,而且間隔時間長短也有一定限制,因此在實施中有一定困難。
(2)復本信度法編輯:讓同一組被調查者一次填答兩份問卷復本,計算兩個復本的相關系數。復本信度屬於等值系數。復本信度法要求兩個復本除表述方式不同外,在內容、格式、難度和對應題項的提問方向等方面要完全一致,而在實際調查中,很難使調查問卷達到這種要求,因此採用這種方法者較少。
(3)折半信度法編輯:折半信度法是將調查項目分為兩半,計算兩半得分的相關系數,進而估計整個量表的信度。折半信度屬於內在一致性系數,測量的是兩半題項得分間的一致性。這種方法一般不適用於事實式問卷(如年齡與性別無法相比),常用於態度、意見式問卷的信度分析。在問卷調查中,態度測量最常見的形式是5級李克特(Likert)量表(李克特量表(Likert scale)是屬評分加總式量表最常用的一種,屬同一構念的這些項目是用加總方式來計分,單獨或個別項目是無意義的。它是由美國社會心理學家李克特於1932年在原有的總加量表基礎上改進而成的。該量表由一組陳述組成,每一陳述有"非常同意"、"同意"、"不一定"、"不同意"、"非常不同意"五種回答,分別記為5、4、3、2、1,每個被調查者的態度總分就是他對各道題的回答所得分數的加總,這一總分可說明他的態度強弱或他在這一量表上的不同狀態。)。進行折半信度分析時,如果量表中含有反意題項,應先將反意題項的得分作逆向處理,以保證各題項得分方向的一致性,然後將全部題項按奇偶或前後分為盡可能相等的兩半,計算二者的相關系數(rhh,即半個量表的信度系數),最後用斯皮爾曼-布朗(Spearman-Brown)公式:求出整個量表的信度系數(ru)。
(4)α信度系數法編輯:Cronbach
α信度系數是目前最常用的信度系數,其公式為:
α=(k/(k-1))*(1-(∑Si^2)/ST^2)
其中,K為量表中題項的總數, Si^2為第i題得分的題內方差, ST^2為全部題項總得分的方差。從公式中可以看出,α系數評價的是量表中各題項得分間的一致性,屬於內在一致性系數。這種方法適用於態度、意見式問卷(量表)的信度分析。
總量表的信度系數最好在0.8以上,0.7-0.8之間可以接受;分量表的信度系數最好在0.7以上,0.6-0.7還可以接受。Cronbach 's alpha系數如果在0.6以下就要考慮重新編問卷。
檢査測量的可信度,例如調查問卷的真實性。
分類:
1、外在信度:不同時間測量時量表的一致性程度,常用方法重測信度
2、內在信度;每個量表是否測量到單一的概念,同時組成兩表的內在體項一致性如何,常用方法分半信度。
四、列聯表分析
列聯表是觀測數據按兩個或更多屬性(定性變數)分類時所列出的頻數表。
簡介:一般,若總體中的個體可按兩個屬性A、B分類,A有r個等級A1,A2,…,Ar,B有c個等級B1,B2,…,Bc,從總體中抽取大小為n的樣本,設其中有nij個個體的屬性屬於等級Ai和Bj,nij稱為頻數,將r×c個nij排列為一個r行c列的二維列聯表,簡稱r×c表。若所考慮的屬性多於兩個,也可按類似的方式作出列聯表,稱為多維列聯表。
列聯表又稱交互分類表,所謂交互分類,是指同時依據兩個變數的值,將所研究的個案分類。交互分類的目的是將兩變數分組,然後比較各組的分布狀況,以尋找變數間的關系。
用於分析離散變數或定型變數之間是否存在相關。
列聯表分析的基本問題是,判明所考察的各屬性之間有無關聯,即是否獨立。如在前例中,問題是:一個人是否色盲與其性別是否有關?在r×с表中,若以pi、pj和pij分別表示總體中的個體屬於等級Ai,屬於等級Bj和同時屬於Ai、Bj的概率(pi,pj稱邊緣概率,pij稱格概率),「A、B兩屬性無關聯」的假設可以表述為H0:pij=pi·pj,(i=1,2,…,r;j=1,2,…,с),未知參數pij、pi、pj的最大似然估計(見點估計)分別為行和及列和(統稱邊緣和)
為樣本大小。根據K.皮爾森(1904)的擬合優度檢驗或似然比檢驗(見假設檢驗),當h0成立,且一切pi>0和pj>0時,統計量的漸近分布是自由度為(r-1)(с-1) 的Ⅹ分布,式中Eij=(ni·nj)/n稱為期望頻數。當n足夠大,且表中各格的Eij都不太小時,可以據此對h0作檢驗:若Ⅹ值足夠大,就拒絕假設h0,即認為A與B有關聯。在前面的色覺問題中,曾按此檢驗,判定出性別與色覺之間存在某種關聯。
需要注意:
若樣本大小n不很大,則上述基於漸近分布的方法就不適用。對此,在四格表情形,R.A.費希爾(1935)提出了一種適用於所有n的精確檢驗法。其思想是在固定各邊緣和的條件下,根據超幾何分布(見概率分布),可以計算觀測頻數出現任意一種特定排列的條件概率。把實際出現的觀測頻數排列,以及比它呈現更多關聯跡象的所有可能排列的條件概率都算出來並相加,若所得結果小於給定的顯著性水平,則判定所考慮的兩個屬性存在關聯,從而拒絕h0。
對於二維表,可進行卡方檢驗,對於三維表,可作Mentel-Hanszel分層分析。
列聯表分析還包括配對計數資料的卡方檢驗、行列均為順序變數的相關檢驗。
五、相關分析
研究現象之間是否存在某種依存關系,對具體有依存關系的現象探討相關方向及相關程度。
1、單相關: 兩個因素之間的相關關系叫單相關,即研究時只涉及一個自變數和一個因變數;
2、復相關 :三個或三個以上因素的相關關系叫復相關,即研究時涉及兩個或兩個以上的自變數和因變數相關;
3、偏相關:在某一現象與多種現象相關的場合,當假定其他變數不變時,其中兩個變數之間的相關關系稱為偏相關。
六、方差分析
使用條件:各樣本須是相互獨立的隨機樣本;各樣本來自正態分布總體;各總體方差相等。
分類
1、單因素方差分析:一項試驗只有一個影響因素,或者存在多個影響因素時,只分析一個因素與響應變數的關系
2、多因素有交互方差分析:一頊實驗有多個影響因素,分析多個影響因素與響應變數的關系,同時考慮多個影響因素之間的關系
3、多因素無交互方差分析:分析多個影響因素與響應變數的關系,但是影響因素之間沒有影響關系或忽略影響關系
4、協方差分祈:傳統的方差分析存在明顯的弊端,無法控制分析中存在的某些隨機因素,使之影響了分祈結果的准確度。協方差分析主要是在排除了協變數的影響後再對修正後的主效應進行方差分析,是將線性回歸與方差分析結合起來的一種分析方法,
七、回歸分析
分類:
1、一元線性回歸分析:只有一個自變數X與因變數Y有關,X與Y都必須是連續型變數,因變數y或其殘差必須服從正態分布。
2、多元線性回歸分析
使用條件:分析多個自變數與因變數Y的關系,X與Y都必須是連續型變數,因變數y或其殘差必須服從正態分布 。
1)變呈篩選方式:選擇最優回歸方程的變里篩選法包括全橫型法(CP法)、逐步回歸法,向前引入法和向後剔除法
2)橫型診斷方法:
A 殘差檢驗: 觀測值與估計值的差值要艱從正態分布
B 強影響點判斷:尋找方式一般分為標准誤差法、Mahalanobis距離法
C 共線性診斷:
• 診斷方式:容忍度、方差擴大因子法(又稱膨脹系數VIF)、特徵根判定法、條件指針CI、方差比例
• 處理方法:增加樣本容量或選取另外的回歸如主成分回歸、嶺回歸等
3、Logistic回歸分析
線性回歸模型要求因變數是連續的正態分布變里,且自變數和因變數呈線性關系,而Logistic回歸模型對因變數的分布沒有要求,一般用於因變數是離散時的情況
分類:
Logistic回歸模型有條件與非條件之分,條件Logistic回歸模型和非條件Logistic回歸模型的區別在於參數的估計是否用到了條件概率。
4、其他回歸方法 非線性回歸、有序回歸、Probit回歸、加權回歸等
八、聚類分析
聚類與分類的不同在於,聚類所要求劃分的類是未知的。
聚類是將數據分類到不同的類或者簇這樣的一個過程,所以同一個簇中的對象有很大的相似性,而不同簇間的對象有很大的相異性。
從統計學的觀點看,聚類分析是通過數據建模簡化數據的一種方法。傳統的統計聚類分析方法包括系統聚類法、分解法、加入法、動態聚類法、有序樣品聚類、有重疊聚類和模糊聚類等。採用k-均值、k-中心點等演算法的聚類分析工具已被加入到許多著名的統計分析軟體包中,如SPSS、SAS等。
從機器學習的角度講,簇相當於隱藏模式。聚類是搜索簇的無監督學習過程。與分類不同,無監督學習不依賴預先定義的類或帶類標記的訓練實例,需要由聚類學習演算法自動確定標記,而分類學習的實例或數據對象有類別標記。聚類是觀察式學習,而不是示例式的學習。
聚類分析是一種探索性的分析,在分類的過程中,人們不必事先給出一個分類的標准,聚類分析能夠從樣本數據出發,自動進行分類。聚類分析所使用方法的不同,常常會得到不同的結論。不同研究者對於同一組數據進行聚類分析,所得到的聚類數未必一致。
從實際應用的角度看,聚類分析是數據挖掘的主要任務之一。而且聚類能夠作為一個獨立的工具獲得數據的分布狀況,觀察每一簇數據的特徵,集中對特定的聚簇集合作進一步地分析。聚類分析還可以作為其他演算法(如分類和定性歸納演算法)的預處理步驟。
定義:
依據研究對象(樣品或指標)的特徵,對其進行分類的方法,減少研究對象的數目。
各類事物缺乏可靠的歷史資料,無法確定共有多少類別,目的是將性質相近事物歸入一類。
各指標之間具有一定的相關關系。
聚類分析(cluster
analysis)是一組將研究對象分為相對同質的群組(clusters)的統計分析技術。聚類分析區別於分類分析(classification
analysis) ,後者是有監督的學習。
變數類型:定類變數、定量(離散和連續)變數
樣本個體或指標變數按其具有的特性進行分類,尋找合理的度量事物相似性的統計量。
1、性質分類:
Q型聚類分析:對樣本進行分類處理,又稱樣本聚類分祈使用距離系數作為統計量衡量相似度,如歐式距離、極端距離、絕對距離等
R型聚類分析:對指標進行分類處理,又稱指標聚類分析使用相似系數作為統計量衡量相似度,相關系數、列聯系數等
2、方法分類:
1)系統聚類法:適用於小樣本的樣本聚類或指標聚類,一般用系統聚類法來聚類指標,又稱分層聚類
2)逐步聚類法:適用於大樣本的樣本聚類
3)其他聚類法:兩步聚類、K均值聚類等
九、判別分析
1、判別分析:根據已掌握的一批分類明確的樣品建立判別函數,使產生錯判的事例最少,進而對給定的一個新樣品,判斷它來自哪個總體
2、與聚類分析區別
1)聚類分析可以對樣本逬行分類,也可以對指標進行分類;而判別分析只能對樣本
2)聚類分析事先不知道事物的類別,也不知道分幾類;而判別分析必須事先知道事物的類別,也知道分幾類
3)聚類分析不需要分類的歷史資料,而直接對樣本進行分類;而判別分析需要分類歷史資料去建立判別函數,然後才能對樣本進行分類
3、進行分類 :
1)Fisher判別分析法 :
以距離為判別准則來分類,即樣本與哪個類的距離最短就分到哪一類,適用於兩類判別;
以概率為判別准則來分類,即樣本屬於哪一類的概率最大就分到哪一類,適用於
適用於多類判別。
2)BAYES判別分析法 :
BAYES判別分析法比FISHER判別分析法更加完善和先進,它不僅能解決多類判別分析,而且分析時考慮了數據的分布狀態,所以一般較多使用;
十、主成分分析
介紹:主成分分析(Principal
Component Analysis,PCA), 是一種統計方法。通過正交變換將一組可能存在相關性的變數轉換為一組線性不相關的變數,轉換後的這組變數叫主成分。
在實際課題中,為了全面分析問題,往往提出很多與此有關的變數(或因素),因為每個變數都在不同程度上反映這個課題的某些信息。
主成分分析首先是由K.皮爾森(Karl Pearson)對非隨機變數引入的,爾後H.霍特林將此方法推廣到隨機向量的情形。信息的大小通常用離差平方和或方差來衡量。
將彼此梠關的一組指標變適轉化為彼此獨立的一組新的指標變數,並用其中較少的幾個新指標變數就能綜合反應原多個指標變數中所包含的主要信息。
原理:在用統計分析方法研究多變數的課題時,變數個數太多就會增加課題的復雜性。人們自然希望變數個數較少而得到的信息較多。在很多情形,變數之間是有一定的相關關系的,當兩個變數之間有一定相關關系時,可以解釋為這兩個變數反映此課題的信息有一定的重疊。主成分分析是對於原先提出的所有變數,將重復的變數(關系緊密的變數)刪去多餘,建立盡可能少的新變數,使得這些新變數是兩兩不相關的,而且這些新變數在反映課題的信息方面盡可能保持原有的信息。
設法將原來變數重新組合成一組新的互相無關的幾個綜合變數,同時根據實際需要從中可以取出幾個較少的綜合變數盡可能多地反映原來變數的信息的統計方法叫做主成分分析或稱主分量分析,也是數學上用來降維的一種方法。
缺點: 1、在主成分分析中,我們首先應保證所提取的前幾個主成分的累計貢獻率達到一個較高的水平(即變數降維後的信息量須保持在一個較高水平上),其次對這些被提取的主成分必須都能夠給出符合實際背景和意義的解釋(否則主成分將空有信息量而無實際含義)。
2、主成分的解釋其含義一般多少帶有點模糊性,不像原始變數的含義那麼清楚、確切,這是變數降維過程中不得不付出的代價。因此,提取的主成分個數m通常應明顯小於原始變數個數p(除非p本身較小),否則維數降低的「利」可能抵不過主成分含義不如原始變數清楚的「弊」。
十一、因子分析
一種旨在尋找隱藏在多變數數據中、無法直接觀察到卻影響或支配可測變數的潛在因子、並估計潛在因子對可測變數的影響程度以及潛在因子之間的相關性的一種多元統計分析方法
與主成分分析比較:
相同:都能夠起到治理多個原始變數內在結構關系的作用
不同:主成分分析重在綜合原始變適的信息.而因子分析重在解釋原始變數間的關系,是比主成分分析更深入的一種多元統計方法
用途:
1)減少分析變數個數
2)通過對變數間相關關系探測,將原始變數進行分類
十二、時間序列分析
動態數據處理的統計方法,研究隨機數據序列所遵從的統計規律,以用於解決實際問題;時間序列通常由4種要素組成:趨勢、季節變動、循環波動和不規則波動。
主要方法:移動平均濾波與指數平滑法、ARIMA橫型、量ARIMA橫型、ARIMAX模型、向呈自回歸橫型、ARCH族模型
時間序列是指同一變數按事件發生的先後順序排列起來的一組觀察值或記錄值。構成時間序列的要素有兩個:其一是時間,其二是與時間相對應的變數水平。實際數據的時間序列能夠展示研究對象在一定時期內的發展變化趨勢與規律,因而可以從時間序列中找出變數變化的特徵、趨勢以及發展規律,從而對變數的未來變化進行有效地預測。
時間序列的變動形態一般分為四種:長期趨勢變動,季節變動,循環變動,不規則變動。
時間序列預測法的應用:
系統描述:根據對系統進行觀測得到的時間序列數據,用曲線擬合方法對系統進行客觀的描述;
系統分析:當觀測值取自兩個以上變數時,可用一個時間序列中的變化去說明另一個時間序列中的變化,從而深入了解給定時間序列產生的機理;
預測未來:一般用ARMA模型擬合時間序列,預測該時間序列未來值;
決策和控制:根據時間序列模型可調整輸入變數使系統發展過程保持在目標值上,即預測到過程要偏離目標時便可進行必要的控制。
特點:
假定事物的過去趨勢會延伸到未來;
預測所依據的數據具有不規則性;
撇開了市場發展之間的因果關系。
①時間序列分析預測法是根據市場過去的變化趨勢預測未來的發展,它的前提是假定事物的過去會同樣延續到未來。事物的現實是歷史發展的結果,而事物的未來又是現實的延伸,事物的過去和未來是有聯系的。市場預測的時間序列分析法,正是根據客觀事物發展的這種連續規律性,運用過去的歷史數據,通過統計分析,進一步推測市場未來的發展趨勢。市場預測中,事物的過去會同樣延續到未來,其意思是說,市場未來不會發生突然跳躍式變化,而是漸進變化的。
時間序列分析預測法的哲學依據,是唯物辯證法中的基本觀點,即認為一切事物都是發展變化的,事物的發展變化在時間上具有連續性,市場現象也是這樣。市場現象過去和現在的發展變化規律和發展水平,會影響到市場現象未來的發展變化規律和規模水平;市場現象未來的變化規律和水平,是市場現象過去和現在變化規律和發展水平的結果。
需要指出,由於事物的發展不僅有連續性的特點,而且又是復雜多樣的。因此,在應用時間序列分析法進行市場預測時應注意市場現象未來發展變化規律和發展水平,不一定與其歷史和現在的發展變化規律完全一致。隨著市場現象的發展,它還會出現一些新的特點。因此,在時間序列分析預測中,決不能機械地按市場現象過去和現在的規律向外延伸。必須要研究分析市場現象變化的新特點,新表現,並且將這些新特點和新表現充分考慮在預測值內。這樣才能對市場現象做出既延續其歷史變化規律,又符合其現實表現的可靠的預測結果。
②時間序列分析預測法突出了時間因素在預測中的作用,暫不考慮外界具體因素的影響。時間序列在時間序列分析預測法處於核心位置,沒有時間序列,就沒有這一方法的存在。雖然,預測對象的發展變化是受很多因素影響的。但是,運用時間序列分析進行量的預測,實際上將所有的影響因素歸結到時間這一因素上,只承認所有影響因素的綜合作用,並在未來對預測對象仍然起作用,並未去分析探討預測對象和影響因素之間的因果關系。因此,為了求得能反映市場未來發展變化的精確預測值,在運用時間序列分析法進行預測時,必須將量的分析方法和質的分析方法結合起來,從質的方面充分研究各種因素與市場的關系,在充分分析研究影響市場變化的各種因素的基礎上確定預測值。
需要指出的是,時間序列預測法因突出時間序列暫不考慮外界因素影響,因而存在著預測誤差的缺陷,當遇到外界發生較大變化,往往會有較大偏差,時間序列預測法對於中短期預測的效果要比長期預測的效果好。因為客觀事物,尤其是經濟現象,在一個較長時間內發生外界因素變化的可能性加大,它們對市場經濟現象必定要產生重大影響。如果出現這種情況,進行預測時,只考慮時間因素不考慮外界因素對預測對象的影響,其預測結果就會與實際狀況嚴重不符。