導航:首頁 > 方法技巧 > 文獻如何選擇合適的統計方法

文獻如何選擇合適的統計方法

發布時間:2023-04-29 05:06:39

㈠ 衡量文獻的統計方法是否正確

衡量文獻的統計桐帆方法有三種統局指雹計方式,分別是計量資料的統計方法,計數資料的統計方法,等級資料的統計方法。統計資料豐富且錯綜復雜,要想做到合理選用統計分析方法並非易事。對於同一個資料,若選擇不同的統計分析方法處理,有時逗肆其結論是截然不同的。

㈡ 文獻研究方法有哪幾種

文獻研究方法有三種,分別是內容分析法、文獻計量法、文獻研究法。其中內容分析法指的是一種系統、客觀、能對明確的傳播內容進行定量描述的研究方法。文獻計量法指的是藉助文獻各種特徵的數量,採用數學與統計學方法來描述、評價和預測科學技術的現狀與發展趨勢的定量分析方法。文獻研究法指的是搜集、整理、鑒別文獻,並通過對文獻的研究形成對事實的科學認識的方法。

文獻研究法主要優點:

1、文獻法超越了時間、空間限制,通過對古今中外文獻進行調查可以研究極其廣泛的社會情況。這一優點是其他調查方法不可能具有的。

2、文獻法主要是書面調查,如果搜集的文獻是真實的,那麼它就能夠獲得比口頭調查更准確、更可靠的信息。避免了口頭調查可能出現的種種記錄誤差。

3、文獻法是一種間接的、非介入性調查。它只對各種文獻進行調查和研究,而不與被調查者接觸,不介入被調查者的任何反應。這就避免了直接調查中經常發生的調查者與被調查者互動過程中可能產生的種種反應性誤差。

4、文獻法是一種非常方便、自由、安全的調查方法。文獻調查受外界制約較少,只要找到了必要文獻就可以隨時隨地進行研究;即使出現了錯誤,還可通過再次研究進行彌補。

5、文獻法省時、省錢、效率高。文獻調查是在前人和他人勞動成果基礎上進行的調查,是獲取知識的捷徑。它不需要大量研究人員,不需要特殊設備,可以用比較少的人力、經費和時間,獲得比其他調查方法更多的信息。因而,它是一種高效率的調查方法。

怎麼進行文獻分析

文獻分析是要弄清被分析文獻「究竟講什麼」,以便給予檢索標識。一般分兩步:(1)先找出文獻論述的對象,再進一步查明是要論述該對象哪個方面的具體問題;(2)先找出文獻中涉及的各種概念,再進一步查明它們之間的關系,從而形成若幹完整的主題。從一篇文獻分析出的主題數量可以是多個。
由於文獻分析法和內容分析法有共同的對象,都不與文獻中記載的人與事直接接觸,因此,都稱為非接觸性研究方法。
內容分析法則通過對文獻的定量分析,統計描述來實現對事實的科學認識。二者的區別是分析的重點與分析的手段上有所不同。
操作流程
主要包括以下兩個階段::
確定來源
通過瀏覽文獻的篇名、目次、摘要、引言、結論以至正文,對文獻內容作調查;
信息來源包括內部信息和外部信息。
(1)內部信息包括《員工手冊》、《公司管理制度》、《職位職責說明》、《績效評價》、《會議記錄》、《作業流程說明》、《ISO質量文件》、《分權手冊》、《工作環境描述》、《員工生產記錄》、《工作計劃》、《設備材料使用與管理制度》、《作業指導書》等。
(2)外部信息主要指其他企業工作分析的結果,這些資料可以為本企業的工作分析提供參照。為了保證所收集到的信息有較強的適用性,在收集信息的時候應該注意兩點:第一,目標企業應該與本企業在性質上或者行業上具有較高的相似性;第二,目標職位應該與本企業典型職位有較高的相似性。

㈣ 臨床研究中統計方法的選擇

目錄

例子1:假設檢驗及臨床優效性檢驗
一研究者宣布找到一種治療某病的新葯,試驗結果如下,問:該新葯是否值得推廣?

例子2:分析中混雜因素的控制
英國某年全人口統計資料如下,矛盾:移民組的發病率在各個年齡組均高於英格蘭和威爾士組,為什麼它的合計發病率反而低?

例子3:假設檢驗及判別診斷
為鑒別胃癌、胃炎、非胃病患者,各測定了50名患者的銅蘭蛋白等指標,其中銅蘭蛋白的觀察結果如下,問:三種人的銅蘭蛋白有無不同?能否根據測定的銅蘭蛋白數據對患者進行初步診斷?

例子4:影響因素篩選-回歸分析
研究心肌梗死患者預後的的影響因素,以是否發生心性死亡作為觀察結果指標,對116名心梗患者的22個可能影響預後的因素進行觀察和記錄。

結局指標:心性死亡
預後因素:年齡、性別、高血壓病、心梗位置、心梗分級、傳導阻滯、溶栓治療,……等

問:哪些預後因素與發生心性死亡有關系?關系的強度如何

【瑞麟】研究目的(4)+設計類型(4)+數據類型(3)+數據特徵(4)→統計方法

——↑瑞麟總結——

醫學統計分析方法選擇的核心三要素(3-5-3)

"方法看變數、設計看類型、目的定乾坤"

「大怕踢、二怕鏢、老三怕剪刀」
老大指數值型變數、老二指等級變數、老三指無序分類變數

大怕踢:T(腳踢)、F(旋風腿)
數值型變數一般選用t檢驗(兩組變數)、方差分析(3組及以上資料)

二怕鏢:非參數(飛鏢)
等級變數一般選用非參數檢驗

老三怕剪刀:卡方(剪刀)
無序分類變數一般選用卡方檢驗

統計指標、統計圖或統計表
如,均數、中位數、標准差、百分比、頻數分布等

參數估計、假設檢驗
估計總體參數、95%可信區間

對幾組資料進行差異性檢驗
假設檢驗方法,如,t檢驗、卡方檢驗、方差分析、秩和檢驗等

研究某因素與另一因素的依存關系
探討變數之間的關系及影響大小
具體說,探討自變數(影響因素)對應變數(結果變數)的影響大小
多變數分析方法
如,線性相關、線性回歸、Logistic回歸、Cox回歸、生存分析等。

最常見,最易實施的實驗設計方案
將研究對象隨機分配到幾個組,然後做實驗

將具有相似特徵的研究對象配成對子,然後再將每個對子的對象隨機分配到兩個組進行實驗
常見形式:同源配對(如樣品一分為二);異源配對(按性別、體重、年齡進行配對);自身前後配對(試驗前後的對比)

同時研究多個實驗因素對結果的影響
例如,研究葯物劑量(3mg、6mg)及給葯方式(口服、肌注)對結果的影響,每種組合均需要做試驗(3mg+口服,3mg+肌注,6mg+口服,6mg+肌注)

同一對象在不同時間點上進行某個指標的觀測,以分析該指標在時間上的變化。
【瑞麟疑問】如只進行兩個時間點上的測量,是否與自身前後配對的設計相同?

每一個觀察對象都有一個數值,且大小差異有意義。
例如,血紅蛋白(g/L)、住院天數、產前檢查次數、住院費用等。

數值變數資料的描述

論文中最常用的組合

以比代率,即誤將構成比(proportion)當作率(rate)來描述某病發生的強度和頻率。

把各種不同的率相混淆,如把患病率與發病率、死亡率與病死率等概念混同。

指類別或屬性間無順序、程度之分。
例如,性別(男、女)為二分類、血型(A、B、AB、O)為多分類。

指類別間存在著次序,或程度上的差異。
例如,治療效果(無效、好轉、顯效、治癒)、實驗室檢驗(-、+、++、+++)

分類變數資料的描述:通常需要描述各個類別的頻數及頻率(百分比)

任何統計方法都有自己的適用條件,只有當某個或某些條件滿足時,統計計算公式才成立。

適用條件可根據 數據特徵 來判斷

數值變數資料的描述:通過繪制直方圖可以直觀了解數據的分布

研究中,右偏態分布更常見,如住院時間、住院費用、病程等;左偏態分布較少見,如考生成績有時呈左偏態分布。

R語言中如何進行頻數分布直方圖

得到的圖表如下

方差是否齊同(相等)
粗略判斷:兩組標准差之比在2.5倍以上,就得警惕方差不齊

假設檢驗是反證法原理的統計應用

假設兩個樣本均數可能來源於同一總體,然後計算出在此假設下的某個統計量的大小,當這個統計量在其分布中的概率較小時(如p≤0.05)我們就拒絕其假設,而接受其對立假設,認為兩樣本分別來自不同的總體。

1)當p≤α時,做出「拒絕其無差別的假設,可認為各總體間有差別」的結論時就有可能犯錯誤,這類錯誤稱為第一類錯誤(type I error)。其犯錯誤的概率用α表示,若α取0.05,此時犯I型錯誤的概率≤0.05,若假設檢驗的p值比0.05越小,犯第一類錯誤的概率就越小。

2)當p>α時,做出「不拒絕其無差別的假設,還不能認為各總體間有差別」的結論時就有可能犯第二類錯誤(type II error)。其犯錯誤的概念用β表示,通常β為未知數,但假設檢驗p值越大,犯第二類錯誤的概率就越小。

計量資料 的假設檢驗:t檢驗、F檢驗(方差分析)、Z檢驗、秩和檢驗(Wilcoxon秩和檢驗、H檢驗、Friedman檢驗)等。

計數資料 的假設檢驗:卡方檢驗、Z檢驗(瑞麟疑問:z檢驗即u檢驗?)

等級資料 的假設檢驗:秩和檢驗(Wilcoxon秩和檢驗、H檢驗、Friedman檢驗)

單個自變數資料

兩個或以上自變數資料

兩組比較:t檢驗、u檢驗、兩組秩和檢驗、四格表和較正四格表的卡方檢驗等

多組比較:方差分析、多組秩和檢驗、行×列卡方檢驗等。

差異分析/數據資料的比較,是同一指標在不同處理間的比較。

臨床研究中,經常需要分析某些因素與疾病之間的關系,探討疾病的危險因素。

注意,相關關系並不等於因果關系。

前瞻性研究:相對危險度(RR)、歸因危險度(AR)
回顧性研究:比值比(OR)

參數檢驗:積矩相關系數(Pearson's sγ)
非參數檢驗:Spearman等級相關系數

1)確定金標准
診斷性試驗的金標准(gold standard)是指當前臨床醫師公認的診斷疾病最可靠的方法,也稱為標准診斷。應用金標准可以正確區分「有病」和「無病」。

擬評價的診斷性試驗對疾病的診斷,必須有金標准為依據,所謂金標准包括活檢、手術發現、細菌培養、屍檢、特殊檢查和影像診斷,以及長期隨訪的結果。

2)選擇研究對象
診斷性試驗的研究對象,應當包括兩組:一組是用金標准確診「有病」的病例組,另一組是用金標准證實為「無病」的患者,稱為對照組。所謂「無病」的患者,是指沒有金標准診斷的目標疾病,而不是完全無病的正常人。

病例組應包括各型病例:如典型和不典型的,早、中與晚期病例,輕、中與重型的,有和無並發症者等,以便使診斷性試驗的結果更具有臨床實用價值。

對照組可選用金標准證實沒有目標疾病的其他病例,特別是與該病容易混淆的病例,以期明確其鑒別診斷價值。正常人一般不宜納入對照組。

3)盲法比較診斷性試驗與金標準的結果
評價診斷性試驗時,採用盲法具有十分重要的意義,即要求判斷試驗結果的人,不能預先知道該病例用金標准劃分為「有病」還是「無病」,以免發生疑診偏倚。

新的診斷性試驗,對疾病的診斷結果應當與金標准診斷的結果進行同步對比,並且列出格表,以便進一步評估,其方法如下:
①用金標准診斷為「有病」的病例數為a+c;
②上述「有病」的病例經診斷性試驗檢測,結果陽性者為a,陰性者為c;
③金標准診斷「無病」的倒數為b+d,其中經診斷性試驗檢測陽性者為b,陰性者為d;
④列出四格表,將a,b,c,d的倒數分別填入下列四格表。

敏感度(sensitivity, SN)是正確診斷的真陽性病例在中風組中所佔的百分率,計算公式為為:SN=a/(a+c)×100%

特異度(specificity, SP)是正確診斷的真陰性部分所佔百分率,計算公式為:SP=d/(b+d)×100%

准確性(accuracy,AC)反映了診斷試驗結果與金標准試驗結果的符合或一致程度,計算公式為:AC = (a+d)/N

陽性預測值(positive predictive value,PPV)是診斷試驗為陽性結果中金標准證實患中風者所佔的百分率,計算公式為: PPV = a/(a+b)×100%

陰性預測值(negative predictive value,NPV)是診斷試驗為陰性結果中金標准證實未患中風者所佔的百分率,計算公式為:NPV = d/(c+d)×100% .

陽性似然比(positive likelihood ratio, LR+)為患中風組真陽性率和未患中風組假陽性率的比值,計算公式為:LR+ =SN/(1-SP) ,表明診斷性試驗為陽性時患病於不患病的比值,比值越大則患病的概率越大.

陰性似然比(negative likelihood ratio, LR-)為患中風組假陰性率與未患中風真陰性率的比值,計算公式為:LR- =(1-SN)/SP,表明診斷試驗為陰性時,患病與不患病時機會的比值.

1)ROC曲線
ROC曲線(receiver operator characteeristic curve)又稱受試者工作特徵曲線,在診斷性試驗中,用於正常值臨界點的選擇,對臨床實驗室工作尤為重要.

診斷資料可以按資料的等級或性質歸納成2X2表(四格表)或行列表。一般地說,如果診斷資料本身為二值變數,即診斷的結果為陽性和陰性,則歸納成四格表最合理。如果診斷資料為等級或連續變數,歸納成四格表就會造成信息的浪費,所以,最好將資料歸納成行列表,這樣可以最大限度地利用信息。

如果診斷實驗的資料為連續變數,可以將資料按一定的等級分級,歸納成行列表進行分析。

像這樣的行列表,我們可以將其分割成表3形式的四格表,分別計算各指標,計算的結果見表3。

由表3可見,靈敏度和假陽性率隨界值的降低而生高,但特異度則隨界值的降低而降低。根據這樣的關系,我們可以用假陽性率為橫坐標,靈敏度為縱坐標做ROC曲線,見下圖。

曲線左上角靈敏度是1.0(100%),假陽性率是0,即所有的病人全部被確診,所有無病者都不會誤診。距左上角距離越近的曲線實驗效果越好;
在ROC曲線上,靠坐上角距離最近的界點作為界值最好。(Q:為什麼?)
在左上角處(靈敏度+特異度)/2的值最大,可以根據此及實際工作的需要來確定具體診斷實驗的界值。
用ROC曲線可以比較不同診斷實驗的優劣(Q:解釋理由)。

2)似然比的臨床應用
似然比(likelihood ratio)是診斷試驗綜合評價的理想指標,它綜合了敏感度與特異度的臨床意義,而且可依據試驗結果的陽性或陰性,計算患病的概率,便於在診斷試驗檢測後,更確切地對患者作出診斷.
真陽性率越高,則陽性似然比越大.

參考文獻:
1. 《臨床研究中統計方法的選擇》 ,(微信公眾號)臨床科研與meta分析,2015-12-18
2.武松 《SPSS中級統計實戰教程》之《醫學統計方法選擇秘籍(5秒判讀法)》 (丁香園公開課),2018-3-6
3.雞小販. 臨床科研中如何選擇統計學方法(PPT) . 網路文庫.2014-3-13

㈤ 醫學文獻中數據相關性分析用什麼統計方法

兩個變數之間的相關關系可以通過計算變數間的相關系數,來衡量它們之間相關關系的強弱,不用類型的變數,SPSS應用不同的相關系數來判定。兩個定距或定比變數,用Pearson相關系數;兩個定序或定類變數,用Spearman等級相關系數和Kendall等級相關系數

㈥ 醫學科研中常用的統計學方法有哪些

正確的統計學分析一定要建立在明確的研究目的和研究設計的基礎之上,那些事先沒有研究目的和研究設計,事後找來一堆數據進行統計分析都是不可取的。 在醫學論文的撰、編、審、讀過程中經常遇到的問題是研究的題目與課題設計、論文內容不符,包括文章的方法解決不了論文的目的、文章的結果說明不了論文的題目、文章的討論偏離了論文的主題;還有是目的不明確、設計不合理。如題目過小,論文不夠字數,而一些無關緊要的變數指標或結果被分析被討論;又如題目過大,論文的全部內容不足以說明研究的目的,使論文的論點難以立足。 所以,合理明確的論文題目或目的以及研究設計方案是撰、編、審、讀者應當關注的首要問題。此外,樣本含量是否滿足,抽樣是否隨機,偏倚是否控制等,也是不可忽視的問題。

2、建好分析用的資料庫

建好資料庫是正確統計分析的前提和基礎,甚至決定了論文分析結果的成敗。對於編、審、讀者來講,一般由於篇幅的限制,往往得不到資料庫數據,而只有作者在資料庫數據基礎上經統計描述計算後給出的諸如各指標均數 x、標准差 s 或中位數 M、百分位數 Px 的「二手」數據,或將研究對象小或特徵屬性分組,清點各組觀察單位出現的個數或頻數的頻數表數據等。 無論是否能夠得到資料庫數據,作者在統計分析過程中一定依據資料庫數據進行計算,得出結果。如果對「二手」數據或頻數表數據的結果等存在疑惑,編輯、審稿專家或讀者有權要求作者提供資料庫數據以檢查其完整性、准確性和真實性,確保研究數據的質量。假若在投稿須知中對資料庫數據作出必要的要求,無疑對於保證刊物的發表質量有著積極的意義

㈦ 如何在臨床科研中選用正確的統計分析方法

統計學方法的正確抉擇
一。
統計方法抉擇的條件
在臨床科研工作中,正確地抉擇統計分析方法,應充分考慮科研工作者的分析目的、臨床科研設計方法、搜集到的數據資料類型、數據資料的分布特徵與所涉及的數理統計條件等。
其中任何一個問題沒考慮到或考慮有誤,都有可能導致統計分析方法的抉擇失誤。
此外,統計分析方法的抉擇應在科研的設計階段來完成,而不應該在臨床試驗結束或在數據的收集工作已完成之後。
對臨床科研數據進行統計分析和進行統計方法抉擇時,應考慮下列因素:
1.分析目的
對於臨床醫生及臨床流行病醫生來說,在進行統計分析前,一定要明確利用統計方法達到研究者的什麼目的。
一般來說,統計方法可分為描述與推斷兩類方法。
一是統計描述(descriptivestatistics),二是統計推斷(inferentialstatistics)。
統計描述,即利用統計指標、統計或統計表,對數據資料所進行的最基本的統計分析,使其能反映數據資料的基本特徵,有利於研究者能准確、全面地了解數據資料所包涵的信息,以便做出科學的推斷。
統計表,如頻數表、四格表、列聯表等;
統計,如直方、餅,散點等;
統計指標,如均數、標准差、率及構成比等。
統計推斷,即利用樣本所提供的信息對總體進行推斷(估計或比較),其中包括參數估計和假設檢驗,如可信區間、t檢驗、方差分析、c2檢驗等,如要分析甲葯治療與乙葯治療兩組的療效是否不相同、不同地區某病的患病率有無差異等。
還有些統計方法,既包含了統計描述也包含了統計推斷的內容,如不同變數間的關系分析。
相關分析,可用於研究某些因素間的相互聯系,以相關系數來衡量各因素間相關的密切程度和方向,如高血脂與冠心病、慢性宮頸炎與宮頸癌等的相關分析;
回歸分析,可用於研究某個因素與另一因素(變數)的依存關系,即以一個變數去推測另一變數,如利用回歸分析建立起來的回歸方程,可由兒童的年齡推算其體重。
2.資料類型
資料類型的劃分現多採用國際通用的分類方法,將其分為兩類:數值變數(numericalvariable)資料和分類變數(categoricalvariable)資料。
數值變數是指其值是可以定量或准確測量的變數,其表現為數值大小的不同;
而分類變數是指其值是無法定量或不能測量的變數,其表現沒有數值的大小而只有互不相容的類別或屬性。
分類變數又可分為無序分類變數和有序分類變數兩小類,無序分類變數表現為沒有大小之分的屬性或類別,如:性別是兩類無序分類變數,血型是四類無序分類變數;
有序分類變數表現為各屬性或類別間有程度之分,如:臨床上某種疾病的「輕、中、重」,治療結果的「無效、顯效、好轉、治癒」。
由此可見,數值變數資料、無序分類變數資料和有序分類變數資料又可叫做計量資料、計數資料和等級資料。
資料類型的劃分與統計方法的抉擇有關,在多數情況下不同的資料類型,選擇的統計方法不一樣。
如數值變數資料的比較可選用t檢驗、u檢驗等統計方法;
而率的比較多用c2檢驗。
值得注意的是,有些臨床科研工作者,常常人為地將數值變數的結果轉化為分類變數的臨床指標,然後參與統計分析,如患者的血紅蛋白含量,研究者常用正常、輕度貧血、中度貧血和重度貧血來表示,這樣雖然照顧了臨床工作的習慣,卻損失了資料所提供的信息量。
換言之,在多數情況下,數值變數資料提供的信息量最為充分,可進行統計分析的手段也較為豐富、經典和可靠,與之相比,分類變數在這些方面都不如數值變數資料。
因此,在臨床實驗中要盡可能選擇量化的指標反映實驗效應,若確實無法定量時,才選用分類數據,通常不宜將定量數據轉變成分類數據。
3.設計方法
在眾多的臨床科研設計方法中,每一種設計方法都有與之相適應的統計方法。
在統計方法的抉擇時,必須根據不同的臨床科研設計方法來選擇相應的統計分析方法。
如果統計方法的抉擇與設計方法不一致,統計分析得到的任何結論都是錯誤的。
在常用的科研設計方法中,有成組設計(完全隨機設計)的t檢驗、配對t檢驗、成組設計(完全隨機設計)的方差分析、配伍設計(隨機區組設計)的方差分析等,都是統計方法與科研設計方法有關的佐證。
因此,應注意區分成組設計(完全隨機設計)與配對和配伍設計(隨機區組設計),在成組設計中又要注意區別兩組與多組設計。
最常見的錯誤是將配對或配伍設計(隨機區組設計)的資料當做成組設計(完全隨機設計)來處理,如配對設計的資料使用成組t檢驗、配伍設計(隨機區組設計)使用成組資料的方差分析;
或將三組及三組以上的成組設計(完全隨機設計)資料的比較採用多個t檢驗、三個或多個率的比較採用四格表的卡方檢驗來進行比較,都是典型的錯誤。
如下表:
表1常見與設計方法有關的統計方法抉擇錯誤
設計方法錯誤的統計方法正確統計方法
兩個均數的比較(成組設計、完全隨機設計)成組設計的t檢驗、成組設計的秩和檢驗
多個均數的比較(成組設計、完全隨機設計)多個成組設計的t檢驗完全隨機設計的方差分析及q檢驗、完全隨機設計的秩和檢驗及兩兩比較
數值變數的配對設計成組設計的t檢驗配對t檢驗、配對秩和檢驗
隨機區組設計(配伍設計)多個成組設計的t檢驗、完全隨機設計的方差分析隨機區組設計的方差分析及q檢驗、隨機區組設計的秩和檢驗及兩兩比較
交叉設計成組設計的t檢驗、配對t檢驗、配對秩和檢驗交叉設計的方差分析、交叉設計的秩和檢驗
4.分布特徵及數理統計條件
數理統計和概率論是統計的理論基礎。
每種統計方法都要涉及數理統計公式,而這些數理統計公式都是在一定條件下推導和建立的。
也就是說,只有當某個或某些條件滿足時,某個數理統計公式才成立,反之若不滿足條件時,就不能使用某個數理統計公式。
在數理統計公式推導和建立的條件中,涉及最多的是數據的分布特徵。
數據的分布特徵是指數據的數理統計規律,許多數理統計公式都是在特定的分布下推導和建立的。
若實際資料服從(符合)某種分布,即可使用該分布所具有的數理統計規律來分析和處理該實際資料,反之則不能。
在臨床資料的統計分析過程中,涉及得最多的分布有正態分布、偏態分布、二項分布等。
許多統計方法對資料的分布有要求,如:均數和標准差、t和u檢驗;
方差分析都要求資料服從正態分布,而中位數和四分位數間距、秩和檢驗等,可用於不服從正態分布的資料。
所以,臨床資料的統計分析過程中,應考慮資料的分布特徵,最起碼的要求是熟悉正態分布與偏態分布。
例如:在臨床科研中,許多資料的描述不考慮資料的分布特徵,而多選擇均數與標准差。
如某婦科腫瘤化療前的血象值,資料如下表:
某婦科腫瘤化療前的血象值
指標名例數均數標准差偏度系數P值峰度系數P值
血紅蛋白(g/L)98111.9918.820.1800.4590.0250.958
血小板(×109/L)98173.5887.111.3530.0001.8430.000
白細胞(×109/L)986.79302.7671.2070.0001.2020.013
從上結果可見,若只看三項指標的均數和標准差,臨床醫生也許不會懷疑有什麼問題。
但是經正態性檢驗,病人的血紅蛋白服從正態分布,而血小板和白細胞兩項指標的偏度和峰度系數均不服從正態分布(P<0.05)。
因此,描述病人的血小板和白細胞平均水平正確的指標是中位數,而其變異程度應使用四分位數間距。
除了數據的分布特徵外,有些數理統計公式還有其它一些的條件,如t檢驗和方差分析的方差齊性、卡方檢驗的理論數(T)大小等。
總之,對於臨床科研工作者來說,為正確地進行統計方法的抉擇,首先要掌握或熟悉上述影響統計方法抉擇因素;
其次,還應熟悉和了解常用統計方法的應用條件。
二。
數據資料的描述
統計描述的內容包括了統計指標、統計和表,其目的是使數據資料的基本特徵更加清晰地表達。
本節只討論統計指標的正確選用,而統計表的正確使用請參閱其他書籍。
1.數值變數資料的描述
描述數值變數資料的基本特徵有兩類指標,一是描述集中趨勢的指標,用以反映一組數據的平均水平;
二是描述離散程度的指標,用以反映一組數據的變異大小。
各指標的名稱及適用范圍等見表2。
表2描述數值變數資料的常用指標
指標名稱用途適用的資料
均數(X——)
描述一組數據的平均水平,集中位置正態分布或近似正態分布
中位數(M)與均數相同偏態分布、分布未知、兩端無界
幾何均數(G)與均數相同對數正態分布,等比資料
標准差(S)
描述一組數據的變異大小,離散程度
正態分布或近似正態分布
四分位數間距
(QU-QL)與標准差相同偏態分布、分布未知、兩端無界
極差(R)與標准差相同觀察例數相近的數值變數
變異系數(CV)與標准差相同比較幾組資料間的變異大小
從表中可看出,均數與標准差聯合使用描述正態分布或近似正態分布資料的基本特徵;
中位數與四分位數間距聯合使用描述偏態分布或未知分布資料的基本特徵。
這些描述指標應用時,最常見的錯誤是不考慮其應用條件的隨意使用,如:用均數和標准差描述偏態分布、分布未知或兩端無界的資料,這是目前在臨床研究文獻中較為普遍和典型的錯誤。

㈧ 醫學臨床試驗文獻統計方法解讀(我們需要多少樣本)

在所有的研究開始之前,我們都面臨這么一個決策。

顯然,我們做研究的資源(人力、物力、財力和時間等)都是有限的,如果我們想要研究的問題需要的穗絕數據量遠遠超出我們的能力范圍,那麼我們就面對著一個殘酷的現實:
這個研究還沒有開始,就已經註定失敗了

文獻中的確定樣本統計量的方法如下:「統計功效分析:從我們之前的研究得出,內源性骨質增加的不同分李族如組間的平均值差異為0.8毫米,每一個組別的標准差為1毫米。當我們定義檢測此差異的顯著性水平為0.05,統計功效為0.8時,每一個研究組所需的被試數量至少為20個。
所以,我們需要找到找到文獻中利用統計功效分析計算出所需樣本量的方法。

p值、顯著性水平、統計功效、統計效應等概念相互關聯。

與樣本相同或者更極端的概率,可以想像正態分布的鍾形曲線,p值代表的是包含樣本值及其右側的尾部區域(意為更極端結果)累計概率值(如為雙側檢驗,則包括左、右兩側的尾部區域)。

拒絕原假設的檢驗統計量的值集稱為拒絕域,接受原假設的值域稱為接受域。

案例請讀博客文章:
[你哪啟真的懂p值嗎]( https://www.afenxi.com/23239.html )

統計功效指的就是:如果我們感興趣的效應或差異的確存在,在給定的顯著性水平的規定下,我們能夠正確地拒絕原假設的概率。也就是不犯第二類錯誤的概率。

統計學家證明,統計功效(1-β)由這些因素決定:標准化的統計效應大小(ES)、樣本量(N)、顯著性水平。
這四個量只要知道其中任意三個,就能求出剩下的一個。因此,如果需要在開展研究之前估計所需的樣本量N,只需知道顯著性水平、1-β和ES,剩下的事情交給計算機軟體就可以完成了(如SAS、SPSS、R等都有利用功效分析來估計數據量的模塊)。
而,顯著性水平、統計功效一般都設定好了。

真實的效應大小在某種意義上說我們是永遠無法知曉的,即使經過了大量研究,我們也只能不斷接近真相。而在功效分析估計數據量時,我們連研究都還沒開始做呢,那怎麼估計呢?
最常用的估計效應大小的方法有兩種:

㈨ 文獻調查的分析方法

文獻調查所涉及的文獻種類、格式一般較多,對其整理分析是一項核心工作。基本要求是緊密圍繞調查目的,依據事先制定的分析計劃,選擇正確的統計方法和指標。這與其他調查方式獲得資料的分析方法基本一致。在此主要介紹一種將定性資料轉化為定量資料的技術,即所謂「內容分析方法」。
內容分析方法是對載於報刊雜志中有關定性類文獻給予定量分析處理的一種方式。其基本操作過程如下:
① 找出最能代表某類現象的「關鍵詞」。
② 計算出在文獻中「關鍵詞」出現的頻數、位置以及字體的面積,並給予不同的權重。例如頻數的權重為0.5;位置的權重分別為:第一版0.2,非第一版0.1;字體面積的權重為:標准3號字或更大的為0.3,4號字為0.2,5號字以下為0.1。
③ 加權平均處理。通過加權平均處理就可以比較清楚地看到各類現象所佔的重要性。

閱讀全文

與文獻如何選擇合適的統計方法相關的資料

熱點內容
404x125的簡便運算方法 瀏覽:10
水泥多孔磚砌牆方法圖片 瀏覽:705
孢穀草種植方法 瀏覽:283
萵筍青菜種植方法 瀏覽:736
前列腺增生怎麼治療方法 瀏覽:846
12伏蓄電池存電量計算方法 瀏覽:219
沖壓工36技計算方法計算實例 瀏覽:858
骨化三醇免疫治療方法 瀏覽:306
三聯療法如何服用方法 瀏覽:426
93乘43加91的簡便方法 瀏覽:393
海螺吃了頭暈有什麼方法解決 瀏覽:812
如何寫通項方法 瀏覽:674
小學生如何寫作業快的方法 瀏覽:347
衛星手機夜景拍攝方法 瀏覽:97
怎麼做瘦肚子最快方法 瀏覽:11
考場查詞典技巧和方法 瀏覽:639
魔芋水的製作方法視頻 瀏覽:493
同分母分數加減法教學方法分析 瀏覽:323
平焊單面焊雙面成型的教學方法 瀏覽:601
查詢電腦圖片有多張的方法 瀏覽:429