導航:首頁 > 研究方法 > 統計學森林圖分析方法

統計學森林圖分析方法

發布時間：2024-03-19 17:20:00

① 常用統計學方法

感知機二分類

二分類的線性分類模型，也是判別模型。
目的是求出把訓練數據進行線性劃分的分離超平面。
感知機是神經網路和支持向量機的基礎。
學習策略：極小化損失函數。損失函數對應於誤分類點到分離超平面的總距離。
基於隨機梯度下降法對損失函數的最優化演算法，有原始形式和對偶形式。

K近鄰法 K-nearest neighbor, K-NN 多分類和回歸

是一種分類和回歸方法，有監督學習。在訓練數據集中找到和新的輸入實例最接近的K個實例，這k個實例的多數類別就是這個新實例的類別。
三要素：K的選擇，距離度量，分類決策規則。
實現方法：kd樹（二叉樹）快速搜索K個最近鄰的點。
K值選擇：反映了對近似誤差和估計誤差的權衡。交叉驗證選擇最優的K值，K小，模型復雜，K大，模型簡答。

樸素貝葉斯法多分類用於NLP

樸素貝葉斯法是基於貝葉斯定理和特徵條件獨立假設的分類方法。首先學習輸入輸出的聯合概率分布，然後基於此模型，對給定的輸入x，利用貝葉斯定理求出後驗概率最大的輸出y。
後驗概率最大等價於0-1損失函數的期望風險最小化。
是典型的生成學習方法，由訓練數據求出聯合概率分布，再求出條件概率分布（後驗概率）。
概率估計方法是：極大似然估計或者貝葉斯估計。
基本假設是條件獨立性

決策樹 decision tree 多分類，回歸

是一種分類和回歸演算法。包括三個步驟：特徵選擇，決策樹生成和決策樹的修剪，常用演算法：ID3，C4.5，CART

邏輯斯地回歸和最大熵模型多分類

本質就是給線性回歸添加了對數函數
它的核心思想是，如果線性回歸的結果輸出是一個連續值，而值的范圍是無法限定的，那我們有沒有辦法把這個結果值映射為可以幫助我們判斷的結果呢。
而如果輸出結果是 (0,1) 的一個概率值，這個問題就很清楚了。我們在數學上找了一圈，還真就找著這樣一個簡單的函數了，就是很神奇的sigmoid函數(如下)：
邏輯回歸用於二分類和多分類
邏輯斯地分布是S型曲線
最大熵模型：熵最大的模型是最好的模型。
X服從均勻分布時候，熵最大
最大熵模型的學習等價於約束最優化問題。
對偶函數的極大化等價於最大熵模型的極大似然估計。
模型學習的最優化演算法有：改進的迭代尺度法IIS，梯度下降法，牛頓法，或者擬牛頓法

支持向量機二分類

線性可分支持向量機利用間隔最大化求最優分離超平面。
函數間隔

② 如何做meta-analysisi

在信息爆炸的時代，對數據的二次加工顯得尤為重要。那麼多健康類的App和網站，或多或少都在做信息二次加工的事情。在臨床科研中，meta分析則是最符合當今時代節奏的，相信所有醫生都對其有所了解，想要通過meta分析發表文章，指導臨床行為。Meta分析就是對已發表的他人文獻進行二次加工，並根據經驗和分析標准對數據進行定性和定量的合成，在不做實驗的情況下得出質量很高的科學結論。本期，小編通過解讀一篇文章，來給大家介紹下如何才能做一篇高質量的meta分析。
這篇文章於2004年發表在JAMA上，是關於維生素D和跌倒之間關系的一項研究。原文如下：
Bischoff-Ferrari, HA et.al 「Effect of vitamin D on falls: a meta-analysis」.JAMA (2004).
Meta分析總體可分為三個階段：選題和立題階段、施行階段、分析結果和報告階段。
第一階段：選題和立題
第一步：確定評價問題的創新性和必要性
（務必搜索已發表或正在進行的系統評價，以避免重復工作）
搜索常用的資料庫，包括：Medline、EMBASE等；
Cochrane 資料庫整合了Cochrane Database of Systematic Reviews，Database of Abstracts of Reviews of Effectiveness (DARE)，Health Technology Assessment Database。
在例文中，作者闡述了做這篇meta的原因如下：
1）老年人中跌倒頻發，後果嚴重；
2）維生素D可能有效，但是之前的各RCT結果不明確；
3）之前沒有做過系統評價。
如何衡量meta分析文章的質量呢？可以從以下幾個角度入手：
1. 所評價的問題是否明確，比如研究人群、干預（暴露因素）、比較組、結果和研究設計（PICOS）？
2. 搜索戰略是否合適？有沒有任何語言限制、發布狀態限制、或出版日期限制？
3. 在試驗選擇中是否採取了預防性措施以盡量減少偏差和錯誤？
4. 評估標準是否適當？
5. 在數據提取過程中是否採取了預防性措施減少偏差和錯誤？
6. 所選試驗是否有足夠的細節？
7. 數據整合方法是否恰當？各文獻間差異性是否評估？
8. 作者的結論和結果是否匹配？
9. 這個評價是否是最新的？
只有知己知彼，才能創作出高質量的meta分析的文章。
第二步：制定評價方案
先確定方法。這對降低偏倚風險非常重要（比如：不能通過結果挑選文獻等）。
在進行meta分析過程中，常規需要經歷以下步驟，且每一步都要有明確的方法：
－鎖定評價問題
－納入/排除標准
－文獻檢索策略
－對檢索到的研究進行選擇
－數據提取
－質量評估
－數據整合
－計劃傳播
鎖定評價問題已經在第一點中提及，接下去會對每一步進行分析，考慮到步驟間的交叉，所以在順序和分點上有所改變。小編也推薦參看******* 2015年11月20日的文章「在這里，學會最全的PICOS原則」。
例文根據PICOS原則，可以歸納如下：
1. 所探究的問題是：維生素D是否可以阻止老年人跌倒？
2. 研究人群：老年人；
3. 干預／暴露因素：維生素D；
4. 結果：摔倒在地；
5. 研究設計：僅包括之前發表的各RCT。
第二階段：施行階段
第一步：文獻檢索
在制定文獻檢索策略時，總體的要求就是查全和查准。
需要考慮如下幾個方面：
1. 圈定搜索資料庫（外文有：MEDLINE、the Cochrane library、醫學文摘、TOXLINE、OVID、EMBASE、ISI Web of Science、EBSCO等；國內有：維普全文VIP、CNKI、萬方資料庫）
2. 確定語言類型：包括所有英語和非英語的文獻；
3. 明確需要包含的研究類型：僅包含RCT，還是病例對照試驗，隊列研究等。
4. 明確暴露因素/治療方法
5. 篩選關鍵詞：這將直接影響文獻檢索的准確性和敏感性，也關繫到指定檢索策略。
- 關鍵詞需要根據研究問題本身來確定；
- 對於每一個關鍵詞盡量包含所有可能的表述形式；
- 可以嘗試幾種關鍵片語合以搜最合適的文獻。
6. 檢索獲取摘要和全文：其中聯系專家是一種很好的方式，不僅可以獲取全文，甚至可以詢問文獻中的細節幫助後續使用文獻。建議搜索文獻引用名單，可以增加文獻搜索的全面性。
在例文中，作者搜索了所有英語和非英語的文章，包括：Medline、Cochrane對照試驗注冊、Embase、專家、搜索文獻引用名單、在美國骨骼和礦物質研究協會中的摘要。在搜索的過程中，主要使用的醫學關鍵詞包括「vitamin D」 OR 「vitD」，「falls」 OR 「accidental falls」、「human」等。
第二步：根據納入/排除標准完成文獻選擇
總體來說，首先在計劃書中需要描述納入/排除標准，且這些標准不應該是看了搜索的文獻後制定的，而是應從評價問題出發直接得出。
在文獻篩選過程中，首先，需要由兩位研究者獨立通過對文獻的題目和摘要進行初篩，初篩後的文獻通過閱讀全文進行二次篩選，然後交叉核對篩選結果，如果有分歧則通過共同討論決定是否納入，必要時可有第三位研究者協助解決。如果文中信息不全或信息不清楚，與原始研究作者聯系獲取信息。在篩選過程中，需要記錄你每個步驟的選擇和排除原因。至於被排除的文章，則需要在靈敏度分析中進行分析。
如例文，在這個文獻中，已提前確定了納入和排除標准，包括：僅包含RCT研究，參加人群平均年齡≥60歲，排除酗酒人群、健康不穩定人群等，而所排除的研究在靈敏度分析中進行了分析。
下面的這個流程表描述了整個meta分析納入和排除的過程，這個流程表在meta分析中一般都是必要的。

第三步：資料選擇和提取
資料提取是從符合納入要求的文獻中摘錄用於系統評價的數據信息，所提取信息必須是可靠、有效、無偏的。
總體來說，在進行數據提取時必須使用數據提取表對每個研究進行數據提取，時刻記住所評價的問題以及以後的分析。有時可能需要主觀決定提取的信息，所以必須由2人獨立進行，核查過程中遇到不同之處應該通過討論解決。對於無法獲取必要信息的文獻，則應予以排除。
從提取的數據角度，需要提取相關研究的特點、結果和質量數據。
下表給出了常需要提取的一些數據類型，非常適合各位看官收藏下來在需要時進行查看。
一般信息文獻研究特點
進行數據提取的研究員
數據提取日期
文獻識別特點
- 各文獻特有編號
- 第一作者
- 文章標題
- 引用
- 出版物類型、名稱、發表年限
- 國家
- 資金來源
宗旨/目標
研究設計
納入和排除標准
分組數
樣本量
招募過程（如：隨機方法、盲法）
隨機干預的單位（如：個人還是
一組人，或者左右眼）
研究場所
研究對象的基本特點干預措施／暴露因素
研究對象在研究開始的特點，
包括：年齡、性別、種族、社會
經濟狀況、疾病特點、並發症、
診斷標准、疾病分期、病例來源
等；
各對比組的研究對象數量或平均
特點（記錄下是入組人數還是可
行人數或者隨機人數）
干預措施進行的環境
對干預／暴露因素／或者對照組
的描述（如：劑量、應用方法、
干預時間、執行者、干預方法、
理論依據等）
對co-intervention/co-exposure
的描述
健康結局或結果（outcomes）
分析或評估單位
所用統計方法
對每一個提前確定要研究的結果
o 是否在文中有報道
o 研究中對該結果的定義
o 對該結果的測量工具和方法
o 隨訪的時長以及測量
對於所有干預／暴露組以及對照組
o 每組開始參加者人數（enrolled）
o 每組在分析中包括的參加者
o 每組退出者，排除，lost to FU 人數
o 總結結果數據
> 二分法：時間和／或參加者人數
> 連續：平均值和SD
在研究中所用方法（如：intention to treat, per protocol）
研究方法結果（如：odds ratio，risk ratio, confidential interval, p-value，mean difference，CI）
如果計劃做亞組分析，則需要對每一組都提取以上信息
其他結果及任何與結果相關的詳細信息
花費
使用的資源
不良反應事件
在最後加入「備注」一欄，可以用於輸入不能填入其他欄的信息
拿例文說，就有如下圖對目標文章所提取的數據進行了總結：

第四步：納入研究的質量評價和特徵描述
完成數據提取後，就需要對所選擇的文獻進行質量評估。常常通過評價一個研究在設計、實施和分析中防止和減少系統誤差（偏倚）和隨機誤差的程度，來評價其研究質量，並以此為依據在敏感性分析、亞組分析中給以不同的權重。
評估的角度有很多，常需要包含以下領域條目：
研究設計是否與研究目的相匹配
偏倚風險
結果選擇
統計問題
報告方式
干預／暴露測量
下面，陳列一下常用的文獻質量評價工具：
1. 隨機對照試驗的質量評價工具：
Cochrane風險偏倚評估工具（最常用）、PEDro量表、Delphi清單、CASP清單、Jadad量表、Chalmers量表、CONSORT聲明（不專用，但可以用）。
2. 觀察性研究的質量評價工具：
（1）NOS量表（最常用）：病例對照研究和隊列研究；
（2）CASP清單：病例對照研究和隊列研究；
（3）JBI標准：橫斷面研究；經驗總結、案例分析及專家意見；
（4）AHRQ；
（5）Combie橫斷面研究評價工具；
（6）STROBE聲明；
（7）STREGA聲明。
3. 非隨機對照實驗性研究的質量評價工具：
MINORS條目、Reisch評價工具、TREND聲明。
4. 診斷性研究：
QUADAS工具、CASP清單、STARD聲明。
5. 動物試驗：
STAIR清單、CAMARADES清單、ARRIV指南。
在該例文中，共有三名作者獨立進行數據提取，使用已經設計好的數據領域，包括研究質量指數，評估了以下方法：隨機方法、隨機分配、雙盲等。此外，還做了靈敏度分析。
第五步：數據整合
系統評價過程中，對上述數據進行定量統計合並的流行病學方法稱為Meta分析(Meta analysis)。Meta意思是more comprehensive，即更加全面綜合。
對數據的整合分為描述性整合和定量整合：
對於描述性整合，應考慮：
• 建立干預/暴露因素是如何導致結果的假說，包括原因和適用人群；
• 初步綜合納入的研究，以文本形式或者製表和／或圖形顯示；
• 探討各研究內或各研究間的關系；
• 評估證據的穩定性；
• 評估meta分析的重要性。
對於定量整合，則可以：
1. 提高了統計檢驗的power和精度；
2. 統計結合各研究結果給出一個「平均」干預效果的合並估計值，改進對作用效應的估計；
3. 評價結果一致性，解決單個研究間的矛盾;
4. 解決以往單個研究未明確的新問題。
那麼如何進行meta分析呢？
a．異質性檢驗（齊性檢驗）
由於納入文獻存在臨床異質性、方法學異質性和統計學異質性，所以在對結果數據進行統計合並之前，首先應該進行異質性檢驗，保證現有的各獨立研究間的結果的不同僅僅是由於抽樣誤差造成的。否則，就要進入亞組分析，或取消合並。
異質性評估（Heterogeneity assessment）
異質性：除抽樣誤差外的不同性
Chi-square test for interaction (Q = x2 statistic, df =degrees of freedom)
也可以比較各亞組的點估計是否相同
若同時如何I2<50%和P≥0.1時，納入文獻被認為是同質的，採用固定效應模型（fixed effect model）分析；反之說明研究間存在實際異質性，需要查找一致性的來源，之後採用隨機效應模型（random effect model）。
如果存在較大的臨床異質性，那將無法進行meta分析，只能進行描述性整合。
在JAMA這篇文章中，用Q值來評估異質性。當p值小於0.1時，存在顯著異質性。此外，在forest plots中所有研究的95%置信區間相互之間重疊可支持不存在異質性。
b．統計合並效應量（加權合並，計算效應尺度及95％的置信區間）並進行統計推斷
通常在考慮採用哪些效應指標（effect size）時需要考慮結局指標的類型，通常兩組間比較時，如果是連續性變數用加權均數差（weighted mean difference, WMD）、標准化均數差值（standardized mean differences, SMD）表示效應大小；二分類變數則用率差（rate difference, RD）、比數比（odds ratio, OR）、相對危險度（relative risk, RR）、相對危險度降低值（relative risk rection, RRR）等來表示效應的大小。
c．圖示單個試驗的結果和合並後的結果
－森林圖（Forrest plot）

分別展示了納入的每一篇文獻的結果和合並後的結果。
－Meta-regression (Goodman et al, 2009)

d．敏感性分析：用來評估meta分析結果的穩定性
1）按研究質量評價標准從納入文獻中去除尚有爭議的研究、排除低質量的研究、早期研究、根據研究結果的分布去掉extreme10%其他已知因素不同的研究；
2）採用不同統計方法/模型；
3）根據樣本量大小進行分層分析；
4）改變納入／排除標准時，重新對同一資料進行分析時，如果觀察到合並指標點估計和區間估計的變化存在較大差異，則說明meta分析的結果不穩定。比如，當排除一篇低質量文獻時，合並指標變化很大，說明該文獻對合並指標敏感。
敏感性分析是必要的，無論是採用不同的統計模型或進行亞組分析，都可以幫助我們找到可能的偏倚來源，更加正確的理解獲得的結論。
e．通過「失安全數」的計算或採用「倒漏斗圖」對入選文獻進行潛在的發表偏倚（publication bias）的評估。
可以用stata軟體進行Begg test和 Egger test以及funnel plot進行評估。
第三階段：報告和分析結果
第一步：報告和建議
• 總結主要結果
• 判斷結果的有效性
• 判斷結果概括性
• 確定進一步研究的意義
• 確定臨床實踐和公共衛生的意義
根據Centre for Reviews and Dissemination（CRD）指南，meta分析報告的結構一般包括以下內容：
• 標題
• 內容列表
• 縮寫/術語表
• 內容提要或結構式摘要
- 背景
- 目標
- 方法（數據來源、研究的選擇、數據提取，
質量評估、數據合成）
- 結果
- 結論
• 正文
- 背景/介紹
- 研究問題
- 研究方法
o 確定研究
o 研究選擇（納入/排除標准，方法）
o 數據提取
o 質量評估
o 數據整合
- 結果
o 納入和排除研究的詳細信息
o 研究結果
o 次要分析（例如：異質性、靈敏度）
- 討論
o 主要發現的討論
o 評價的優點和弱點
o 結果的意義
> 評價中證據的長處和短處
> 影響的方向和力度
> 結果的實用性
o 啟示
- 結論
o 實踐/策略／政策／未來影響
• 致謝
• 資金來源
• 利益沖突
• 參考文獻
• 附錄
第二步：應用到實踐
讓研究更易理解
推廣到臨床實踐：診斷、預後、預防、治療
風險評估
- 評估一般或特定的因果關系
- 與其他種類的數據使用證據權重分析（例如：毒理學、模式-的動作）
- 限製法規
附Meta分析常所使用的軟體：
1. 付費軟體：CMA（ComprehensiveMeta Analysis）、Meta Win、EasyEA；
2. 免費軟體：RevMan(Review Manager)、Meta-Disc、EpiMeta、R；
3. 通用統計軟體中有Metaanalysis的程序：STATA、SAS、NCSS、WinBUGS。

閱讀全文

與統計學森林圖分析方法相關的資料

熱點內容

統計工作方法制度研究發布：2025-03-13 21:00:58 瀏覽：856

英語教學方法非常多發布：2025-03-13 20:42:50 瀏覽：240

華為手機微信自動下載的圖片在哪裡設置方法發布：2025-03-13 20:41:51 瀏覽：372

腰間盤突出最簡單的方法發布：2025-03-13 20:25:41 瀏覽：107

財務成本有哪些分類方法發布：2025-03-13 20:20:46 瀏覽：641

結婚日子不好結婚後怎麼化解方法發布：2025-03-13 20:01:57 瀏覽：82

最快速減肥有什麼方法發布：2025-03-13 19:38:09 瀏覽：611

圈套的正確操作方法發布：2025-03-13 19:31:57 瀏覽：168

簡單語法使用方法發布：2025-03-13 19:05:26 瀏覽：56

中國新冠疫情的治療方法發布：2025-03-13 19:04:52 瀏覽：485

刮北風的正確方法圖片發布：2025-03-13 19:03:35 瀏覽：880

消防水池浮球安裝方法視頻發布：2025-03-13 18:56:08 瀏覽：443

治療精神分方法發布：2025-03-13 18:43:19 瀏覽：490

女學生頭風的治療方法發布：2025-03-13 18:37:43 瀏覽：675

重心的判定簡單方法發布：2025-03-13 18:37:05 瀏覽：962

尿自動檢查的方法和技巧發布：2025-03-13 18:31:09 瀏覽：681

盆景要怎樣種植方法發布：2025-03-13 18:16:05 瀏覽：757

管道打壓連接方法發布：2025-03-13 18:03:59 瀏覽：900

喝醉之後有什麼方法不吐發布：2025-03-13 17:30:56 瀏覽：495

科比跟腱斷裂後訓練方法發布：2025-03-13 17:30:11 瀏覽：459