① 常用統計學方法
感知機 二分類
二分類的線性分類模型,也是判別模型。
目的是求出把訓練數據進行線性劃分的分離超平面。
感知機是神經網路和支持向量機的基礎。
學習策略:極小化損失函數。損失函數對應於誤分類點到分離超平面的總距離。
基於隨機梯度下降法對損失函數的最優化演算法,有原始形式和對偶形式。
K近鄰法 K-nearest neighbor, K-NN 多分類和回歸
是一種分類和回歸方法,有監督學習。在訓練數據集中找到和新的輸入實例最接近的K個實例,這k個實例的多數類別就是這個新實例的類別。
三要素:K的選擇,距離度量,分類決策規則。
實現方法:kd樹(二叉樹)快速搜索K個最近鄰的點。
K值選擇:反映了對近似誤差和估計誤差的權衡。交叉驗證選擇最優的K值,K小,模型復雜,K大,模型簡答。
樸素貝葉斯法 多分類 用於NLP
樸素貝葉斯法是基於貝葉斯定理和特徵條件獨立假設的分類方法。首先學習輸入輸出的聯合概率分布,然後基於此模型,對給定的輸入x,利用貝葉斯定理求出後驗概率最大的輸出y。
後驗概率最大等價於0-1損失函數的期望風險最小化。
是典型的生成學習方法,由訓練數據求出聯合概率分布,再求出條件概率分布(後驗概率)。
概率估計方法是:極大似然估計或者貝葉斯估計。
基本假設是條件獨立性
決策樹 decision tree 多分類,回歸
是一種分類和回歸演算法。包括三個步驟:特徵選擇,決策樹生成和決策樹的修剪,常用演算法:ID3,C4.5,CART
邏輯斯地回歸和最大熵模型 多分類
本質就是給線性回歸添加了對數函數
它的核心思想是,如果線性回歸的結果輸出是一個連續值,而值的范圍是無法限定的,那我們有沒有辦法把這個結果值映射為可以幫助我們判斷的結果呢。
而如果輸出結果是 (0,1) 的一個概率值,這個問題就很清楚了。我們在數學上找了一圈,還真就找著這樣一個簡單的函數了,就是很神奇的sigmoid函數(如下):
邏輯回歸用於二分類和多分類
邏輯斯地分布是S型曲線
最大熵模型:熵最大的模型是最好的模型。
X服從均勻分布時候,熵最大
最大熵模型的學習等價於約束最優化問題。
對偶函數的極大化等價於最大熵模型的極大似然估計。
模型學習的最優化演算法有:改進的迭代尺度法IIS,梯度下降法,牛頓法,或者擬牛頓法
支持向量機 二分類
線性可分支持向量機利用間隔最大化求最優分離超平面。
函數間隔
② 如何做meta-analysisi
在信息爆炸的時代,對數據的二次加工顯得尤為重要。那麼多健康類的App和網站,或多或少都在做信息二次加工的事情。在臨床科研中,meta分析則是最符合當今時代節奏的,相信所有醫生都對其有所了解,想要通過meta分析發表文章,指導臨床行為。Meta分析就是對已發表的他人文獻進行二次加工,並根據經驗和分析標准對數據進行定性和定量的合成,在不做實驗的情況下得出質量很高的科學結論。本期,小編通過解讀一篇文章,來給大家介紹下如何才能做一篇高質量的meta分析。
這篇文章於2004年發表在JAMA上,是關於維生素D和跌倒之間關系的一項研究。原文如下:
Bischoff-Ferrari, HA et.al 「Effect of vitamin D on falls: a meta-analysis」.JAMA (2004).
Meta分析總體可分為三個階段:選題和立題階段、施行階段、分析結果和報告階段。
第一階段:選題和立題
第一步:確定評價問題的創新性和必要性
(務必搜索已發表或正在進行的系統評價,以避免重復工作)
搜索常用的資料庫,包括:Medline、EMBASE等;
Cochrane 資料庫整合了Cochrane Database of Systematic Reviews,Database of Abstracts of Reviews of Effectiveness (DARE),Health Technology Assessment Database。
在例文中,作者闡述了做這篇meta的原因如下:
1)老年人中跌倒頻發,後果嚴重;
2)維生素D可能有效,但是之前的各RCT結果不明確;
3)之前沒有做過系統評價。
如何衡量meta分析文章的質量呢?可以從以下幾個角度入手:
1. 所評價的問題是否明確,比如研究人群、干預(暴露因素)、比較組、結果和研究設計(PICOS)?
2. 搜索戰略是否合適?有沒有任何語言限制、發布狀態限制、或出版日期限制?
3. 在試驗選擇中是否採取了預防性措施以盡量減少偏差和錯誤?
4. 評估標準是否適當?
5. 在數據提取過程中是否採取了預防性措施減少偏差和錯誤?
6. 所選試驗是否有足夠的細節?
7. 數據整合方法是否恰當?各文獻間差異性是否評估?
8. 作者的結論和結果是否匹配?
9. 這個評價是否是最新的?
只有知己知彼,才能創作出高質量的meta分析的文章。
第二步:制定評價方案
先確定方法。這對降低偏倚風險非常重要(比如:不能通過結果挑選文獻等)。
在進行meta分析過程中,常規需要經歷以下步驟,且每一步都要有明確的方法:
-鎖定評價問題
-納入/排除標准
-文獻檢索策略
-對檢索到的研究進行選擇
-數據提取
-質量評估
-數據整合
-計劃傳播
鎖定評價問題已經在第一點中提及,接下去會對每一步進行分析,考慮到步驟間的交叉,所以在順序和分點上有所改變。小編也推薦參看******* 2015年11月20日的文章「在這里,學會最全的PICOS原則」。
例文根據PICOS原則,可以歸納如下:
1. 所探究的問題是:維生素D是否可以阻止老年人跌倒?
2. 研究人群:老年人;
3. 干預/暴露因素:維生素D;
4. 結果:摔倒在地;
5. 研究設計:僅包括之前發表的各RCT。
第二階段:施行階段
第一步:文獻檢索
在制定文獻檢索策略時,總體的要求就是查全和查准。
需要考慮如下幾個方面:
1. 圈定搜索資料庫(外文有:MEDLINE、the Cochrane library、醫學文摘、TOXLINE、OVID、EMBASE、ISI Web of Science、EBSCO等;國內有:維普全文VIP、CNKI、萬方資料庫)
2. 確定語言類型:包括所有英語和非英語的文獻;
3. 明確需要包含的研究類型:僅包含RCT,還是病例對照試驗,隊列研究等。
4. 明確暴露因素/治療方法
5. 篩選關鍵詞:這將直接影響文獻檢索的准確性和敏感性,也關繫到指定檢索策略。
- 關鍵詞需要根據研究問題本身來確定;
- 對於每一個關鍵詞盡量包含所有可能的表述形式;
- 可以嘗試幾種關鍵片語合以搜最合適的文獻。
6. 檢索獲取摘要和全文:其中聯系專家是一種很好的方式,不僅可以獲取全文,甚至可以詢問文獻中的細節幫助後續使用文獻。建議搜索文獻引用名單,可以增加文獻搜索的全面性。
在例文中,作者搜索了所有英語和非英語的文章,包括:Medline、Cochrane對照試驗注冊、Embase、專家、搜索文獻引用名單、在美國骨骼和礦物質研究協會中的摘要。在搜索的過程中,主要使用的醫學關鍵詞包括「vitamin D」 OR 「vitD」, 「falls」 OR 「accidental falls」、「human」等。
第二步:根據納入/排除標准完成文獻選擇
總體來說,首先在計劃書中需要描述納入/排除標准,且這些標准不應該是看了搜索的文獻後制定的,而是應從評價問題出發直接得出。
在文獻篩選過程中,首先,需要由兩位研究者獨立通過對文獻的題目和摘要進行初篩,初篩後的文獻通過閱讀全文進行二次篩選,然後交叉核對篩選結果,如果有分歧則通過共同討論決定是否納入,必要時可有第三位研究者協助解決。如果文中信息不全或信息不清楚,與原始研究作者聯系獲取信息。在篩選過程中,需要記錄你每個步驟的選擇和排除原因。至於被排除的文章,則需要在靈敏度分析中進行分析。
如例文,在這個文獻中,已提前確定了納入和排除標准,包括:僅包含RCT研究,參加人群平均年齡≥60歲,排除酗酒人群、健康不穩定人群等,而所排除的研究在靈敏度分析中進行了分析。
下面的這個流程表描述了整個meta分析納入和排除的過程,這個流程表在meta分析中一般都是必要的。
第三步:資料選擇和提取
資料提取是從符合納入要求的文獻中摘錄用於系統評價的數據信息,所提取信息必須是可靠、有效、無偏的。
總體來說,在進行數據提取時必須使用數據提取表對每個研究進行數據提取,時刻記住所評價的問題以及以後的分析。有時可能需要主觀決定提取的信息,所以必須由2人獨立進行,核查過程中遇到不同之處應該通過討論解決。對於無法獲取必要信息的文獻,則應予以排除。
從提取的數據角度,需要提取相關研究的特點、結果和質量數據。
下表給出了常需要提取的一些數據類型,非常適合各位看官收藏下來在需要時進行查看。
一般信息 文獻研究特點
進行數據提取的研究員
數據提取日期
文獻識別特點
- 各文獻特有編號
- 第一作者
- 文章標題
- 引用
- 出版物類型、名稱、發表年限
- 國家
- 資金來源
宗旨/目標
研究設計
納入和排除標准
分組數
樣本量
招募過程(如:隨機方法、盲法)
隨機干預的單位(如:個人還是
一組人,或者左右眼)
研究場所
研究對象的基本特點 干預措施/暴露因素
研究對象在研究開始的特點,
包括:年齡、性別、種族、社會
經濟狀況、疾病特點、並發症、
診斷標准、疾病分期、病例來源
等;
各對比組的研究對象數量或平均
特點(記錄下是入組人數還是可
行人數或者隨機人數)
干預措施進行的環境
對干預/暴露因素/或者對照組
的描述(如:劑量、應用方法、
干預時間、執行者、干預方法、
理論依據等)
對co-intervention/co-exposure
的描述
健康結局或結果(outcomes)
分析或評估單位
所用統計方法
對每一個提前確定要研究的結果
o 是否在文中有報道
o 研究中對該結果的定義
o 對該結果的測量工具和方法
o 隨訪的時長以及測量
對於所有干預/暴露組以及對照組
o 每組開始參加者人數(enrolled)
o 每組在分析中包括的參加者
o 每組退出者,排除,lost to FU 人數
o 總結結果數據
> 二分法:時間和/或參加者人數
> 連續:平均值和SD
在研究中所用方法(如:intention to treat, per protocol)
研究方法結果(如:odds ratio,risk ratio, confidential interval, p-value,mean difference,CI)
如果計劃做亞組分析,則需要對每一組都提取以上信息
其他結果及任何與結果相關的詳細信息
花費
使用的資源
不良反應事件
在最後加入「備注」一欄,可以用於輸入不能填入其他欄的信息
拿例文說,就有如下圖對目標文章所提取的數據進行了總結:
第四步:納入研究的質量評價和特徵描述
完成數據提取後,就需要對所選擇的文獻進行質量評估。常常通過評價一個研究在設計、實施和分析中防止和減少系統誤差(偏倚)和隨機誤差的程度,來評價其研究質量,並以此為依據在敏感性分析、亞組分析中給以不同的權重。
評估的角度有很多,常需要包含以下領域條目:
研究設計是否與研究目的相匹配
偏倚風險
結果選擇
統計問題
報告方式
干預/暴露測量
下面,陳列一下常用的文獻質量評價工具:
1. 隨機對照試驗的質量評價工具:
Cochrane風險偏倚評估工具(最常用)、PEDro量表、Delphi清單、CASP清單、Jadad量表、Chalmers量表、CONSORT聲明(不專用,但可以用)。
2. 觀察性研究的質量評價工具:
(1)NOS量表(最常用):病例對照研究和隊列研究;
(2)CASP清單:病例對照研究和隊列研究;
(3)JBI標准:橫斷面研究;經驗總結、案例分析及專家意見;
(4)AHRQ;
(5)Combie橫斷面研究評價工具;
(6)STROBE聲明;
(7)STREGA聲明。
3. 非隨機對照實驗性研究的質量評價工具:
MINORS條目、Reisch評價工具、TREND聲明。
4. 診斷性研究:
QUADAS工具、CASP清單、STARD聲明。
5. 動物試驗:
STAIR清單、CAMARADES清單、ARRIV指南。
在該例文中,共有三名作者獨立進行數據提取,使用已經設計好的數據領域,包括研究質量指數,評估了以下方法:隨機方法、隨機分配、雙盲等。此外,還做了靈敏度分析。
第五步:數據整合
系統評價過程中,對上述數據進行定量統計合並的流行病學方法稱為Meta分析(Meta analysis)。Meta意思是more comprehensive,即更加全面綜合。
對數據的整合分為描述性整合和定量整合:
對於描述性整合,應考慮:
• 建立干預/暴露因素是如何導致結果的假說,包括原因和適用人群;
• 初步綜合納入的研究,以文本形式或者製表和/或圖形顯示;
• 探討各研究內或各研究間的關系;
• 評估證據的穩定性;
• 評估meta分析的重要性。
對於定量整合,則可以:
1. 提高了統計檢驗的power和精度;
2. 統計結合各研究結果給出一個「平均」干預效果的合並估計值,改進對作用效應的估計;
3. 評價結果一致性,解決單個研究間的矛盾;
4. 解決以往單個研究未明確的新問題。
那麼如何進行meta分析呢?
a.異質性檢驗(齊性檢驗)
由於納入文獻存在臨床異質性、方法學異質性和統計學異質性,所以在對結果數據進行統計合並之前,首先應該進行異質性檢驗,保證現有的各獨立研究間的結果的不同僅僅是由於抽樣誤差造成的。否則,就要進入亞組分析,或取消合並。
異質性評估(Heterogeneity assessment)
異質性:除抽樣誤差外的不同性
Chi-square test for interaction (Q = x2 statistic, df =degrees of freedom)
也可以比較各亞組的點估計是否相同
若同時如何I2<50%和P≥0.1時,納入文獻被認為是同質的,採用固定效應模型(fixed effect model)分析;反之說明研究間存在實際異質性,需要查找一致性的來源,之後採用隨機效應模型(random effect model)。
如果存在較大的臨床異質性,那將無法進行meta分析,只能進行描述性整合。
在JAMA這篇文章中,用Q值來評估異質性。當p值小於0.1時,存在顯著異質性。此外,在forest plots中所有研究的95%置信區間相互之間重疊可支持不存在異質性。
b.統計合並效應量(加權合並,計算效應尺度及95%的置信區間)並進行統計推斷
通常在考慮採用哪些效應指標(effect size)時需要考慮結局指標的類型,通常兩組間比較時,如果是連續性變數用加權均數差(weighted mean difference, WMD)、標准化均數差值(standardized mean differences, SMD)表示效應大小;二分類變數則用率差(rate difference, RD)、比數比(odds ratio, OR)、相對危險度(relative risk, RR)、相對危險度降低值(relative risk rection, RRR)等來表示效應的大小。
c.圖示單個試驗的結果和合並後的結果
-森林圖(Forrest plot)
分別展示了納入的每一篇文獻的結果和合並後的結果。
-Meta-regression (Goodman et al, 2009)
d.敏感性分析:用來評估meta分析結果的穩定性
1)按研究質量評價標准從納入文獻中去除尚有爭議的研究、排除低質量的研究、早期研究、根據研究結果的分布去掉extreme10%其他已知因素不同的研究;
2)採用不同統計方法/模型;
3)根據樣本量大小進行分層分析;
4)改變納入/排除標准時,重新對同一資料進行分析時,如果觀察到合並指標點估計和區間估計的變化存在較大差異,則說明meta分析的結果不穩定。比如,當排除一篇低質量文獻時,合並指標變化很大,說明該文獻對合並指標敏感。
敏感性分析是必要的,無論是採用不同的統計模型或進行亞組分析,都可以幫助我們找到可能的偏倚來源,更加正確的理解獲得的結論。
e.通過「失安全數」的計算或採用「倒漏斗圖」對入選文獻進行潛在的發表偏倚(publication bias)的評估。
可以用stata軟體進行Begg test和 Egger test以及funnel plot進行評估。
第三階段:報告和分析結果
第一步:報告和建議
• 總結主要結果
• 判斷結果的有效性
• 判斷結果概括性
• 確定進一步研究的意義
• 確定臨床實踐和公共衛生的意義
根據Centre for Reviews and Dissemination(CRD)指南,meta分析報告的結構一般包括以下內容:
• 標題
• 內容列表
• 縮寫/術語表
• 內容提要或結構式摘要
- 背景
- 目標
- 方法(數據來源、研究的選擇、數據提取,
質量評估、數據合成)
- 結果
- 結論
• 正文
- 背景/介紹
- 研究問題
- 研究方法
o 確定研究
o 研究選擇(納入/排除標准,方法)
o 數據提取
o 質量評估
o 數據整合
- 結果
o 納入和排除研究的詳細信息
o 研究結果
o 次要分析(例如:異質性、靈敏度)
- 討論
o 主要發現的討論
o 評價的優點和弱點
o 結果的意義
> 評價中證據的長處和短處
> 影響的方向和力度
> 結果的實用性
o 啟示
- 結論
o 實踐/策略/政策/未來影響
• 致謝
• 資金來源
• 利益沖突
• 參考文獻
• 附錄
第二步:應用到實踐
讓研究更易理解
推廣到臨床實踐:診斷、預後、預防、治療
風險評估
- 評估一般或特定的因果關系
- 與其他種類的數據使用證據權重分析(例如:毒理學、模式-的動作)
- 限製法規
附Meta分析常所使用的軟體:
1. 付費軟體:CMA(ComprehensiveMeta Analysis)、Meta Win、EasyEA;
2. 免費軟體:RevMan(Review Manager)、Meta-Disc、EpiMeta、R;
3. 通用統計軟體中有Metaanalysis的程序:STATA、SAS、NCSS、WinBUGS。