『壹』 樸素貝葉斯分類器【Naive Bayes】
樸素貝葉斯分類器,基於貝葉斯定理,是貝葉斯分類中最基礎且假設特徵間獨立的一種方法。它與支持向量機不同,後者通過決策函數直接預測,而樸素貝葉斯則是依據條件概率分布進行分類。
樸素貝葉斯分類法的核心是後驗概率最大化,通過計算各類別下出現特定特徵組合的條件概率來預測類別。其分類准則基於最小化期望損失,即通過公式[公式]來決定最優預測。對於0-1損失函數,最優預測是使[公式]最小的類別。
樸素貝葉斯模型屬於生成式模型,通過假設特徵獨立,將聯合概率分解,從而在訓練集中計算每類別的概率。例如,在垃圾郵件分類中,通過計算每句話中垃圾詞出現的概率,如[公式],再考慮拉普拉斯平滑避免零概率問題。
樸素貝葉斯分為兩種模型:多項式模型處理離散特徵,如文本分類中單詞的出現次數;而高斯模型處理連續特徵,通過高斯分布估計特徵的均值和方差進行分類。高斯樸素貝葉斯通過極大似然估計參數,計算給定樣本的條件概率,進行預測。
通過以上原理,樸素貝葉斯演算法在實際應用中展現出強大的分類能力,尤其在文本處理等領域。