❶ Python數據分析實戰-實現T檢驗(附源碼和實現效果)
T檢驗是一種用於比較兩個樣本均值是否存在顯著差異的統計方法。廣泛應用於各種場景,例如判斷兩組數據是否具有顯著差異。使用T檢驗前,需確保數據符合正態分布,並且樣本方差具有相似性。T檢驗有多種變體,包括獨立樣本T檢驗、配對樣本T檢驗和單樣本T檢驗,針對不同實驗設計和數據類型選擇適當方法至關重要。
實現T檢驗的Python代碼如下:
python
import numpy as np
import scipy.stats as stats
# 示例數據
data1 = np.array([1, 2, 3, 4, 5])
data2 = np.array([2, 3, 4, 5, 6])
# 獨立樣本T檢驗
t_statistic, p_value = stats.ttest_ind(data1, data2)
print(f"T統計量:{t_statistic}")
print(f"顯著性水平:{p_value}")
# 根據p值判斷差異顯著性
if p_value < 0.05:
print("兩個樣本的均值存在顯著差異")
else:
print("兩個樣本的均值無顯著差異")
運行上述代碼,將輸出T統計量和顯著性水平。根據p值判斷,若p值小於0.05,則可認為兩個樣本的均值存在顯著差異;否則,認為兩者均值無顯著差異。
實現效果
根據上述代碼,執行T檢驗後,得到的輸出信息如下:
python
T統計量:-0.8504468809708765
顯著性水平:0.4431661062683708
根據輸出結果,T統計量為-0.85,顯著性水平為0.44。由於p值大於0.05,我們無法得出兩個樣本均值存在顯著差異的結論。因此,可以判斷在置信水平為0.05時,兩個樣本的均值無顯著差異。