1. 小樣本定性分析主要用於什麼研究
小樣本定性分析主要用於社會行為,教育,醫學,管理方面的研究。
1、社會行為:研究人類的社會行為、社會心理、社會文化等方面的問題。
2、教育:研究教育過程、教育方法、教育扒橋評價等方面的問題等。
3、醫學:研究疾病春肆猛、治療方法、醫學倫理等雹晌方面的問題。
4、管理:研究組織管理、企業管理、經濟管理等方面的問題。
2. 【譯】小樣本的統計分析問題
有人認為肆游,對於小樣本,你就無法使用統計的。但,這是一個誤解,一個 常見的誤解 。
對於小樣本,我們也有適當的統計方法。
一個研究者的「小樣本」,在另一個研究者看來則可能意味著「大樣本」。本文中,小樣本主要是指樣本量在5-30個用戶(可用性研究中常見的樣本量,進一步閱讀:http://www.measuringusability.com/blog/actual-users.php)。
值得注意的是,用戶研究並不是出現小樣本的唯一領域。其他具有較高操作成本的研究也會出現這個現象,比如fMRis和動物實驗等。
盡管我們有相應的方式來處理小樣本研究數據,但我們應該清晰地知道小樣本的局限性:你很難看到很大的差異,很明顯的效果。 這就像使用雙筒望遠鏡進行天文觀測一樣:使用雙筒望遠鏡,你可能無法看到行星、恆星、月亮和偶爾出現的彗星。但這並不以為著你就不能進行天文觀測了。事實上,伽利略就是使用望遠鏡( 與今天相當的雙筒望遠鏡相當 )發現了木星的衛星。
統計也是一樣。僅僅因為你的樣本不夠大,並不能判斷你能不能使用統計。再次強調, 小樣本的關鍵限制是,你難以發現設計或措施的效果是否有差異。
幸運的是,在用戶體驗研究中,我們往往關心的是不同用戶可能發現的不同問題:比如:導航的結構變化,搜索結果頁面的改進等等。
下面是我們在小樣本用戶研究中的常見統計分析方法。
比較compare
如果您需要對比兩個獨立組別的完成率、完成時間,問卷評分等。有兩種大樣本或者小樣的方法可以採用。具體適用與哪種方法,取決於數據的特徵:連續的還是離散的。
比較均值: 如果你的數據是連續的(不是二進制),比如任務完成時間、問卷評分等,你可以採用獨立樣本t檢驗。實踐證明,它對於小樣本也是適用的。
二分變數比較: 如果你的數據是二進制的(成功/失敗,是/否),你可以採用N-1的卡方檢驗。當期望數目小於1時,使用Fisher精確檢驗往往有更好的表現。
置信區間Confidence Intervals
當你想從樣本數據來推測整個用戶群,你會想到生成一個置信區間(譯者註:首仔關於置信區間,可參閱: http://ke..com/view/409226.htm )。
盡管小樣本的置信區會相當寬(通常為20-30個百分點),但是建立這樣的區間總是有益的。例如:你想知道,用戶在安裝列印機前是否會去閱讀裂芹銷「Read this first」文檔。而測試中,8名用戶中有6名用戶沒有去閱讀。這時候我們可以推知:至少40%的用戶很可能會這么做——這是一個相當大的比例。
置信區間的計算方法有三種,這取決於你數據是否是二進制、時間或者連續的。
基於平均值的置信區間Confidence interval around a mean :如果你的數據是連續的(非二進制),如評定量表、以美元計算的訂單金額,頁面訪問數等。那麼,置信區間的計算可以基於t分布進行計算(當然,這需要考慮到樣本量)。
基於任務時間的置信區間Confidence interval around task-time :任務時間的理論最小值為0秒(不多見),一些用戶的任務時間可能是其他用戶的10-20倍。對於這種不對稱性,我們需要進行數據轉換( log-transformed ),然後基於轉換後的數據進行計算。待報告時再轉換回來。
基於二進制的置信區間 Confidence interval around a binary measure :二進制的數據比如完成率或yes/no。這類置信區間的計算,可以採用校正後沃爾德檢驗法( Adjusted Wald interval )計算(這種方法對於所有樣本規模均適用)。
點估計(均值)Point Estimates (The Best Averages )
任何研究報告中,何為"最好"的平均時間或平均完成率的估計,應當取決於研究的目標。
請記住:即使是「最好」的均值估計,也依然不代表實際的平均值。 所以對於未知總體均值的估計而言,置信區間是更好的展示方法。
在可用性研究中,小樣本的均值計算,比較適宜的有兩個:任務時間和完成率。不同樣本規模中更常見的則是量表評分(SUS評分等)。
完成率: 小樣本的完成率,通常可能只有幾個數值(譯者註:可用性測試中,這一數字可能為5)。例如:有五個用戶進行任務操作,其任務完成率只可能是:0%,20%,40%,60%,80%和100%幾個數字中的某一個(100%也並不罕見)。基於小樣本得出一個完美的成功率,可能並不恰當——因為它可能並不能揭示真實情況(測試結果優於真實情況)。
我們(指作者)對自己的小樣本可用性測試數據,利用拉普拉斯估計(theLaPlace estimator)和簡單比例(一般稱為,最大似然估計,the Maximum Likelihood Estimator)進行了均值估計(參見:http://www.upassoc.org/upa_publications/jus/2006_may/lewis_small_sample_estimates.pdf )。
評定量表的均值問題: 量表是一個有趣的度量類型,它們大多是有限的區間(如:1-5,1-10等)除非你是 Spinal Tap (譯者註:因翻譯期間,該鏈接視頻未能打開。故未譯成中文)。我們發現,在小型或大型的樣本中,均值最好是在中位數上(參閱:http://drjim.0catch.com/1993_MultipointScales_.pdf)。當然,我們有許多方式來報道評定量表的分數,比如 top-two boxes (直觀理解,可參照NPS的計算規則)。
具體如何報告取決於你的靈敏度需要和組織要求。
任務時間均值 :一個較長的任務時間可能讓算術平均值產生扭曲,這時候中位數則是用來描述平均水平的更恰當的指標。樣本數在25以上的,中位數對均值具有良好的代表性(進一步閱讀:http://www.measuringusability.com/average-times.php)。
不幸的是,中位數往往不夠准確,在樣本數小於25的情況下,比平均值更加不準確。這時候,幾何平均值往往具有更好的衡量意義(譯者註:幾何平均值受極端值的影響更小)。
【工具箱】
小樣本計算器:http://www.measuringusability.com/wald.htm
任務時間置信區間計算: http://www.measuringusability.com/time_intervals.php
二分變數差異檢驗: http://www.measuringusability.com/ab-calc.php
top-two boxes:https://www.measuringusability.com/blog/top-box.php
幾何平均數計算器: http://www.ab126.com/goju/1710.html
數字帝國-統計計算器: http://zh.numberempire.com/statisticscalculator.php
——————————————————————————————
【譯後記】譯罷此文,深深感觸:對於結果直接提供算術平均數就是耍流氓!而多數報告也確實只提供了算術平均數一種。 本文對於更嚴謹科學地分析和解讀研究發現,具有重要的啟發意義。
因時間和精力限制,譯文難免存在謬誤,歡迎批評指正。
3. 調查30個人怎麼用統計學分析150人
如果只對30個人進行調查,那麼使用統計學方法分析150人的數據可能會存在一些問題,因為樣本數量戚激太小。但如果按照一定規律或者隨機的方式對這30人進行選擇,可以有效避免樣本偏差等問題。下面是一些常見的方法:
等比例抽樣法: 將需要調查的樣本按比例分成若干份,再從每一份中隨機選取一定數量的樣本。
分層抽樣法: 根據需要調查的總體特徵,將樣本分成若干層,然後從每一層中隨機選取相同數目的樣本。
整群抽樣法: 直接選擇一些可以代表整體的群體,比如選取某些具有代表性的企業、組織等,然後在這些群體中隨機選取一定數量的樣本。
完成對30個人的調查後,可以利用採集到的數據進行數據分析和處理。例如,可以採用描述性統計方法,對樣本數據進行匯總和歸納,在樣本內探索數據的分布情況、趨勢、關系等;也可以採用推斷性統計方法,根燃桐據樣本數據推斷總體的特徵和參數,比如利用置信區間、假設檢驗等方法來檢驗總體高段襪均值是否符合要求。但是需要注意,由於樣本量較小,推論的置信水平可能並不高,因此需要留意結果的可靠性。
當然,如果可以對更多數量的樣本進行調查,那麼分析結果會更加准確和可靠。
4. 31個小樣本,統計學分析方法怎麼選
如果只是大概的分析,無不可。但主要問題是樣本分組相對於樣本數太多,結果准確性不好評價。另外樣本要考慮控制變數。如果數據詳細,考慮用計量模型好些吧。表格中能得到是否有顯著影響以及哪一類對立特徵影響大,但是是正向影響還是負向影響,不能判斷。
5. 統計學中,如何區分大樣本z和小樣本t
大樣本z和小樣本t的區別方法:
總體中抽取的所要考查的元素總稱,樣本中個體的多少叫樣本容量。一般的,樣本的內容是帶著單位的,例如:調查某中學300名中學生的視力情況中,樣本是300名中學生的視力情況,而樣本容量則為300。
選取樣本的過程叫作抽樣,根據不同的對象,在抽樣方法也有所不同。
z檢驗適用於變數符合z分布的情況,而t檢驗適用於變數符合t分布的情況。
t分布是z分布的小樣本分布,即當總體符合z分布時,從總體中抽取的小樣本符合t分布,而對於符合t分布的變數,當樣本量增大時,變數數據逐漸向z分布趨近。
抽樣:
又稱取樣。從欲研究的全部樣品中抽取一部分樣品單位。其基本要求是要保證所抽取的樣品單位對全部樣品具有充分的代表性。抽樣的目的是從被抽取樣品單位的分析、研究結果來估計和推斷全部樣品特性,是科學實驗、質量檢驗、社會調查普遍採用的一種經濟有效的工作和研究方法。
抽樣設計在進行過程中要遵循四項原則,分別是:
1、目的性;
2、可測性;
3、可行性;
4、經濟型原則。
以上內容參考:網路-樣本
6. 請問小樣本、重復測量的試驗數據用什麼分析方法最好用重復測量方差分析顯示殘差自由度不足,該如何解決
可以調整數據,將重復測量數據合並到一列中,另起一列變數分別標記重復次數,比如有3次重復,就編碼為1,2,3,將其作為一個影響因素 進行分析
7. 通常情況下小樣本檢驗指的是
通常情況下小樣本檢驗指的是統計假設檢驗。
在機器學習領域具有重大意義和挑戰性,是否擁有從少量樣本中學習和概括的能力,是將人工智慧和人類智能進行區分的明顯分界點,因為人類可以僅通過一個或幾個示例就可以輕松地建立對新事物的認知,而機器學習演算法通常需要成千上萬個有監督樣本來保證其泛化能力。
盡管沒有確切的證據解釋人類從少量樣本中學習和概括能力的實現機制,但是一些神經生物學學森握遲者認為,人類傑出的學習和認知能力得益於其前額葉皮層(PFC)和人腦的工作記憶機制 ,尤其是PFC特定的神經生物學機制與先前存儲此李在大腦中的記憶之間的相互作用。