导航:首页 > 研究方法 > 小样本分析方法是什么

小样本分析方法是什么

发布时间:2023-05-18 19:21:11

1. 小样本定性分析主要用于什么研究

小样本定性分析主要用于社会行为,教育,医学,管理方面的研究。
1、社会行为:研究人类的社会行为、社会心理、社会文化等方面的问题。
2、教育:研究教育过程、教育方法、教育扒桥评价等方面的问题等。
3、医学:研究疾病春肆猛、治疗方法、医学伦理等雹晌方面的问题。
4、管理:研究组织管理、企业管理、经济管理等方面的问题。

2. 【译】小样本的统计分析问题

有人认为肆游,对于小样本,你就无法使用统计的。但,这是一个误解,一个 常见的误解 。

对于小样本,我们也有适当的统计方法。

一个研究者的“小样本”,在另一个研究者看来则可能意味着“大样本”。本文中,小样本主要是指样本量在5-30个用户(可用性研究中常见的样本量,进一步阅读:http://www.measuringusability.com/blog/actual-users.php)。

值得注意的是,用户研究并不是出现小样本的唯一领域。其他具有较高操作成本的研究也会出现这个现象,比如fMRis和动物实验等。

尽管我们有相应的方式来处理小样本研究数据,但我们应该清晰地知道小样本的局限性:你很难看到很大的差异,很明显的效果。 这就像使用双筒望远镜进行天文观测一样:使用双筒望远镜,你可能无法看到行星、恒星、月亮和偶尔出现的彗星。但这并不以为着你就不能进行天文观测了。事实上,伽利略就是使用望远镜( 与今天相当的双筒望远镜相当 )发现了木星的卫星。

统计也是一样。仅仅因为你的样本不够大,并不能判断你能不能使用统计。再次强调, 小样本的关键限制是,你难以发现设计或措施的效果是否有差异。

幸运的是,在用户体验研究中,我们往往关心的是不同用户可能发现的不同问题:比如:导航的结构变化,搜索结果页面的改进等等。

下面是我们在小样本用户研究中的常见统计分析方法

比较compare

如果您需要对比两个独立组别的完成率、完成时间,问卷评分等。有两种大样本或者小样的方法可以采用。具体适用与哪种方法,取决于数据的特征:连续的还是离散的。

比较均值: 如果你的数据是连续的(不是二进制),比如任务完成时间、问卷评分等,你可以采用独立样本t检验。实践证明,它对于小样本也是适用的。

二分变量比较: 如果你的数据是二进制的(成功/失败,是/否),你可以采用N-1的卡方检验。当期望数目小于1时,使用Fisher精确检验往往有更好的表现。

置信区间Confidence Intervals

当你想从样本数据来推测整个用户群,你会想到生成一个置信区间(译者注:首仔关于置信区间,可参阅: http://ke..com/view/409226.htm )。

尽管小样本的置信区会相当宽(通常为20-30个百分点),但是建立这样的区间总是有益的。例如:你想知道,用户在安装打印机前是否会去阅读裂芹销“Read this first”文档。而测试中,8名用户中有6名用户没有去阅读。这时候我们可以推知:至少40%的用户很可能会这么做——这是一个相当大的比例。

置信区间的计算方法有三种,这取决于你数据是否是二进制、时间或者连续的。

基于平均值的置信区间Confidence interval around a mean :如果你的数据是连续的(非二进制),如评定量表、以美元计算的订单金额,页面访问数等。那么,置信区间的计算可以基于t分布进行计算(当然,这需要考虑到样本量)。

基于任务时间的置信区间Confidence interval around task-time :任务时间的理论最小值为0秒(不多见),一些用户的任务时间可能是其他用户的10-20倍。对于这种不对称性,我们需要进行数据转换( log-transformed ),然后基于转换后的数据进行计算。待报告时再转换回来。

基于二进制的置信区间 Confidence interval around a binary measure :二进制的数据比如完成率或yes/no。这类置信区间的计算,可以采用校正后沃尔德检验法( Adjusted Wald interval )计算(这种方法对于所有样本规模均适用)。

点估计(均值)Point Estimates (The Best Averages )

任何研究报告中,何为"最好"的平均时间或平均完成率的估计,应当取决于研究的目标。

请记住:即使是“最好”的均值估计,也依然不代表实际的平均值。 所以对于未知总体均值的估计而言,置信区间是更好的展示方法。

在可用性研究中,小样本的均值计算,比较适宜的有两个:任务时间和完成率。不同样本规模中更常见的则是量表评分(SUS评分等)。

完成率: 小样本的完成率,通常可能只有几个数值(译者注:可用性测试中,这一数字可能为5)。例如:有五个用户进行任务操作,其任务完成率只可能是:0%,20%,40%,60%,80%和100%几个数字中的某一个(100%也并不罕见)。基于小样本得出一个完美的成功率,可能并不恰当——因为它可能并不能揭示真实情况(测试结果优于真实情况)。

我们(指作者)对自己的小样本可用性测试数据,利用拉普拉斯估计(theLaPlace estimator)和简单比例(一般称为,最大似然估计,the Maximum Likelihood Estimator)进行了均值估计(参见:http://www.upassoc.org/upa_publications/jus/2006_may/lewis_small_sample_estimates.pdf )。

评定量表的均值问题: 量表是一个有趣的度量类型,它们大多是有限的区间(如:1-5,1-10等)除非你是 Spinal Tap (译者注:因翻译期间,该链接视频未能打开。故未译成中文)。我们发现,在小型或大型的样本中,均值最好是在中位数上(参阅:http://drjim.0catch.com/1993_MultipointScales_.pdf)。当然,我们有许多方式来报道评定量表的分数,比如 top-two boxes (直观理解,可参照NPS的计算规则)。

具体如何报告取决于你的灵敏度需要和组织要求。

任务时间均值 :一个较长的任务时间可能让算术平均值产生扭曲,这时候中位数则是用来描述平均水平的更恰当的指标。样本数在25以上的,中位数对均值具有良好的代表性(进一步阅读:http://www.measuringusability.com/average-times.php)。

不幸的是,中位数往往不够准确,在样本数小于25的情况下,比平均值更加不准确。这时候,几何平均值往往具有更好的衡量意义(译者注:几何平均值受极端值的影响更小)。

【工具箱】

小样本计算器:http://www.measuringusability.com/wald.htm

任务时间置信区间计算: http://www.measuringusability.com/time_intervals.php

二分变量差异检验: http://www.measuringusability.com/ab-calc.php

top-two boxes:https://www.measuringusability.com/blog/top-box.php

几何平均数计算器: http://www.ab126.com/goju/1710.html

数字帝国-统计计算器: http://zh.numberempire.com/statisticscalculator.php

——————————————————————————————

【译后记】译罢此文,深深感触:对于结果直接提供算术平均数就是耍流氓!而多数报告也确实只提供了算术平均数一种。 本文对于更严谨科学地分析和解读研究发现,具有重要的启发意义。

因时间和精力限制,译文难免存在谬误,欢迎批评指正。

3. 调查30个人怎么用统计学分析150人

如果只对30个人进行调查,那么使用统计学方法分析150人的数据可能会存在一些问题,因为样本数量戚激太小。但如果按照一定规律或者随机的方式对这30人进行选择,可以有效避免样本偏差等问题。下面是一些常见的方法:

等比例抽样法: 将需要调查的样本按比例分成若干份,再从每一份中随机选取一定数量的样本。

分层抽样法: 根据需要调查的总体特征,将样本分成若干层,然后从每一层中随机选取相同数目的样本。

整群抽样法: 直接选择一些可以代表整体的群体,比如选取某些具有代表性的企业、组织等,然后在这些群体中随机选取一定数量的样本。

完成对30个人的调查后,可以利用采集到的数据进行数据分析和处理。例如,可以采用描述性统计方法,对样本数据进行汇总和归纳,在样本内探索数据的分布情况、趋势、关系等;也可以采用推断性统计方法,根燃桐据样本数据推断总体的特征和参数,比如利用置信区间、假设检验等方法来检验总体高段袜均值是否符合要求。但是需要注意,由于样本量较小,推论的置信水平可能并不高,因此需要留意结果的可靠性。

当然,如果可以对更多数量的样本进行调查,那么分析结果会更加准确和可靠。

4. 31个小样本,统计学分析方法怎么选

如果只是大概的分析,无不可。但主要问题是样本分组相对于样本数太多,结果准确性不好评价。另外样本要考虑控制变量。如果数据详细,考虑用计量模型好些吧。表格中能得到是否有显着影响以及哪一类对立特征影响大,但是是正向影响还是负向影响,不能判断。

5. 统计学中,如何区分大样本z和小样本t

大样本z和小样本t的区别方法:

总体中抽取的所要考查的元素总称,样本中个体的多少叫样本容量。一般的,样本的内容是带着单位的,例如:调查某中学300名中学生的视力情况中,样本是300名中学生的视力情况,而样本容量则为300。

选取样本的过程叫作抽样,根据不同的对象,在抽样方法也有所不同。

z检验适用于变量符合z分布的情况,而t检验适用于变量符合t分布的情况。

t分布是z分布的小样本分布,即当总体符合z分布时,从总体中抽取的小样本符合t分布,而对于符合t分布的变量,当样本量增大时,变量数据逐渐向z分布趋近。

抽样:

又称取样。从欲研究的全部样品中抽取一部分样品单位。其基本要求是要保证所抽取的样品单位对全部样品具有充分的代表性。抽样的目的是从被抽取样品单位的分析、研究结果来估计和推断全部样品特性,是科学实验、质量检验、社会调查普遍采用的一种经济有效的工作和研究方法

抽样设计在进行过程中要遵循四项原则,分别是:

1、目的性;

2、可测性;

3、可行性;

4、经济型原则。

以上内容参考:网络-样本

6. 请问小样本、重复测量的试验数据用什么分析方法最好用重复测量方差分析显示残差自由度不足,该如何解决

可以调整数据,将重复测量数据合并到一列中,另起一列变量分别标记重复次数,比如有3次重复,就编码为1,2,3,将其作为一个影响因素 进行分析

7. 通常情况下小样本检验指的是

通常情况下小样本检验指的是统计假设检验。

在机器学习领域具有重大意义和挑战性,是否拥有从少量样本中学习和概括的能力,是将人工智能和人类智能进行区分的明显分界点,因为人类可以仅通过一个或几个示例就可以轻松地建立对新事物的认知,而机器学习算法通常需要成千上万个有监督样本来保证其泛化能力。

尽管没有确切的证据解释人类从少量样本中学习和概括能力的实现机制,但是一些神经生物学学森握迟者认为,人类杰出的学习和认知能力得益于其前额叶皮层(PFC)和人脑的工作记忆机制 ,尤其是PFC特定的神经生物学机制与先前存储此李在大脑中的记忆之间的相互作用。

阅读全文

与小样本分析方法是什么相关的资料

热点内容
颈椎直反弓的锻炼方法 浏览:225
论述糖尿病的营养治疗方法有哪些 浏览:75
网络面板不能用的检测方法 浏览:708
眼睛黑眼圈怎么办有什么方法 浏览:535
用手机绕地转一圈测出亩数的方法 浏览:148
新旧玉米粒的鉴别方法视频 浏览:868
踢脚线安装方法与尺寸 浏览:403
蟹爪兰的养殖方法视频 浏览:766
研究方法具体有哪几种 浏览:766
用什么方法气走了你的追求者 浏览:540
再生胶脱模的解决方法 浏览:610
少儿英语学习方法及技巧 浏览:210
oppo手机闪烁解决方法 浏览:633
干河粉的快速泡发方法 浏览:199
流量上网速度慢的解决方法 浏览:647
中秋节月饼的制作方法及图片 浏览:233
苹果5屏幕解锁在哪里设置方法 浏览:624
广告显示屏的芯片的安装方法 浏览:762
钢锯子的食用方法 浏览:709
上海普洱熟茶的正确冲泡方法 浏览:611