1. 常用网织红细胞检测的方法及参考值
确定CELLDYN3700血细胞分析仪检测网织红细胞三项参数正常值范围。方法:用CELLDYN3700血细胞分析仪,对102名正常成年人(男、女各半)作网织红百分比(RET%)、网织红细胞绝对数(RET#)和未完全成熟网织红细胞分数(IRF)三项参数正常值范围调查,并将所得数据进行统计学分析。结果:RET%:男性(21~39周岁)1.80±0.35,女性(20~39周岁)1.76±0.31,两组差异无显着性(P>0.05),合并后102名RET%为1.78±0.37(1.12~2.44);RET#(×109/L):男性91.4±28.3(34.8~148.0),女性72.3±25.6(21.1~123.5),两组差异有显着性(P<0.01);IRF:男性0.14±0.06(0.02~0.26),女性0.13±0.05(0.03~0.23),两组差异无显着性(P>0.05),合并后102名IRF为0.14±0.05(0.04~0.24)。
2. 对于服从正态分布的资料,若用非参数统计方法作分析,对结果会有何影响
1、集中性:正态曲线的高峰位于正中央,即均数所在的位置。 2、对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。 3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。 4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。 5、u变换:为了便于描述和应用,常将正态变量作数据转换。 应用 1. 估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。 2. 制定参考值范围 (1)正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。 (2)百分位数法 常用于偏态分布的指标。表3-1中两种方法的单双侧界值都应熟练掌握。 3. 质量控制:为了控制实验中的测量(或实验)误差,常以 作为上、下警戒值,以 作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。 4. 正态分布是许多统计方法的理论基础。 检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。 估计正态分布资料的频数分布 例:某地1993年抽样调查了100名18岁男大学生身高(cm),其均数=172.0cm,标准差s=4.0cm,①估计该地18岁男大学生身高在168cm以下者占该地18岁男大学生总数的百分数 在1个标准波动外的一半,即(1-68.3%)/2=15.65%
3. 如何根据统计的数据来计算标准范围 例:根据当地1000个人的身高数据来计算正常身高范围。
【一】相关统计数据标准知识推介:
推荐说明案例:社会统计调查分析学:荒岛《科考范畴数据标准研究》
首先:你要对群体及个体目标做详细统计分析:才能保证统计数据的可靠性和科学性。切忌简单加减乘除计算:导致伪科学的统计结果,危害社会。
例如:亚洲人身高调查统计分析:定性调查---定量分析---定性结论---定量计算---科学推论。
1、东方人有喜欢早熟的倾向。但身体的越早成熟也就意味着身高增长停止得越早。女性迎来初潮后身高只能再长6厘米左右,而男性变声后身高就几乎不再增长了。
2、青春期长高非常显着,因此被称为长高的冲刺阶段。但由于这个冲刺阶段就是身高停止增长前的最后一次长高,所以也就成了身高停止增长的预兆。
3、青春期长高冲刺阶段来临前的身高情况决定了成人后的身高。调查表明,身高150厘米以下的女性,平均11岁半就迎来了初潮,而身高165厘米以上的女性初次来潮年龄大都超过了12岁。所以说青春期来得晚的人长得高。 最重要的是青春期到来之前长高了多少·
4、大家都知道青春期人长高得最快,爸爸妈妈们,请回忆一下你们是否都在青春期突然间发现校服穿不下了,人一下子长高了?其实青春期的身高增长率并不是青春期的长高所引起的,而是青春期前就有的。青春期的过早来临引起儿童期缩短,结果就导致身高长高期的缩短,最终人还没有完全发育好就已成人了。
5、青春期到来的早晚是由什么决定的·
青春期的到来受遗传和自然环境的影响,同时也因为人种的不同而不一样。所以人为地延缓青春期到来是非常困难的。但是,青春期的到来在一定程度上又是可以控制的。
6、热量的过分摄取就明显提前了青春期的到来,此外家庭和社会以及近来所谓的环境激素都有一定关系。
7、青春期早的儿童常常也越早脱离父母。由于青春期来临得早,父母在还没做好准备的时候孩子就突然间进入了反抗期,因此往往很难教育。
8、遗传因素:据统计,男女身高分别有79%和92%属于遗传因素的作用。
9、捷克和斯洛伐克学者将子女与父母之间身高的关系列出如下公式:
男孩成人身高(厘米)=(父身高+母身高r1.08)/2
女孩成人身高(厘米)=(父身高r0.923+母身高)/2
10、中日联合测量北京与东京的上万名学生,发现中国学生身高、体长均超过日本,这与日本父母的平均身高比中国父母要矮3厘米有关。
11、种族差别:缅甸塔容地区有个矮人部落,身高不到1.1米;南美洲哥伦比亚北部大森林中的“尤卡”人,身高都在1米以现。欧美人一般比亚洲人高。
12、营养水平:调查发现,城市中青少年的平均身高比农村的高2~4厘米。
13、激素分泌:身高取决于人体生长激素的分泌,特别是4个重要腺,即:甲状腺、脑垂腺、胸腺与性腺。侏儒症患者脑垂体分泌的生长激素明显不足;性腺发育不全的女性,身高都在1.4米以下。此外,甲状腺也影响身高。
14、青少年自身的健康状况:孩子5岁前生长速度最快,每年能长20厘米,到5岁时则稳定在每年6厘米左右。进入青春期则又加快到每年10厘米,其后增加就基本停止。在这儿个阶段,许多疾病如贫血、慢性感染、消化不良等都能抑制生长;内分泌的失调,也会影响生长。
【二】:统计数据的本质属性;
统计数据是统计工作活动过程中所取得的反映国民经济和社会现象的数字资料以及与之相联系的其他资料的总称。统计研究客观事物的数量方面,离不开统计数据,统计数据是对客观现象进行计量的结果。
统计数据的类型
统计数据是采用某种计量尺度对事物进行计量的结果,采用不同的计量尺度会得到不同类型的统计数据。从上述四种计量尺度计量的结果来看,可以将统计数据分为以下四种类型:
定类数据——表现为类别,但不区分顺序,是由定类尺度计量形成的。
定序数据——表现为类别,但有顺序,是由定序尺度计量形成的。
定距数据——表现为数值,可进行加、减运算,是由定距尺度计量形成的。
定比数据——表现为数值,可进行加、减、乘、除运算,是由定比尺度计量形成的。
前两类数据说明的是事物的品质特征,不能用数据表示,其结果均表现为类别,也称为定性数据或品质数据(Oualitative data);后两类数据说明的是现象的数量特征,能够用数值来表现,因此也称为定量数据或数量数据(Quantitative data)。由于定距尺度和定比尺度属于同一测度层次,所以可以把后两种数据看作是同一类数据,统称为定量数据或数值型数据。
区分测量的层次和数据的类型是十分重要的,因为对不同类型的数据将采用不同的统计方法来处理和分析。比如,对定类数据,通常计算出各组的频数或频率,计算其众数和异众比率,进行列联表分析和x2检验等;对定序数据,可以计算其中位数和四分位差,计算等级相关系数等非参数分析;对定距或定比数据还可以用更多的统计方法进行处理,如计算各种统计量、进行参数估计和检验等。我们所处理的大多为数量数据。
这里需要特别指出的是,适用于低层次测量数据的统计方法,也适用于较高层次的测量数据,因为后者具有前者的数学特性。比如:在描述数据的集中趋势时,对定类数据通常是计算众数,对定序数据通常是计算中位数,但对定距和定比数据同样也可以计算众数和中位数。反之,适用于高层次测量数据的统计方法,则不能用于较低层次的测量数据,因为低层次数据不具有高层次测量数据的数学特性。比如,对于定距和定比数据可以计算平均数,但对于定类数据和定序数据则不能计算平均数。理解这一点,对于选择统计分析方法是十分有用的。
统计数据的计量
对统计数据的属性、特征进行分类、标示和计算,称为统计计量或统计量度。例如,对工业企业经济效益的统计,对居民生活水平的统计,也可以说是对工业企业经济效益的计量,对居民生活水平的计量,如此等等。由于客观事物有的比较简单,有的比较复杂,有的特征和属性是可见的(如人的外貌体征),有的则是不可见的(如人的偏好和信仰),有的表现为数量差异,有的表现为品质差异。因此,统计计量也就有定性计量和定量计量的区别,并且可分不同的层次。美国社会学家、统计学家史蒂文斯(S.S.Stevens)1968年按照变量的性质和数学运算的功能特点,将统计计量划分为四个层次或四种计量尺度:
1、定类尺度
将数字作为现象总体中不同类别或不同组别的代码,这是最低层次的尺度。在这种情况下,不同的数字仅表示不同类(组)别的品质差别,而不表示它们之间量的顺序或量的大小。这种尺度的主要数学特征是“=”或 “≠”。
例如将国民经济按其经济类型,可以分为国有经济、集体经济、私营经济、个体经济等类,并用(01)代码表示国有经济,(02)表示集体经济,(03)表示私营经济,(04)表示个体经济。并且用(011)代表国有经济中的国有企业,(012)代表国有联营企业;用(021)表示集体经济中集体企业,(022)表示集体联营企业;用(031)表示私营经济中的私营独资企业,(032)表示私人合伙企业,(033)表示私营有限责任公司;用(041)表示个体经济中的个体工商户,(042)表示个人合伙等等。其中两位代码表示经济大类,而三位代码则表示各类中的构成。不同代码反映同一水平的各类(组)别,并不反映其大小顺序。各类中虽然可以计算它的单位数,但不能反映第一类的一个单位可以相当于第二类的几个单位等等。
2、定序尺度
定序尺度不但可以用数表示量的不同类(组)别,而且也反映量的大小顺序关系,从而可以列出各单位、各类(组)的次序。这种尺度的主要数学特征是“>”或“<”。
例如对合格产品按其性能和好坏,分成优等品、一等品、合格品等等。这种尺度虽然也不能表明一个单位一等品等于几个单位二等品,但却明确表示一等品性能高于二等品,而二等品性能又高于三等品等等。定序尺度除了用于分类(组)外,在变量数列分析中还可以确定中位数、四分位数、众数等指标的位置。
3、定距尺度
定距尺度也称间隔尺度,是对事物类别或次序之间间距的计量,它通常使用自然或度量衡单位作为计量尺度。定距尺度是比定序尺度高一层次的计量尺度。它不仅能将事物区分为不同类型并进行排序,而且可以准确地指出类别之间的差距是多少。
例如,学生某门课程的考分,可以从高到低分类排序,形成90分、80分、70分,直到零分的序列。它们不仅有明确的高低之分,而且可以计算差距,90分比80分高10分,比70分高20分等等。定距尺度的计量结果表现为数值,可以进行加或减的运算,但却不能进行乘或除的运算,其原因是在等级序列中没有固定的、有确定意义的“零”位。例如,学生甲得分90分,学生乙得0分,可以说甲比乙多得90分,却不能说甲的成绩是乙的90倍或无穷大。因为“0”分在这里不是一个绝对的标准,并不意味着乙学生毫无知识。恰如我们不能说40℃比20℃暖和2倍一样。没有确定的标准的“零”位,但有基本的确定的测量单位,如学生成绩的测量单位是1分,质量价差的测量单位量1元,温度的测量单位是1℃等等,这是定距尺度的显着特点。
4、定比尺度
定比尺度是在定距尺度的基础上,确定可以作为比较的基数,将两种相关的数加以对比,而形成新的相对数,用以反映现象的构成、比重、速度、密度等数量关系。由于它是在比较基数上形成的尺度,所以能够显示更加深刻的意义。定比尺度的主要数学特征是“÷”或“×”。
例如将某地区人口数和土地面积对比计算人口密度指标,说明人口相对的密集程度。甲地区人口可能比乙地区多,但甲地区的土地更广阔,用人口密度指标就可以说明相对说来甲地区人口不是多了,而是少了。又如将一个国家(地区)的国内生产总值与该国(地区)居民对比。计算人均国内生产总值,可以反映国家(地区)的综合经济能力。1998年我国国内生产总值约占世界生产总值的12%,排列世界第七位,堪称世界经济大国,但我国人口占世界总人口的21.2%,如果按人均国内生产总值计算,在世界各国中又居于比较落后的位次,说明我国仍属于发展中国家。
上述四种计量尺度对事物的计量层次是由低级到高级、由粗略到精确逐步递进的。高层次的计量尺度具有低层次计量尺度的全部特性,但不能反过来。显然,我们可以很容易地将高层次计量尺度的测量结果转化为低层次计量尺度的测量结果,比如将考试成绩的百分制转化为五等级分制。在统计分析中,一般要求测量的层次越高越好,因为高层次的计量尺度包含更多的数学特性,所运用的统计分析方法越多,分析时也就越方便,因此应尽可能使用高层次的计量尺度。
统计数据的质量
统计数据质量是一个具有丰富内涵的综合性概念。具体来说,它包括统计数据的内容质量、表述质量及约束标准这三大方面。
(一)统计数据的内容质量
统计数据的内容质量是统计数据最基本的特征,它包括相关性、准确性与及时性。一旦缺少了其中任何一个,统计数据就失去了转化为信息的性质和基本作用。因此,这三个特征也可称为统计数据质量的主要特征。
1、相关性
相关性是指统计机构所生产的数据是否正是用户感兴趣的统计数据。统计数据的相关性反映了它满足用户需求的程度,它与所提供的可利用数据是否关注了对用户来说最重要的主题有关。由于对相关性的评价是主观的,会随用户需求目标的改变而改变,所以统计机构所要做的是平衡不同用户的互相矛盾的需求目标,在给定的资源条件限制下,尽可能的满足大部分用户的大部分需求。
2、准确性
准确性指观测值或估计值与未知的真值之间的距离(接近程度),通常用统计误差来衡量。它是统计数据质量的基础和核心内容,也是传统的“统计数据质量”概念所考虑的主要问题。一般来讲,误差分为系统误差和随机误差两部分,有时也用引起不准确性的主要潜在原因(如抽样误差、无回答误差等)来分类描述。完全准确的测量经常受到成本的限制,有时甚至是不可能的。所以关键的是误差是否已降低到用户可以接受的地步。
3、及时性
与用户需求相关的准确的统计数据如果没有在用户做出决策之前传递给用户,那么该数据对用户来说,是没有用的。所以,及时性也是统计数据能否满足用户需求的重要特征。如果该现象本身变化比较迅速,则对该类统计数据的及时性要求高;如果该现象本身变化比较缓慢,则对及时性要求不高。
(二)统计数据的表述质量
对统计数据质量来说,仅考虑其内容方面的质量是不够的。统计数据需要表述,特别是将某个统计数据同其他相关统计数据相互联系地加以表述时,要考虑表述的质量问题。比如单个数据的内容是正确的,但表述不清晰、不充分,就会影响整套数据的质量,甚至引起误解。所以,统计数据质量必须考虑其表述质量。统计数据的表述质量包括可比性、可衔接性和可理解性。
1、可比性
可比性是指同一项目的统计数据在时间上和空间上的可比程度。这要求统计的概念和方法在时间上保持相对稳定,在不同地区使用统一的统计制度方法和分类标准,保持统计数据的口径范围、计算方法在时间上一致衔接,在地区之间可比。
2、可衔接性
可衔接性是指同一统计机构内部不同统计调查项目之间、不同机构之间以及与国际组织之间统计数据的衔接程度。这要求全国范围内所有专业统计项目在统一的统计框架体系、分类标准下,按统一的方法编制统计数据,在统计调查和数据加工整理中使用统一的方法和程序,同时采用国际统计标准,如联合国1993年SNA的框架体系等。
3、可理解性
可理解性是指统计数据便于用户正确理解并使用的程度。统计数据是提供给用户使用的,如果某些用户不能理解,看不懂统计数据和统计分析报告,当然也就谈不上使用数据。为了恰如其分地使用从统计机构那里得到的统计数据,用户必须了解他们所获得数据的性质。这就要求统计机构在提供统计数据的同时附带提供对数据的补充说明,如提供隐含在有关概念下面的说明、已使用的分类法、数据收集和加工过程中所使用的方法以及统计机构自身对数据质量的评价。
(三)统计数据的约束标准
在实现统计数据目标的过程中,除了注意统计数据的内容质量和表述质量这两方面外,还必须注意以下两项具有普遍意义的约束标准,这也体现了统计数据的质量特征。
1、可取得性
可取得性是指用户从统计部门取得统计数据的便利程度。对于有用的统计数据,用户必然要考虑:能得到哪些数据,如何得到这些数据。因此,统计数据必须以一种用户能够使用(搜寻方便)而且能够负担的形式提供给用户。这要求提供统计数据时,必须列明用户从统计机构可以取得的统计数据内容,同时要应用先进便捷的统计数据服务方式,使用户取得数据更为便利。
2、有效性
有效性是指统计数据的利用所产生的效益要大于提供该数据的成本。如果情况相反,则提供这种数据对提供方和使用方来说都是不值得的。虽然目前统计数据的效益和成本特别是前者不容易准确地计量,但是,保持这样一种基本的指导思想是十分必要的。这要求在统计数据的其他质量不受大的影响的前提下,尽可能降低统计数据的生产费用,提高效率。
计算身高的公式
利用遗传因素即利用父母的身高进行预测。计算公式为:
儿子成人时的身高=(父高+母高)× 0.54
女儿成人时的身高=(父高×0.923+母高)÷2 此方法未考虑环境因素的影响,误差较大,大约在3-5厘米。
2.利用儿童青少年自身的后天发育情况,即当时的实足年龄、身高、足长进行预测:
Hm=A+(B×C)其中Hm为成人后的身高,A为常数,B为相应的系数,C为当时的身高。不同的年龄具有不同常数和系数。A和B是通过统计资料制成的表中查得,这里可查阅《医学网络全书、儿童少年卫生学》第36页提供的预测身高表。儿童青少年在不同的年龄阶段其足长与身高有着密切关系,它包含着遗传和后天发育情况。中国青少儿体质调查组根据1979年对11万名7-25岁男女学生的测试数据研究出利用足长预测儿童成人时身高的方法,并制定了相应的预测表。此方法由于结合遗传和后天环境因素的影响,因此误差较小,大约在2厘米左右。可查阅《医学网络全书、儿童少年卫生学》36页。
以上资料希望对你有用。
4. 评价工作程序
(一)确定评价参考值
1.两种方法
确定评价参考值的方法有两种,即生态效应法和统计反推法。在实际工作中,可以同时用两种方法综合确定评价参考值(以Cd为例)。
生态效应法是利用前人关于生态效应研究的成果综合确定评价参考值的方法。国内外许多学者研究了Cd稻米问题,他们或采用室内栽培实验方法或在大田中进行试验研究,应用生态效应法取得实验室条件下或某一地区产生Cd稻米(Cd的国家食品卫生标准为0.2mg/kg)的土壤Cd最高限量。通过研究前人资料,作者选择了与评价地区自然地理、地质条件相近似地区的土壤Cd最高限量作为评价地区Cd指标的评价参考值。
统计反推法是利用大量有关稻米Cd与土壤Cd关系的数据进行统计分析,建立回归方程y(稻米Cd)=f(x(土壤Cd)),再用Cd的国家食品卫生标准值0.2mg/kg从回归方程中反推土壤Cd限量值作为Cd指标的评价参考值。
2.部分依据
本书给出了Cd、Hg、Pb、As等4种指标(表4-13、表4-14、表4-15、表4-16、表4-17)的参考值依据。例如,在华北平原开展区域评价工作,可选择北京潮土的临界浓度作为评价参考值,即水田Cd参考值为10.8mg/kg,旱地Cd参考值为1.0mg/kg。
表4-13 作物籽粒达标的土壤Cd临界浓度值Table 4-13 Critical concentration of Cd in soil when crop seeds are up to par(mg/kg)
注:*资料来源于董克虞,1982;**资料来源于郑绍建,1991;其余资料均来源于“土壤环境容量”科技攻关成果。
表4-14 农产品卫生质量达标的土壤Hg临界浓度值Table 4-14 Critical concentration of Hg in soil when proce sanitation quality are up to par(mg/kg)
(据土壤环境容量研究组,1985)
表4-15 作物籽粒达标的土壤Pb临界浓度值Table 4-15 Critical concentration of Pb in soil when crop seeds are up to par(mg/kg)
注:资料来源于“土壤环境容量”科技攻关成果。
表4-16 作物籽粒达标的土壤As临界浓度值Table4-16 Critical concentration of As in soil when crop seeds are up to par(mg/kg)
注:资料来源于“土壤环境容量”科技攻关成果。
表4-17 我国主要土壤类型砷元素的临界含量Table 4-17 Critical concentration of As of main soil types in China(mg/kg)
(据土壤环境容量研究组,1986)
(二)获取响应关系数据
若评价区已有足够的一系列从土壤Cd高值区到低值区的稻米Cd含量与土壤Cd含量数据,可直接用于确定评价标准值。若无有关资料,可按照以下步骤获取稻米Cd含量对土壤Cd含量的响应关系数据。
第一步:以评价参考值为基准,以适当的间隔绘制评价地区的区域地球化学元素等值线图。将与评价参考值上下相邻的两条等值线的值域范围作为评价标准值可能存在的范围;这两条等值线间的地区,作为确定评价标准值的重点采样区(图4-6)。
图4-6 评价参考值等值线与重点采样区
Fig.4-6 Isopleth and key sampling areas for evaluation reference
第二步:在上述等值线图上,从高值区到低值区系统采取水稻籽实-根系土的系列样品。样品布置应考虑以下原则:①从高值区到低值区布置数条采样剖面线(带),以兼顾多个评价指标;②除采样剖面线(带)外,适量增加散点采样,以兼顾不同地貌单元、土壤类型及其分布面积;③建议重点采样区内的采样点占总采样点数的50%左右。
第三步:样品送检。对所有评价指标均进行籽实-根系土的全量测试分析。另外,建议对根系土的分析增加这些评价指标的相态、价态、有效态分析项目,以便研究解决评价标准值确定过程中的疑难问题。
(三)确定评价标准值
确定评价标准值的具体方法,详见第五章。例如,根据浙北、浙东地区的稻米与根系土的175组实际测试数据,利用上述方法确定了浙北和浙东地区Cd元素评价标准值,分别为安全界限值320μg/kg、基本安全界限值560μg/kg和危险界限值800μg/kg。
(四)评价工作步骤
首先利用安全界限值、基本安全界限值和危险界限值对1:25万土壤地球化学调查数据逐个进行单指标对比判别,做每个单指标的评价离散图;然后采用“一票否决,区域叠加”方法,获得该地区所有指标的土地生态安全地球化学分级图;最后对评价地区地质、土壤和人类活动影响等进行综合分析,编制评价地区土地生态安全地球化学评价图,并用评价指标对评价分区命名,如Cd危险区、Cd-Hg警戒区等(图4-7)。
图4-7 某地区土地安全性评价图
Fig.4-7 Ecological safety estimation chart for land in certain area
5. 百分位数法计算参考值范围的条件是
百分位数法计算参考值范围的条件是正态分布还是偏态分布。
计算医学参考值有两种方法:一是正态分布的资料,可以用正态分布法,即x士t0.05,二是偏态分布的资料,则可以用百分位数法(P2.2P97.5),故选择正态分布法或百分位数法的依据是资料服从正态分布还是偏态分布。
(5)卫统确定参考值范围的方法有哪些扩展阅读:
目的和方法论:
目的:建立确定医学参考值的多指标百分位数法(精确法)。
方法:通过数学证明与医学实践检验。结果 建立了多指标百分位数法(精确法),用此法对医学资料建立的医学参考值可用于医学实践。
结论:多指标百分位数法(精确法)是确定多指标医学参考值范围的优良方法。
6. 医学科研中常用的统计学方法有哪些
正确的统计学分析一定要建立在明确的研究目的和研究设计的基础之上,那些事先没有研究目的和研究设计,事后找来一堆数据进行统计分析都是不可取的。 在医学论文的撰、编、审、读过程中经常遇到的问题是研究的题目与课题设计、论文内容不符,包括文章的方法解决不了论文的目的、文章的结果说明不了论文的题目、文章的讨论偏离了论文的主题;还有是目的不明确、设计不合理。如题目过小,论文不够字数,而一些无关紧要的变量指标或结果被分析被讨论;又如题目过大,论文的全部内容不足以说明研究的目的,使论文的论点难以立足。 所以,合理明确的论文题目或目的以及研究设计方案是撰、编、审、读者应当关注的首要问题。此外,样本含量是否满足,抽样是否随机,偏倚是否控制等,也是不可忽视的问题。
2、建好分析用的数据库
建好数据库是正确统计分析的前提和基础,甚至决定了论文分析结果的成败。对于编、审、读者来讲,一般由于篇幅的限制,往往得不到数据库数据,而只有作者在数据库数据基础上经统计描述计算后给出的诸如各指标均数 x、标准差 s 或中位数 M、百分位数 Px 的“二手”数据,或将研究对象小或特征属性分组,清点各组观察单位出现的个数或频数的频数表数据等。 无论是否能够得到数据库数据,作者在统计分析过程中一定依据数据库数据进行计算,得出结果。如果对“二手”数据或频数表数据的结果等存在疑惑,编辑、审稿专家或读者有权要求作者提供数据库数据以检查其完整性、准确性和真实性,确保研究数据的质量。假若在投稿须知中对数据库数据作出必要的要求,无疑对于保证刊物的发表质量有着积极的意义
7. 统计研究的基本方法有哪几种
抽样平均误差是测定抽样误差的基本指标。它是随机抽样可变总体平均数(抽样平均数的所有可能值)与全及平均数之间离差...这个指标反映抽样平均数的所有可能值对全及平均数的平均离散程度,即反映误差平均值的大小
分布数列是统计整理的一种重要形式,是统计描述和统计分析的一种重要方法,它可以说明总体的分布特征、内部结构,并可据以研究总体某一标志值的平均水平及其变动的规律性。
1、统计学:是运用数理统计的基本原理和方法研究预防医学和卫生事业管理中资料的收集,整理和分析的一门应用科学。具体地讲,是按照设计方案去收集、整理、分析数据,并对数据结果进行解释,从而做出比较正确的结论。
2、总体:是根据研究目的确定同质的所有观察单位某种变量的集合。
3、变异:同一性质的事物,其观察值(变量值)之间的差异。
4、抽样研究:从所研究的总体中随机抽取一部分有代表性的样本进行研究,用样本指标推论总体,最终达到了解总体的目的。这种用样本指标推论总体参数的方法称为抽样研究。
5、统计描述:用统计图表或计算统计指标的方法表达一个特定群体的某种现象或特征。
6、统计推断:根据样本资料的特性对总体的特性作估计或推论的方法称统计推断,常用方法是参数估计和假设检验。
7、概率:是指某事件出现可能性大小的度量,以符号P表示。
8、医学参考值范围:参考值范围又称正常值范围。医学上常把包括绝大多数人某项指标的数值范围称为该指标的参考值范围。
9、正态分布规律:实际工作中,经常需要了解正态曲线下横轴上的一定区域的面积占总面积的百分数,用以估计该区间的观察例数占总例数的百分数,或变量值落在该区间的频数或概率。
10、可比性:是指对研究结果有影响的非处理因素在各处理组之间尽可能相
同或相近。
11、动态数列:是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。
12、抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异。
13、标准误:表示样本均数间变异程度。
14、率的抽样误差:抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差,率之间的差异称为率的抽样误差。
15、参数估计:是指用样本指标(称为统计量)估计总体指标(称为参数)。
16、可信区间:总体参数的所在范围通常称为参数的可信区间或置信区间,即该区间以一定的概率(如95%或99%)包含总体参数。
17、I型错误:拒绝了实际撒谎能够成立的H0,这类“弃真”的错误称为I型错误。
18、II型错误:接受了实际撒谎能够不成立的H0,这类“存伪”的错误称为II型错误。
19、检验效能:1-b称为检验效能又称为把握度。它的含义是:当两总体确实有差别时,按规定的检验水准a,能够发现两总体间差别的能力。
20、四格表资料:两个样本率的资料又称为四格表资料,在四格表资料中两个样本的实际发生频数和实际未发生频数为基本数据,其他数据均可由这四个基本数据推算出来。
21、列联表资料:对同一样本资料按其两个无序分类变量(行变量和列变量)归纳成双向交叉排列的统计表,其行变量可分为R类,列变量可分为C类,这种表称为R*C列联表。
22、参数检验:是一种要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行统计推断的假设检验。
23、非参数检验:是一种不依赖总体分布类型,也不对总体参数(如总体均数)进行统计推断的假设检验。
24、秩次:即通常意义上的序号,实际上就是将观察值按顺序由小到大排列,并用序号代替了变量值本身。
25、直线相关系数:它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的统计指标。相关系数没有单位,取值范围是-1〈=r〈=1,r的绝对值越大表明两变量的关系越密切。
26、完全负相关:这是一种极为特殊的负相关关系,从散点图上可以看出,由x与y构成的散点完全分布在一条直线上,x增加,y相应减少,算得的相关系数r=-1。
27、正相关:它是说明具有直线关系的两个变量间,存在有正的相关方向,即当x增加时,y有相应增大的趋势,所算得的相关系数r为正值。
28、等级相关:是对等级数据作相关分析,它又称为秩相关,是一种非参数统计方法。
29、评价:是通过对某些标准来判断观测结果,并赋予这种结果以一定的意义和价值的过程。
30、综合评价:是指人们根据不同的评价目的,选择相应的评价形式,据此选择多个因素或指标,并通过一定的数学模型,将多个评价因素或指标转化为能反映评价对象总体特征的信息。
31、优序法:为了比较某几个事物或方案的优劣,在选定各项评价指标后,将待评价的对象或方案就各项评价指标的测量值大小分别排列,并分别对各序号(等级)以相应的评分值即优序数,然后综合诸评价指标,分别计算评价对象的总赋优序数,并按总赋优序大小评定其优顺序的方法即优序法。
32、Topsis:Topsis法常用于系统工程中有限方案多目标决策分析,此外,也可用于效益评价、卫生决策和卫生事业管理等多领域。
33、根本死因:WHO规定,根本死因是指:“(a)引起直接导致死亡的一系列病态事件的那些疾病或损伤,或者(b)造成致命损伤的事故或暴力的情况。”
34、卫生服务需要:是指人们因疾病影响健康,引起人体正常活动的障碍,实际应当接受各种卫生服务的需要(如预防保健、治疗、康复)。
35、卫生服务调查统计:是卫生统计的主要内容之一,卫生服务调查统计是从卫生服务资料的设计、收集、整理、分析的角度,来阐述卫生服务研究的特点、研究方法和注意事项,以便使卫生服务研究服务更具有科学性。
36、卫生服务调查:是指对卫生服务状况、人群健康的危险因素、人群卫生服务的需求和利用、卫生服务资源的分配和利用所进行的一种社会调查。
37、统计表:是以表格的形式列出统计指标,它是对资料进行统计描述时的一种常用手段。
38、统计图:是以各种几何图形(如点、线、面或立体)显示数据的大小、升降、分布以及关系等,它也是对资料进行统计描述时的一种常用手段。
39、均数的抽样误差:统计学上,对于抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差。
8. 2016年国卫计委公务员体检合格参值标准
公务员录用体检通用标准(试行)
第一条 风湿性心脏病、心肌病、冠心病、先天性心脏病、克山病等器质性心脏病,不合格。先天性心脏病不需手术者或经手术治愈者,合格。
遇有下列情况之一的,排除心脏病理性改变,合格:
(一)心脏听诊有生理性杂音;
(二)每分钟少于6次的偶发期前收缩(有心肌炎史者从严掌握);
(三)心率每分钟5O-60次或100-110次;
(四)心电图有异常的其他情况。
第二条 血压在下列范围内,合格:
收缩压90mmHg-140mmHg(12.00-18.66Kpa);
舒张压60mmHg-90mmHg (8.00-12.00Kpa)。
第三条 血液病,不合格。单纯性缺铁性贫血,血红蛋白男性高于90g/L、女性高于80g/L,合格。
第四条 结核病不合格。但下列情况合格:
(一)原发性肺结核、继发性肺结核、结核性胸膜炎,临床治愈后稳定1年无变化者;
(二)肺外结核病:肾结核、骨结核、腹膜结核、淋巴结核等,临床治愈后2年无复发,经专科医院检查无变化者。
第五条 慢性支气管炎伴阻塞性肺气肿、支气管扩张、支气管哮喘,不合格。
第六条 严重慢性胃、肠疾病,不合格。胃溃疡或十二指肠溃疡已愈合,1年内无出血史,1年以上无症状者,合格;胃次全切除术后无严重并发症者,合格。
第七条 各种急慢性肝炎,不合格。乙肝病原携带者,经检查排除肝炎的,合格。
第八条 各种恶性肿瘤和肝硬化,不合格。
第九条 急慢性肾炎、慢性肾盂肾炎、多囊肾、肾功能不全,不合格。
第十条 糖尿病、尿崩症、肢端肥大症等内分泌系统疾病,不合格。甲状腺功能亢进治愈后1年无症状和体征者,合格。
第十一条 有癫痫病史、精神病史、癔病史、夜游症、严重的神经官能症(经常头痛头晕、失眠、记忆力明显下降等),精神活性物质滥用和依赖者,不合格。
第十二条 红斑狼疮、皮肌炎和/或多发性肌炎、硬皮病、结节性多动脉炎、类风湿性关节炎等各种弥漫性结缔组织疾病,大动脉炎,不合格。
第十三条 晚期血吸虫病,晚期血丝虫病兼有橡皮肿或有乳糜尿,不合格。
第十四条 颅骨缺损、颅内异物存留、颅脑畸形、脑外伤后综合征,不合格。
第十五条 严重的慢性骨髓炎,不合格。
第十六条 三度单纯性甲状腺肿,不合格。
第十七条 有梗阻的胆结石或泌尿系结石,不合格。
第十八条 淋病、梅毒、软下疳、性病性淋巴肉芽肿、尖锐湿疣、生殖器疱疹,艾滋病,不合格。
第十九条 双眼矫正视力均低于0.8(标准对数视力4.9)或有明显视功能损害眼病者,不合格。
第二十条 双耳均有听力障碍,在佩戴助听器情况下,双耳在3米以内耳语仍听不见者,不合格。
第二十一条 未纳入体检标准,影响正常履行职责的其他严重疾病,不合格。
9. 卫生统计学的学习《卫生统计学》应注意如下问题
1)正确、全面的理解统计学的一些基本概念和基本思想:如前所述,《卫生统计》应属“专业统计”,由于“专业统计”主要强调统计方法的实际应用,对方法的原理一般不做过多介绍,所以学生在本课程的学习过程中会对一些公式、方法、概念难以理解,会有许许多多的“为什么”,因而感到课程难学难懂,对课程难以全面把握。针对这一问题,从应用的角度从发,学生应重点理解基本的统计学概念、原理、基本思想,对公式的来源可不做过多的深究。上课认真听讲,课后加强与老师、同学的交流,对正确理解概念、基本思想将起到事半功倍的作用。
2)淡化繁琐、复杂的计算:随着信息技术的飞速发展,计算机随处可见,各种数据处理软件和统计软件唾手可得,这就使得我们能从繁琐复杂的统计计算中解脱出来。但其负面作用是计算机和统计软件的盲目使用,不管是什么研究类型的数据都简单地交给计算机处理,用计算机取代统计,造成大量统计方法的滥用和误用。医学研究的许多数据关系到人群的健康,统计方法的误用会导致严重的伦理问题。这就提示我们要注重“统计方法”的选择、重视“数据质量”的保证和统计结果的“表达”。
3)结合实践、勤于练习:由于《卫生统计学》前后章节内容联系非常密切,前一章节学习的好坏对后续章节的学习将产生较大影响,这就要求学生对每一章节的内容都能较好的掌握。实现这点的较好方法是及时的对每一章节的例题、练习亲自完成一遍,特别是分析思考题。由于课本的练习题并非完全意义的实际问题(已经整理处理),所以要想把所学统计方法解决实际科研问题,还必须有施展这些方法的舞台,由于条件限制,在校学生不可能从事完整的一项科研工作,但学生课余时间可通过网络或图书馆阅读医学杂志上的科研论文,了解别人的统计设计思路和统计分析方法,经常参加硕士研究生的开题报告和论文答辨。相信通过这一系列的学习,你对基本的统计方法的运用必将是得心应手、游刃有余。
统计过程是一项使信息变成知识、知识有利于科学进步的过程。在这一过程在你将领会到统计学的精髓和奥秘,同时你也将体会到统计思维和推理的快乐,因为一项科学的统计过程,就是医学进步的过程。 本书是在国家中医药管理局规划指导下,全国高等中医药教材建设研究会具体组织,由十多所高等中医药院校联合编写,供全国高等中医药院校管理类专业使用的新世纪全国高等中医药院校规划教材。
新世纪初十年来,全国各中医药院校相继开设了医药经营管理、医疗保险、市场营销、医院管理等专业,这些专业都离不开卫生统计学的应用。卫生统计学是应用概率论与数理统计的原理和方法,研究卫生事业管理与卫生经济中出现的不确定性现象的一门应用学科,是一门重要的定量研究工具。运用统计分析可以发现医疗和卫生事业中客观存在的规律,对相关结论进行适当的量化,得到科学的结论,可以培养学生的统计思维和严谨的科学态度。
本教材共分15章,强调“三基”训练,重视实际应用。第一章介绍定量资料的统计描述,第二章介绍分类资料的统计描述,第三章介绍常见概率分布的知识以及应用,第四章介绍参数估计,等五章介绍假设检验,第六章介绍方差分析,第七章介绍列联表资料分析,第八章介绍非参数检验,第九章介绍相关与回归。前九章属于基本统计。第十章到第十四章属于专业统计的内容,是卫生统计中经常使用的方法。第十五章为实验设计,管理类专业使用较少。故列在最后仅供参考。 第一章 定量资料的统计描述
第一节 基本概念
一、总体
二、样本
三、变量
第二节 定量资料的统计描述
一、位置性度量
二、离散性度量
第三节 常用统计图表
一、定量资料的频数分布表
二、统计表
三、统计图
第四节 DPS软件简介
一、DPS的基本操作
二、DPS的函数
实验
第二章 分类资料的统计描述
第一节 分类资料的频数分布
第二节 分类资料常用相对数
一、比率
二、强度
三、相对比
第三节 卫生统计常用相对数
一、人口统计指标
二、疾病统计指标
三、医院统计指标
四、流行病学调查资料分析指标
五、应用相对数时应注意的问题
第四节 率的标准化
一、直接法标准化率
二、使用标准化法应注意的问题
第五节 动态数列及其分析指标
一、绝对增长量、发展速度和增长速度
二、平均发展速度和平均增减速度
实验二
第三章 概率分布
第一节 二项分布
一、二项分布的前提条件
二、二项分布的概率函数
三、二项分布的均数与标准差
第二节 Poisson分布
一、Poisson分布的前提条件
二、Poisson分布的概率密度函数
三、Poisson分布的均数与标准差
第三节 正态分布与标准正态分布
一、正态分布
二、标准正态分布
第四节 正态分布的应用
一、确定医学参考值范围
二、三种分布的渐近关系
三、正态分布应用于质量控制
实验三
第四章 参数估计
第一节 抽样分布与抽样误差
一、样本均数的抽样分布和抽样误差
二、样本率的抽样分布与抽样误差
第二节 t分布
第三节 总体均数与总体概率的估计
一、参数估计
二、置信区间
实验四
第五章 假设检验
第一节 假设检验原理
第二节 单样本正态资料的假设检验
一、正态总体均数的假设检验
二、正态总体方差的假设检验
第三节 两样本正态资料的假设检验
一、配对样本资料的t检验
二、成组资料的方差齐性检验
……
第六章方差分析
第七章列联表资料分析
第八章非参数检验
第九章相关与回归
第十章Logistic回归
第十一章时间序列分析
第十二章综合评价
第十三章生存分析
第十四章调查设计
第十五章实验设计
附录一统计用表
附录二课外练习题
附录三模拟测验试卷
参考文献
10. 卫生标准
卫生标准以保障各类人群健康为直接目的而正式批准颁布的针对与人的生存、生活、劳动和学习有关的各种自然和人为环境因素和各件所作的一系列量值规定,和为保证实现这些规定所必须的技术行为规定。前者又包括最适范围和容许限量,均是量值标准,后者是技术行为标准。
它们都是以人或实验动物的健康效应或生理学变化为主要依据而制订的。现阶段卫生标准的主要内容是针对与人群健康有关的人类生活(空气、土壤、水、食物和民用建筑)和工厂劳动环境中的物理的(如噪声、振动、日照、居室净高等等)、化学的(各种有害化学物质)和生物学的(如致病微生物问题)因素所作的限量或至适量的规定,以及有关的技术行为规定(如生活饮用水源卫生防护要求)。
世界各国颁布的卫生标准的法律效力尚不相同,有的国家(如美国等)标准具有法律效力。但在另一些国家则只是建议值,无法律约束力。卫生标准是有关卫生立法体系中,由母法派生出的技术规范性法规。中国的卫生标准均属可区分为国家标准、行业标准和地方标准,但均属强制性标准。
综合分析建议值在经济技术上的可行性,最后确定标准值及有关技术行为规定,经主管部门审批后,颁布执行。
卫生标准的贯彻执行是涉及国家经济和技术等多方面的复杂工作。因此卫生标准值的高低,即对人群健康保护到何种程度这一原则问题,是国家权衡需要和可能两方面的情况而确定的,即既要保护各类人群的健康,又不能超出现阶段科技发展水平(如控制污染的技术水平;环境监测的设备条件等)和社会经济条件的许可(如标准执行中的花费与其社会经济效益间的关系等)。
由于世界各国在这些方面有不同的原则立场,因此有些相同标准化对象的卫生标准值在国与国之间有相当大差别。
中国制订卫生标准的原则是:标准应在卫生上安全可靠、经济合理、技术上可行。
对现行卫生标准进行定期复审,是根据标准执行中发现的问题,国家经济技术发展状况以及新科学发现和毒理及卫生学领域的新进展,对标准内容的可靠性,合理性进行评价,然后作出确认、修订或废止的决定。
有些环境中的有害环境因子(如电离辐射)对机体的某些不良影响是无阈值的。因此,对它们的卫生标准的制订,不是根据阈值(或最大无作用剂量)和采用安全系数方法,而是根据可接受的危险度,利用动物实验和人群流行学调查所得到的剂量-反应资料,用数理统计方法推导出标准建议值。对于致癌、致突变和致畸性化学物质是否有阈值的问题,在国际上还存在两种不同观点。因此,其卫生标准制订的理论和方法,尚未统一。