1. 研究教学评价与测量的方法有什么意义
在许多发达国家和地区,教育测量与评价是教育科学体系中极其重要的学科之一。这是因为,教育测量与评价科学理论不仅在教育教学及教育管理等实际工作中具有重要的应用价值,而且在社会各个领域的人才选拔与评价过程中也有广泛而重要的应用。所以,了解教育测量与评价的学科地位和作用,反思我国教育测量与评价的学科建设和学科地位之现状,对学习教育测量与评价这门课程是非常有必要的。
一、教育测量与评价是现代教育科学研究的三大领域之一
20世纪教育科学研究发展迅速,形成一个庞大的教育科学体系。在教育科学体系中,有许多已经形成研究对象相对明确、研究内容相对独立、研究成果已相对完整的学科分支。这些学科分支主要有教育学、教学论、课程论、教育心理学、 教育史、比较教育、教育统计学、教育测量学、 教育评价学、 教育管理学、教育哲学、教育社会学、教育经济学、教育科学研究方法、教育实验设计、教育技术学、教育评估与督导、教育生态学等。在课程设置与学科建设中,教育测量与评价既可看成是教育测量学与教育评价学内容的整合并侧重于教育测量的一门综合性教育课程,又可以看成是一个兼容了教育统计、教育测量、心理测量、教育评价、教育评估、教育督导甚至教育科学研究方法等在内容的学科群。因此,教育测量与评价在教育科学体系中具有十分重要的地位,是教育科学体系中带有综合性、技术性、实践性、应用性等特征的应用性学科,是人们依据教育基础理论和教育规律来指导教育实践通常所依赖的技艺与方法,它对体现教育科学学科的价值在许多方面起着“代言人”的特殊作用。
综观当今世界许多发达国家,教育基本理论研究、教育测量与评价科学研究以及教育发展理论研究已成为现代教育科学研究的三大领域。
改革开放以来,我国的教育测量与评价理论研究和实践也取得一定的进展。教育统计、教育测量、心理测量、教育评价等课程得到恢复和一定的重视。 为了尽快缩短与国外的差距,我国有关部门采取“请进来”和“走出去”的办法,了解国外的科学发展动态,翻译与编写了一些教科书,以适应高校教学与科研的迫切需要。与此时,在老一辈专家的带领下以及有关部门的支持下,国内一批教学与科研人员大力开展考试学、教育测量、心理测量、教育评估、教育评价、教育统计学的理论研究和实际工作;成立了全国性的教育统计与测量、心理测验、教育评价、考试学、人才测评等学术团体;国家及地方政府纷纷建立有关考试机构;创办多种期刊杂志, 如《中国考试》、《中国高校招生考试》、 《考试、目标、评价》、 《考试研究》、《教育评价》、《中国高等教育评估》、《教育督导与评估》、《教育统计与测验》、《考试报》、《自学考试杂志》等;促进我国教育测量、教育评价、教育评估、高等教育自学考试、各类资格证书考试的理论研究与实际工作的发展,体现了“教育测量与评价”学科重要的社会价值和应用领域。
然而,从我国教育科学学科专业建设、学位点建设的实际情况来看,应该说,教育测量与评价的理论研究还不能适应我国教育实践的需要。许多人对教育测量与评价学科重要性的认识还不到位。特别在教育学科分类和有关学位专业目录中,找不到教育测量与评价学科的名称。这与国外的情况很不一致,值得人们深思。
二、教育测量与评价在教育改革中的重要作用
(一)教育测量与评价在教育系统中的作用
教育本身是一个系统。所谓系统,指的是具有一定目的、有输入和输出的、且具有反馈功能的有秩序的整体结构。在教育系统中,学校、教师、学生、教育方案、课程、教材、教学训练、考试评价等都是这个系统的组成部分。显然,我们期待教育方案、课程、教学等都能给学生带来某种变化,但不是说所有的教育方案、课程、教学都同样有效地改变学生,也不是所有的学习者会按同样的方式发生变化或有同样的变化程度。因此,当我们根据教育目标和计划, 把教育方案、课程、教学等因素(输入条件)作用于学生身上后,需参照教育目标和计划,对教育效果(输出)及其输入条件的妥当性予以测量评估、价值分析和判断。然后,把这一测量与评价过程所获得的信息反馈给教育者、学习者以及有关教育决策者,以便改进教育的策略与方案,更有效地达到教育目的。可以想见,在教育系统运转过程中,除了对教育效果(输出)要进行测量与评价外,还要针对影响教育效果的诸因素(输入)进行客观的分析和评价。教育测量与评价在教育系统中对实现教育目标起着十分重要的作用。
(二)教育改革常常以教育测量与评价的改革作为突破口
学校教育考试制度和评价制度是教育制度的一个组成部分,但教育考试和教育评价具有很强的导向功能。俗话说,考试是根指挥棒,就是这个意思。在世界教育发展史与教育改革行动中,因考试指挥不当使教育教 学走上不健康之路继而引发教育改革运动的典型例子不少。例如,20世纪初的英国在建立了“11岁”考试制度后,竞争异常激烈,导致英国的小学教育为考而学,内容窄化,“应试教育”倾向严重。更甚者,有些地方的教育当局还根据“11岁”考试成绩来评价学校和教师的教学水平,造成许多不良影响,引起社会各界人士的担忧和指责,同时也引发许多教育论争及其后的教育改革行动。到20世纪70年代末催生了 “英国国家课程改革” 计划的实施与推广。类似地,20世纪初期澳大利亚国家的学校中考试之风非常盛行,“周考、月考、学期考”等正规考试次数频繁,学校根据考试成绩作出关于学生升留级或奖励的决策;有关教育当局则根据各校各科的考试成绩,给学校和教师发奖金,甚至以明确的技术标准把考试分数同教师的薪金联系起来定量发放。这种措施虽然在一定程度上调动了教师与学校的工作积极性,但也导致“为考而教、为考而学”的教育局面,使教育偏离了正确的轨道。因此,也引发了澳大利亚政府当局对基础教育进行一系列的教育改革。其他一些国家,如美国、日本、印度等国也有类似的经历。而我们中国本来就是“考试制度”的发源地,重视考试本来就是无可厚非。“因为,作为一种手段来说,我国的考试,确实是最'古'的,也是'最好'”的(孙中山是山语)。“但由于考试特别是像高考这样的关键性考试具有指挥棒的导向作用,因此,在升学竞争激烈、教育观念落后的情况下,”应试教育“倾向就会出现,教育就会偏离正确轨道,这对培养跨世纪人才和提高中华民族的整体素质来讲,显然是不利的。正是在这种教育与社会发展背景下,我国政府要求所有学校都要全面推进素质教育,并且启动了国家新一轮基础教育课程改革方案,把课程改革、教与学的方式改革以及考试评价制度改革等统整起来。
总之,从英国国家考试制度及其课程改革、澳大利亚国家考试制度及教育改革、美国的教育测量运动及”八年研究“中的课程与教育评价制度改革、还有我国解放以来考试制度改革来看,考试评价制度改革不仅作为教育改革的一项重要内容,而且有时还作为教育改革甚至政治体制改革或政治运动的突破口。因此,教育测量与评价在教育改革中常常处于突出的位置,起着重要的作用。
三、教育改革要求教育测量与评价更加科学化
教育目标的多样性,必然要求教育测量与评价方法、手段的多样化和科学化。中共中央、国务院1999年在《关于深化教育改革全面推进素质教育的决定》中多处讲到考试、评估、 评价等改革问题。例如,针对高等教育,该决定中指出,要”加强对高等学校的监督和办学质量检查,逐步形成对学校办学行为和教育质量的社会监督机制以及评价体系,完善高等学校自我约束、自我管理机制。“再如,针对招生考试和评价制度,该决定的第13条中指出,”改革高考制度是推进中小学全面实施素质教育的重要措施,按照有助于高等学校选拔人才、 中小学实施 素质教育和扩大高等学校办学自主权的原则,积极推进高考改革……逐步建立具有多种选择的、更加科学和公正的高等学校招生选拔制度……鼓励各地中小学自行组织毕业考试,采取多种形式改革高中阶段学校的招生办法,改革高中会考制度。建立符合素质教育要求的对学校、教师和学生的评价机制。地方各级人民政府不得下达升学指标,不得以升学率作为评价学校工作的标准。鼓励社会各界、 家长和学生以适当方式参与对学校工作的评价。“可见,全面推进素质教育,需要加快考试制度、考试方法、考试内容、评价方法和评价制度方面的改革,提高教育测量与评价的科学化水平。
由于基础教育 在整 个教育结构和提高国民素质中具有的特殊作用,因此,基础教育课程及其考试评价改革尤加紧迫。如同2001年国务院在《关于基础教育改革与发展的决定》中所强调的那样:”基础教育是科教兴国的奠基工程,对提高中华民族素质、培养各级各类人才,促进社会主义现代化建设具有全局性、基础性和先导性作用。保持教育适度超前发展,必须把基础教育摆在优先地位并作为基础设施建设和教育事业发展的重点领域,切实予以保障。“为了贯彻《中共中央国务院关于深化教育改革全面推进素质教育的决定》和《国务院关于基础教育改革与发展的决定》,教育部决定要大力推进基础教育课程改革,调整和改革基础教育的课程体系、结构、内容,构建符合素质教育要求的新的基础教育课程体系。国家教育部于2001年6月7日颁布了《基础教育课程改革纲要(试行)》。在这一《基础教育课程改革纲要(试行)》中,提出课程改革的总目标和具体的目标。其具体目标用”六个改变“加以表述,其中第五个”改变“指的是要”改变课程评价过分强调甄别与选拔的功能,发挥评价促进学生发展、教师提高和改进教学实践的功能。“此外,该《基础教育课程改革纲要(试行)》的第14条中指出,要”建立促进学生全面发展的评价体系。评价不仅要关注学生的学业成绩,而且要发现和发展学生多方面的潜能,了解学生发展中的需求,帮助学生认识自我,建立自信。发挥评价的教育功能,促进学生的原有水平上的发展。建立促进教师不断提高的评价体系。强调教师对自己教学行为的分析与反思,建立以教师自评为主,校长、教师、学生、家长共同参与的评价制度,使教师从多种渠道获得信息,不断提高水平。建立促进课程不断发展的评价体系。周期性地对学校课程执行的情况、课程实施中的问题进行分析评估,调整课程内容、改进教学管理,形成课程不断革新的机制。“还提出要”继续改革和完善考试制度“;”考试内容应加强与社会实际和学生生活经验的联系, 重视考查学生分析问题、 解决问题的能力“;”考试命题要依据课程标准,杜绝设置偏题、怪题的现象“;”教师应对每位学生的考试情况做出具体的分析指导“等一系列要求。
总之,全面推进素质教育和新一轮基础教育课程改革呼唤教育测量与评价科学化。中共中央国务院以及教育部颁布的这些重要文件,是指导我们搞好教育教学改革的纲领性文件,也是我们开展教育测量与评价改革的指导性文件。
四、科学运用教育测量与评价是教师的专业素养和能力
(一)正确评价学生的发展是教师职业能力的重要组成部分
教育测量与评价对于教师来说是必不可少的。 在教 书育人过程中,教师需要作出一系列决策和判断,需要对学生的性向、能倾、成就、态度、兴趣、潜能及发展等进行较全面的了解,这就需要采用教育测量与评价多种方法,以弥补教师非正式观察之不足。教育测量与评价的技术手段不再是唯一的书面考试,而是涉及到测量与非测量的一整套评价技术。测量与评价的内容,不再是应该牢记和不该死记硬背的内容,而是涉及更广泛的教育目标。既然学生的发展是生动活泼、多样性的,那么,测量与评价的方法及其结论也应当是丰富多彩、多样化的、个别化的;测量与评价的目的,不再局限于给学生分等级排名次,而是对学生的发展和潜能进行系统的调查,发现学生的优点与长处,指出学生的缺点与不足,更重要的是要促进学生确立信心,认识自己的相对优势与弱势,明确自己的努力方向。测量与评价的指导思想是为了创造适合学生发展的教育环境,而不仅仅是为了选拔适合精英教育的学生。因此,现代教育测量与评价的思想方法对于教师创造性地教学、因材施教、提高教学质量具有重要的作用。教育测量与评价的知识是教师必备的专业知识修养;评价学生的能力是教师职业能力的重要组成部分。在教育教学过程中,科学运用教育测量与评价的有关技术方法,是所有成功教学的基础。
(二)国外教师教育普遍开设”教育测量与评价“类课程
在许多经济发达国家和地区,虽然教师教育模式不一定相同,但对所有想当教师的学生至少要学习十门左右的教育理论课程,这一点却是相同的。教育理论课程的学分比重,约占总学分的15~25%之间不等。其中包括”教育统计与测量“、”教育评价“等类型的课程。我国教师教育进入转型期。教师专业化是国际教师教育的必然趋势。为了培养能适应21世纪社会发展的优秀教师, 教师教育模式、 课程设置、教育理念等都要进行改革。,包括要适当加大教育理论课程的比重,要开设教育测量与评价之类具有教育专业性、教育技术性的课程。这是顺应国际教师教育的趋势,也是实现教师教育目标的必要措施。
在我国,早在20世纪30年代几乎所有的师范学生都要学习教育统计与测验。后来由于战争和国际政治斗争等因素影响,师范院校停止开设这类课程。直到改革开放后,国内才首先在高等师范院校教育系和心理系等少数专业中恢复教育统计学、教育测量学等课程。而教育评价的课程则更落后,不但教材建设不尽人意,而且到目前为止许多学校还只列为选修课,甚至没开设。与国外相比,我国师范教育课程结构中不仅教育理论课程比重偏小,而且除了教育系与心理系等少数专业外,绝大多数师范专业的学生没有学习教育统计、教育测量与评价的基本知识和技能,这是不符合国际师范教育的发展趋势,也不利于教师知识结构的优化。因此,这种现象应当引起有关部门的重视。不过,在我国台湾地区的情况则不一样。台湾地区的教师教育在理念、课程设置等方面与大陆有所差异。他们在教师教育过程中重视教育理论课程的教学,教育理论课程学分占总学分的25 %左右。目前,台湾地区也在进行新一轮的教育改革。比如, 对小学和初中阶段,他们准备用四年左右的时间完成”九年一贯“新课程改革计划。新课程改革体现了新的教育理念和科学理论,把课程内容改革、教与学方式改革、考试评价改革作为实施”九年一贯“课程改革的三个支撑点,并把多元评价与教材内容及教学活动有机地加以统整。这些经验值得我们借鉴与学习。
2. 教育评价学里的记忆力测量和评价方法有哪些
教育测量与教育评价既有区别又有联系:
区别:教育测量是针对教育效果或者针对学生各方面的发展予以测量和描述的过程,旨在获得有一定说服力的数量事实,是一种以量化为主要特征的事实判断。而教育评价是根据一定的标准,对教育事物或现象进行系统地调查,以获取足够多的资料事实。
教育评价的根本特征是做出价值判断,而教育测量的完结不一定都要做出价值判断。
联系:教育测量可以为教育评价提供价值判断的基本数量事实,教育测量是教育评价的基础;而教育评价是教育测量过程的延续,是对教育测量结果的解释与运用,并朝着价值判断与释放功能的方向发展。教育本身是一个系统。所谓系统,指的是具有一定目的、有输入和输出的、且具有反馈功能的有秩序的整体结构。在教育系统中,学校、教师、学生、教育方案、课程、教材、教学训练、考试评价等都是这个系统的组成部分。显然,我们期待教育方案、课程、教学等都能给学生带来某种变化,但不是说所有的教育方案、课程、教学都同样有效地改变学生,也不是所有的学习者会按同样的方式发生变化或有同样的变化程度。因此,当我们根据教育目标和计划, 把教育方案、课程、教学等因素(输入条件)作用于学生身上后,需参照教育目标和计划,对教育效果(输出)及其输入条件的妥当性予以测量评估、价值分析和判断。然后,把这一测量与评价过程所获得的信息反馈给教育者、学习者以及有关教育决策者,以便改进教育的策略与方案,更有效地达到教育目的。可以想见,在教育系统运转过程中,除了对教育效果(输出)要进行测量与评价外,还要针对影响教育效果的诸因素(输入)进行客观的分析和评价。教育测量与评价在教育系统中对实现教育目标起着十分重要的作用。
3. 态度测量的最常用的态度测量方法
态度量表最常用的态度测量方法使用的前提是假定被试意识到并愿意表达他的态度。但是在某些敏感问题上被试可能不愿意表达自己的态度﹐这时就需要采用间接方法﹐间接方法是使被试不意识到自己受到评价﹐或者虽然意识到但不知道评价的是什么。 可以假借评价其他方面如逻辑思维能力的名义评价态度。态度量表通常是由一系列有关所研究态度的陈述或项目组成﹐被试就每一项目表达自己同意或不同意的方向以及同意或不同意的程度。把反应分数加以整理得出一个表明态度的分数。
4. 评定测量工具测量精确度的方法都有哪些
评定测量工具在规定条件下的测量精确度。常见的评定方法有检定法、比对法和误差分离法。
1、检定法
测量工具按检定规程检定合格后,方能使用。一般是利用长度标准器检定,例如:用量块检定千分尺和卡尺;用标准线纹尺检定比长仪和测长机等。
2、比对法
利用两台以上相同精度等级的测量工具相互对比,以确定其精确度。这种方法适用于评定一些精度等级很高的测量工具,例如激光干涉仪、激光干涉比长仪等,因为对于这类高精度的测量工具,没有合适精度的长度标准器可供检定之用。
3、误差分离法
适用于一些高精度(形状误差小)和具有封闭圆周角的测量工具。例如检定1级平晶,如待检的三块平晶1、2、3的平面度误差分别为x、y、z,则把它们按1与2,2与3,3与1组合起来互检平面度。得出的量值分别为a、b、c。列出方程式x+y=a,y+z=b,x+z=c。解方程式后即可求出x、y、z的量值。此外,检定圆度仪和多齿分度台也可用这种方法。常用石英玻璃球圆度仪和多齿分度台也可用这种方法。常用石英玻璃球检定圆度仪,因玻璃球等也有误差,所以利用多次转位方法分离出玻璃球和圆度仪精密轴系各自的误差。多齿分度台也是利用其具有封闭圆周的特性,把两台多齿分度圆台重叠在一起,各自向相反方向依次转动一个相同的角度,从单色光自准直仪中读出其量值,把一系列测得的量值处理后从中求得每台各自的分度误差。
测量工具还可按工作原理分为机械、光学、气动、电动和光电等类型。这种分类方法是由测量工具的发展历史形成的。但一些现代测量工具已经发展成为同时采用精密机械、光、电等原理并与电子计算机技术相结合的测量工具,因此,这种分类方法仅适用于工作原理单一的测量工具。
5. 测量工作满意的综合评价法的要素有哪些
主要有以下几点:
1、遵纪守法,严格执行相关技术要求;
2、测量成果准确、可靠、提交及时;
3、服务态度好,处理问题高效;
4、根据客户需要和自己掌握的相关知识,为客户提供尽可能周全的参考意见;
5、收费公正合理,不瞒天要价。
6. 评价量表的评价量表的标准
一、测量精度和测量误差
测量值是指反映一个对象某个特殊的数值。测量值不是所感兴趣的真点值,而是它们的一个观测。有许多因素都会引起测量误差,可将观测值O表示成如下的形式:O=T+S+R
观测值O和真点值T之间的差距称为误差,误差的大小反映了测量的精度的高低。误差包括两部分:系统误差S和系统误差R。S是一种偏差,代表着影响观测值的稳定性因素,每次都以相同的方式影响观测值。可能产生系统误差的原因很多。
随机误差不稳定。代表看影响观测值的暂时性因素,次都以不同的形式出现,例如暂时性的人员因素或环境因素等。
二、内容效度、标准则效度和建构效度来评价量表。
内容效度是指量表涵盖研究主题的程度。调研人员必须检查量表中的项目能否是够地覆盖测量对象的主要方面。为了获得足够的内容效度,要特别注意设计量表时应遵循的程序和规则。
内容效度的主观性使其不能单独地用来衡量表的效度,但可以用来对观测结果作大致的评价。一个更好的评价量是下面介绍的准则效度。
准则效度是指量表所得到的数据和其他被选择的变量的值相比是否有意义。准则变量可以是人文学和心理学特好、态度和行为、以及从其他量表得到的数据。根据时间跨度的不同,准则效度可分为同时效度和预测效度。当量表的测量数据和准则变量的值被同时收集时,使用同时效度。
三、建构效度
建构效度要求对每个特征的测量背后有足够的理论支持,并且这些被测量的特征之间应该有合理的关系。建构效度包括同质效度、异质效度和语意逻辑效度。
同质效度是指量表测量同一特征的其他测量方法相互关联的程度。异质效度是指量表和测不同特征的测量方法不同但理论上有关特征的测量方法之间相互关联的程度。
在设计量表时,首先建立一个理论模型,然后从中导出一系列推论、测试,逐渐形成一个由几个特征系统地联系起来的语意逻辑网。从表面上看,就是含有多个有关测量对象测量项目的量表。
四、测量的信度
信度指的是如果重复测量,量表所测结果的一致程度。系统误差对信度没什么影响,因为系统误差总是以相同的方式影响测量值的,因此不会造成不一致性。随机误差可能导致不致性,从而降低信度。信度可以定义为随机误差R影响测量值的程度。R=0,就认为测量是完全可信的,信度最高。
一般通过使用同一量表进行不同测量,分析各测量结果之间联系的方法来评价信度。如果联系密切,各测量结果具有一致性,则认为量表是可信的。
五、评价信度的方法主要有:再预测量、替换形式、内部一致性方法。
再测信度:用同样的量表,对同一组访问对象在尽可量相同的情况下,在不同的时间进行两次测量。两次测量相距一般在两到四周之间。用两次测量结果间的相关分析或差异的显着性检验方法,可以评价量表信度的高低。结果越是相关,差异越不显着则信度越高。
替换形式信度:用两个形式不同的等价量表,对同一组受访者在不同的时间(通常间隔两到四周)进行测量。两次测量结果间的相关性被用来评价量表的信度。
内部一致信度:内部一致信度用于评价累加量表的信度。在这种量表中,各个测量项目的得分被累加以得到一个总分,每个项目都测量整个量表所要测量对象的某个方面,项目之间就它们各自的特征而言应该是一致的。内部一致信度强调的是组成量表的一组测量项目内部的一致性。
六、效度和信度的关系
效度和信度的关系可以用前面讨论过的测量值的构成公式O=T+S+R来理解。如果测量是完全有效的,即0=T,S=0,R=0,此时测量必然是完全可信的,若量表的信度不足,它也不可能完全有效,因为有O=T+R。
量表是完全可信的,可以达到完全有效,也可能达不到,存在导致误差,缺管信度缺乏效度,但信度的大小并不能体现效度的大小。信度是效度的必要条件,但不是充分条件。从理论的角度来看,量应具有足够的效度和信度;从实践的观点来看,一个好的量表还应该具有实用性。
7. 如何对一个测量法进行评价
跳出这个测量法,要从一个更高的角度去评判。比如:借鉴其它的测量方法,这个方法的思路中有何不足,有何优点。所选用的测量工具是否能满足成功测量,是否能有效排除测量者自身带来的误差。。
8. 急!评价测量方法的优缺点用什么方法数学建模!!!
me too
9. 测量结果有效性评价方法指的是什么
你指的是当监视与测量装置失效之后对监视和测量结果的有效性进行评价吧。 我们的做法是,对监测结果造成产品不良或者功能失效的可能性与影响程度进行的评估,从而为1)不做动作,维持出货 2)返工、返修 3)产品召回 三种措施的实施提供依据的构成,当然以上的动作在有必要的情况下,要与顾客沟通。
10. 评价信息的收集方法常用的有很多种,除了观察法,听汇报,测量法还有哪些
科学探究时,除了对比法还常用观察法、调查法、实验法 、测量法 、文献法、理想模型法、统计法、推理法、等效法。
科学探究的基本方法:
1、观察法2、调查法 3、实验法 4、测量法 5、文献法6、控制变量法、7、理想模型法。8、统计法、9、推理法。10等效法。