“内容效度”的意思、由来-中文百科全书

简介

概念

内容效度又称逻辑效度，是指项目对欲测的内容或行为范围取样的适当程度。如，教师为了了解学生在某一学科或某一课题上对知识的掌握情况，若时间许可，可以进行一个全面的考试，包含所有有关的内容，这显然行不通。于是，就从这一范围总体中选一样本，也就是从可能的题目中取样来编测验，根据测验分数推论学生在该范围总体的知识。若测验题目是这个范围的好样本，则推论将有效；若选题有偏差，则推论将无效。由于这种测验的效度主要与测验内容有关，所以叫内容效度。

一个测验要有内容效度必须具备的条件：

1. 要有定义得完好的内容范围。所谓内容范围，可以是一个明确而有限的题目总体（如20以内的加减法），也可以是具体的知识和技能，也可以是复杂的行为，如中小学生的心理健康的特点和表现。成就测验主要目的是测量学生在某一学科中学习的效果，此种测验的内容范围容易确定，但人格测验、兴趣测验等，测验的内容范围较难确定。

2.测验项目应是已界定的内容范围的代表性样本。如果把所有的内容视为一个总体，那么测验项目可以视为一个样本，这个样本要具有代表性，这个样本能够代表总体的程度就是内容效度。在正式编制测验时，要做到这一点非常不容易。成就测验好像较能够做到这一点，但光是从形式上做到这一点还是不行，因为学生对知识的掌握程度不仅取决于对学习内容的记忆，还有理解和应用等，因此，如果只从对知识的记忆上去取样，那就是有偏的样本，还得考虑理解、应用等方面。对于智力测验、人格测验、兴趣测验等就更难解决。如，智力测验，智力结构十分复杂，内容异常丰富，要用若干题目来代表全部智力，确实难度较大。著名的斯坦福－比奈量表经过了5年潜心研究和大规模的测试，才编制了这个测验。另外，由于智力和知识的密切的关系，有的智力测验的题目不能代表智力内容，实际上测量的是人的知识水平，这样的项目就不具有代表性。

验证测验内容效度的一般程序

以教育测验为例

1、确定所要测量的全部内容范围；

2、将测验目的具体化为不同层次的测验目标；

3、确定每一层测验目标在整个测验中的比重；

3、编制双向细目表；

4、确定每一小格中的测题数量；

5、按比例随机抽取测验题目；

6、请专家对测题的代表性、适合性进行分析，并作必要的修改，直到大多数专家满意为止。

确定内容效度的方法

（一）专家判断法

这是一种定性分析的方法，由专家对测验项目与所涉及的内容范围进行符合性判断。

我们以教育测验为例来说明应遵循的程序。

1.确定所要测量的全部内容范围。比如要考察某一学科测验是否有效度，就要根据教材和教学大纲列出这门课程的全部知识点。

2.根据教育目标的要求，将测验目的具体化为不同层次的测验目标。教育测验目标一般采用布鲁姆教育目标分类学中的分类标准，将测验目标分成知识、理解、应用、分析、综合、评价六个层次。按不同层次的测验目标对知识点进行分类。

3.确定每一层次目标在整个测验项目中所占的比重。

4.编制测验双向细目表。

5.请专家对双向细目表以及测题是否符合双向细目表的内容要求、测题的形式是否合适等进行评定。

6.对测题进行必要的修改，直至多数专家对测验的内容效度感到满意为止。最后，报告专家评定的情况，这个评定结果可以作为内容效度。

以上验证内容效度的方法是纯粹逻辑的方法，在很大程度上依赖于测验编制者和有关专家的主观经验。测验内容效度的确定还可以采用统计方法，以弥补专家判断的不足。

（二）计算方法

内容效度比

让本专业的专家对取样的代表性进行分析，评价某一测验项目是否具有代表性，统计出专家中认为某一项目能代表所要测量的内容范围的人数，再用公式计算出内容效度之比

CVR=（ni- N/2）/ (N/2 ) （公式6－1）

式中CVR表示内容效度比，ni表示专家中认为某项目具有代表性的程度，N表示参加评定的专家的总人数。

根据内容效度比，删除内容效度比低的项目。计算全部项目的内容效度比的平均数，作为内容效度的指标。

内容效度与表面效度

表面效度的概念

表面效度（Face Validity）:指外行人从表面上看测验是否有效，测验题目与测验目的是否一致。表面效度不是真正的效度指标，但它容易和内容效度搞混。

内容效度和表面效度的区别：

表面效度是外行对测验作表面上的检查确定的，而内容效度是专家对测验进行详尽的、系统的评价建立的。

虽然两者都是对测验内容作出的主观判断，但判断的标准不同。前者只考虑测验项目与测验目的之间的明显的、直接的关系，后者则同时考虑到测验项目与测验目的和总体内容之间的逻辑的本质的联系。

表面效度高的题目内容效度不一定高，表面效度低的项目内容效度也不一定低。如，明尼苏达个性调查表中有这样的题目：“我的喉咙里总好像有一块东西堵着似的。”表面上看来这种题目似乎与个性无关，但在临床上，回答“是”的人很可能是癔病或神经衰弱患者。

词条	内容效度
释义	简介(概念一个测验要有内容效度必须具备的条件：验证测验内容效度的一般程序) 确定内容效度的方法(（一）专家判断法（二）计算方法) 内容效度与表面效度(表面效度的概念内容效度和表面效度的区别：测验对表面效度的考虑：) 内容效度的应用和评价(适用范围缺点) 简介概念内容效度又称逻辑效度，是指项目对欲测的内容或行为范围取样的适当程度。如，教师为了了解学生在某一学科或某一课题上对知识的掌握情况，若时间许可，可以进行一个全面的考试，包含所有有关的内容，这显然行不通。于是，就从这一范围总体中选一样本，也就是从可能的题目中取样来编测验，根据测验分数推论学生在该范围总体的知识。若测验题目是这个范围的好样本，则推论将有效；若选题有偏差，则推论将无效。由于这种测验的效度主要与测验内容有关，所以叫内容效度。一个测验要有内容效度必须具备的条件： 1. 要有定义得完好的内容范围。所谓内容范围，可以是一个明确而有限的题目总体（如20以内的加减法），也可以是具体的知识和技能，也可以是复杂的行为，如中小学生的心理健康的特点和表现。成就测验主要目的是测量学生在某一学科中学习的效果，此种测验的内容范围容易确定，但人格测验、兴趣测验等，测验的内容范围较难确定。 2.测验项目应是已界定的内容范围的代表性样本。如果把所有的内容视为一个总体，那么测验项目可以视为一个样本，这个样本要具有代表性，这个样本能够代表总体的程度就是内容效度。在正式编制测验时，要做到这一点非常不容易。成就测验好像较能够做到这一点，但光是从形式上做到这一点还是不行，因为学生对知识的掌握程度不仅取决于对学习内容的记忆，还有理解和应用等，因此，如果只从对知识的记忆上去取样，那就是有偏的样本，还得考虑理解、应用等方面。对于智力测验、人格测验、兴趣测验等就更难解决。如，智力测验，智力结构十分复杂，内容异常丰富，要用若干题目来代表全部智力，确实难度较大。著名的斯坦福－比奈量表经过了5年潜心研究和大规模的测试，才编制了这个测验。另外，由于智力和知识的密切的关系，有的智力测验的题目不能代表智力内容，实际上测量的是人的知识水平，这样的项目就不具有代表性。验证测验内容效度的一般程序以教育测验为例 1、确定所要测量的全部内容范围； 2、将测验目的具体化为不同层次的测验目标； 3、确定每一层测验目标在整个测验中的比重； 3、编制双向细目表； 4、确定每一小格中的测题数量； 5、按比例随机抽取测验题目； 6、请专家对测题的代表性、适合性进行分析，并作必要的修改，直到大多数专家满意为止。确定内容效度的方法（一）专家判断法这是一种定性分析的方法，由专家对测验项目与所涉及的内容范围进行符合性判断。我们以教育测验为例来说明应遵循的程序。 1.确定所要测量的全部内容范围。比如要考察某一学科测验是否有效度，就要根据教材和教学大纲列出这门课程的全部知识点。 2.根据教育目标的要求，将测验目的具体化为不同层次的测验目标。教育测验目标一般采用布鲁姆教育目标分类学中的分类标准，将测验目标分成知识、理解、应用、分析、综合、评价六个层次。按不同层次的测验目标对知识点进行分类。 3.确定每一层次目标在整个测验项目中所占的比重。 4.编制测验双向细目表。 5.请专家对双向细目表以及测题是否符合双向细目表的内容要求、测题的形式是否合适等进行评定。 6.对测题进行必要的修改，直至多数专家对测验的内容效度感到满意为止。最后，报告专家评定的情况，这个评定结果可以作为内容效度。以上验证内容效度的方法是纯粹逻辑的方法，在很大程度上依赖于测验编制者和有关专家的主观经验。测验内容效度的确定还可以采用统计方法，以弥补专家判断的不足。（二）计算方法内容效度比让本专业的专家对取样的代表性进行分析，评价某一测验项目是否具有代表性，统计出专家中认为某一项目能代表所要测量的内容范围的人数，再用公式计算出内容效度之比 CVR=（ni- N/2）/ (N/2 ) （公式6－1）式中CVR表示内容效度比，ni表示专家中认为某项目具有代表性的程度，N表示参加评定的专家的总人数。根据内容效度比，删除内容效度比低的项目。计算全部项目的内容效度比的平均数，作为内容效度的指标。内容效度与表面效度表面效度的概念表面效度（Face Validity）:指外行人从表面上看测验是否有效，测验题目与测验目的是否一致。表面效度不是真正的效度指标，但它容易和内容效度搞混。内容效度和表面效度的区别：表面效度是外行对测验作表面上的检查确定的，而内容效度是专家对测验进行详尽的、系统的评价建立的。虽然两者都是对测验内容作出的主观判断，但判断的标准不同。前者只考虑测验项目与测验目的之间的明显的、直接的关系，后者则同时考虑到测验项目与测验目的和总体内容之间的逻辑的本质的联系。表面效度高的题目内容效度不一定高，表面效度低的项目内容效度也不一定低。如，明尼苏达个性调查表中有这样的题目：“我的喉咙里总好像有一块东西堵着似的。”表面上看来这种题目似乎与个性无关，但在临床上，回答“是”的人很可能是癔病或神经衰弱患者。测验对表面效度的考虑：表面效度不是效度的客观指标，不能保证测验的正确性，但能对受测者的动机产生影响，因而也会影响到测验的效度。如，智力测验、成就测验，受测者看出测验题目反应自己的智力、能力，受测者会尽力去完成这些题目，最大限度地表现自己的能力和水平，对于某些人格测验、态度测验，被试如果看出这些项目与自己的人格缺陷、品德有关，被试会有意地掩盖自己的缺点，从而产生虚假反应，如，：“我偷过东西。”让被试判断是否，被试即使偷过也会说否。因此，编制测验时应根据编制测验的要求提高或降低表面效度，如人格测验，表面效度应该低，使被试看不出来，从而让被试作出真实的反应，能力测验应该提高表面效度，以激发被试的答题动机。内容效度的应用和评价适用范围内容效度适合于测验所要测量的内容总体能够明确界定的情况。因此尤其适合对教育测验的效度的考察。内容效度对各种用于人员选拔和安置的职业测验也是适用的。职业测验关心的是被试是否具有从事某项职业的知识、技能等，那么要明确某项职业所需的全部知识和技能，再对这些知识和技能进行取样，取出一个有代表性的样本。缺点内容效度对能力倾向测验和人格测验不是很合适，因为它们要测量的往往是较抽象的特质，其范围难以明确界定，没有明确的内容范围，就无法考证测验项目是否具有代表性。缺点：缺乏理想的数量指标，因而妨碍了信息交流和各测验的相互比较。
随便看	泰克飞石极客J2 泰克科技有限公司泰克斯·温特泰克塔力克泰克网络实验室泰客蛋糕泰库奇泰坤钢铁有限公司泰坤堂中医医院泰坤堂中医院泰拉泰拉·班克斯泰拉·瑞德泰拉伯特泰拉尔泰拉马拉文化泰拉霉素泰拉蒙战役泰拉莫泰拉齐诺泰拉瑞亚泰拉石泰拉石臂铠泰拉石大剑泰拉石短剑