“人机测试”的意思、由来-中文百科全书

定义

人机测试，又称人机对话测试，指将编制开发好的标准化测验通过软件技术加载在计算机上，并按照测验的规范要求设定操作程序。被评价者根据程序指引直接在计算机上答题，答题结束后，计算机自动统计各测量内容的得分，并对比事先设定的常模，得出测评结果。简单点说，人机对话测试就是在计算机上完成的测试。

类型

目前，人机对话测试分单机版、局域网版、远程网络版几大类型。随着经济高速发展，企业规模不断扩大，网络技术日新月异，远程网络版人机对话测试逐渐成为主流，它不仅避免了传统纸笔测试在人力、物力、时间上的资源浪费，以及分数统计误差，还能解决不同地区同时测试统一管理的问题。

常识

标准化测验

　标准化测验是通过严格完整的程序编制的，具有事先确定的测验题目、规范的施测流程、客观的评分标准和标准的结果解释系统，此外还有测验的信度、效度和项目分析数据等相关资料用以说明测验的质量。因此，一套好的标准化测验的编制成本比较高，但相应地，它的科学性和价值也非常高，此外，一旦编制成功，它具有使用方便、经济、客观等特点。

编制一套标准化测验时，专业研究人员通常要经过如下几大步骤：确定与分析测量的目标和内容——题目的编写与排列——预测与题目分析——题目修订——规范测试程序和要求——样本收集与建立常模——信度效度等相关分析——制定结果解释

标准化测验能够对人的许多方面进行比较客观的评价，尤其在评价底层潜在的、不易从行为表现中直接观察出来的素质时，显示出比较高的有效性，如个性特征、智力、能力倾向、价值观、兴趣等。

信度

信度表示测量数据和结论的可靠性程度，即评价工具稳定地测评到它要测量的内容的程度。一般来说，检验信度有以下几种方法：

重测信度：在恰当的时间间隔前后，重复同样的测量，统计两次测量结果的匹配程度。

复本信度：用原本和复本同时进行测量，统计原本和复本测量结果的相关程度。

分半信度：在没有复本且不能重测的情况下，将同一测量内容的测验题目随机分成两组，统计两组测量结果的相关程度。

评分者信度：用于测量工具的标准化程度较低的情况下，比较典型的是评委主观评分的测量。不同评委的判分标准会影响测量的信度，因此需用计算两位评委评分的相关程度。

效度

效度表示评价的正确性程度，即评价工具准确地反映到它要测量的内容的程度。一般来说，检验效度有以下几种方法：

内容效度：系统地检查测量内容的适当性，即根据对要测量内容的了解去鉴别测验题目。

准则效度：用已经被假设或定义为测量某一内容有效的工具作为效标，当用新的测量工具对该内容进行测量时，统计测量结果与效标测量结果的一致性程度。

结构效度：系统地检查测量工具是否反映了要测量内容的概念和命题结构，这种方法常常在理论的研究中使用，因此也被称为理论效度。

从信度和效度的关系上来看，信度不高，效度必定不高；信度高，效度不一定高；效度不高，信度不一定不高；效度高，信度必定高。

常模

　测量结果是否准确，常模(Norm)的适合性是非常关键的因素。常模是一群人在同一测量工具中得分的分布情形，这群人就是获得该常模的样本。某人在某一测量工具中的得分，需要经过常模的比较才具有意义和参考价值。例如，某人完成100题数学题，答对了70题，那么他的成绩属于优秀、普通还是不及格，就需要和他同年龄、同教育水平的群体进行比较。因此，为使测量结果更为准确，常模需要依据性别、年龄、学历，甚至所在区域、岗位性质、职位高低、行业背景等进行细分。

标准九分

它是一种标准分，将样本的测验原始得分划分为9部分，最高是9分，最低1分，除1和9的范围略大以外，其余均是以5为中心向两边各包含0.5个标准差的分数段。简单理解，即9为最高分，1为最低分，5为中间分。

掩饰性

　受到测评动机的影响，被评价者在完成某些测验（如个性特征测验）时，有时会掩饰自身的真实情况，揣测测验编制者的出题用意，从社会赞许度较高的方向答题，容易导致测评结果不能准确反映被评价者的实际，甚至与实际截然相反。为鉴别真实回答与虚假回答，测验编制者在非能力测评的测验中加入掩饰性分量表，通过分析被评价在掩饰性分量表上的得分高低，了解其在测验过程中是否存在掩饰性以及掩饰程度，从而推断整个测验结果的准确性和有效性。

词条	人机测试
释义	定义类型常识定义人机测试，又称人机对话测试，指将编制开发好的标准化测验通过软件技术加载在计算机上，并按照测验的规范要求设定操作程序。被评价者根据程序指引直接在计算机上答题，答题结束后，计算机自动统计各测量内容的得分，并对比事先设定的常模，得出测评结果。简单点说，人机对话测试就是在计算机上完成的测试。类型目前，人机对话测试分单机版、局域网版、远程网络版几大类型。随着经济高速发展，企业规模不断扩大，网络技术日新月异，远程网络版人机对话测试逐渐成为主流，它不仅避免了传统纸笔测试在人力、物力、时间上的资源浪费，以及分数统计误差，还能解决不同地区同时测试统一管理的问题。常识标准化测验　标准化测验是通过严格完整的程序编制的，具有事先确定的测验题目、规范的施测流程、客观的评分标准和标准的结果解释系统，此外还有测验的信度、效度和项目分析数据等相关资料用以说明测验的质量。因此，一套好的标准化测验的编制成本比较高，但相应地，它的科学性和价值也非常高，此外，一旦编制成功，它具有使用方便、经济、客观等特点。编制一套标准化测验时，专业研究人员通常要经过如下几大步骤：确定与分析测量的目标和内容——题目的编写与排列——预测与题目分析——题目修订——规范测试程序和要求——样本收集与建立常模——信度效度等相关分析——制定结果解释标准化测验能够对人的许多方面进行比较客观的评价，尤其在评价底层潜在的、不易从行为表现中直接观察出来的素质时，显示出比较高的有效性，如个性特征、智力、能力倾向、价值观、兴趣等。信度信度表示测量数据和结论的可靠性程度，即评价工具稳定地测评到它要测量的内容的程度。一般来说，检验信度有以下几种方法：重测信度：在恰当的时间间隔前后，重复同样的测量，统计两次测量结果的匹配程度。复本信度：用原本和复本同时进行测量，统计原本和复本测量结果的相关程度。分半信度：在没有复本且不能重测的情况下，将同一测量内容的测验题目随机分成两组，统计两组测量结果的相关程度。评分者信度：用于测量工具的标准化程度较低的情况下，比较典型的是评委主观评分的测量。不同评委的判分标准会影响测量的信度，因此需用计算两位评委评分的相关程度。效度效度表示评价的正确性程度，即评价工具准确地反映到它要测量的内容的程度。一般来说，检验效度有以下几种方法：内容效度：系统地检查测量内容的适当性，即根据对要测量内容的了解去鉴别测验题目。准则效度：用已经被假设或定义为测量某一内容有效的工具作为效标，当用新的测量工具对该内容进行测量时，统计测量结果与效标测量结果的一致性程度。结构效度：系统地检查测量工具是否反映了要测量内容的概念和命题结构，这种方法常常在理论的研究中使用，因此也被称为理论效度。从信度和效度的关系上来看，信度不高，效度必定不高；信度高，效度不一定高；效度不高，信度不一定不高；效度高，信度必定高。常模　测量结果是否准确，常模(Norm)的适合性是非常关键的因素。常模是一群人在同一测量工具中得分的分布情形，这群人就是获得该常模的样本。某人在某一测量工具中的得分，需要经过常模的比较才具有意义和参考价值。例如，某人完成100题数学题，答对了70题，那么他的成绩属于优秀、普通还是不及格，就需要和他同年龄、同教育水平的群体进行比较。因此，为使测量结果更为准确，常模需要依据性别、年龄、学历，甚至所在区域、岗位性质、职位高低、行业背景等进行细分。标准九分它是一种标准分，将样本的测验原始得分划分为9部分，最高是9分，最低1分，除1和9的范围略大以外，其余均是以5为中心向两边各包含0.5个标准差的分数段。简单理解，即9为最高分，1为最低分，5为中间分。掩饰性　受到测评动机的影响，被评价者在完成某些测验（如个性特征测验）时，有时会掩饰自身的真实情况，揣测测验编制者的出题用意，从社会赞许度较高的方向答题，容易导致测评结果不能准确反映被评价者的实际，甚至与实际截然相反。为鉴别真实回答与虚假回答，测验编制者在非能力测评的测验中加入掩饰性分量表，通过分析被评价在掩饰性分量表上的得分高低，了解其在测验过程中是否存在掩饰性以及掩饰程度，从而推断整个测验结果的准确性和有效性。
随便看	镇痛安眠枕镇痛棒镇痛泵镇痛分娩镇痛活络酊镇痛剂肾病镇痛醚镇痛新镇痛药镇痛药研究方法学镇头村镇头遗址镇头镇镇头中学镇吐药镇万华镇万新镇委书记镇武村镇物镇西镇西堡站镇西堡镇镇西村镇西大将军