请输入您要查询的百科知识:

 

词条 人机测试
释义

定义

人机测试,又称人机对话测试,指将编制开发好的标准化测验通过软件技术加载在计算机上,并按照测验的规范要求设定操作程序。被评价者根据程序指引直接在计算机上答题,答题结束后,计算机自动统计各测量内容的得分,并对比事先设定的常模,得出测评结果。简单点说,人机对话测试就是在计算机上完成的测试。

类型

目前,人机对话测试分单机版、局域网版、远程网络版几大类型。随着经济高速发展,企业规模不断扩大,网络技术日新月异,远程网络版人机对话测试逐渐成为主流,它不仅避免了传统纸笔测试在人力、物力、时间上的资源浪费,以及分数统计误差,还能解决不同地区同时测试统一管理的问题。

常识

标准化测验

 标准化测验是通过严格完整的程序编制的,具有事先确定的测验题目、规范的施测流程、客观的评分标准和标准的结果解释系统,此外还有测验的信度、效度和项目分析数据等相关资料用以说明测验的质量。因此,一套好的标准化测验的编制成本比较高,但相应地,它的科学性和价值也非常高,此外,一旦编制成功,它具有使用方便、经济、客观等特点。

编制一套标准化测验时,专业研究人员通常要经过如下几大步骤:确定与分析测量的目标和内容——题目的编写与排列——预测与题目分析——题目修订——规范测试程序和要求——样本收集与建立常模——信度效度等相关分析——制定结果解释

标准化测验能够对人的许多方面进行比较客观的评价,尤其在评价底层潜在的、不易从行为表现中直接观察出来的素质时,显示出比较高的有效性,如个性特征、智力、能力倾向、价值观、兴趣等。

信度

信度表示测量数据和结论的可靠性程度,即评价工具稳定地测评到它要测量的内容的程度。一般来说,检验信度有以下几种方法:

重测信度:在恰当的时间间隔前后,重复同样的测量,统计两次测量结果的匹配程度。

复本信度:用原本和复本同时进行测量,统计原本和复本测量结果的相关程度。

分半信度:在没有复本且不能重测的情况下,将同一测量内容的测验题目随机分成两组,统计两组测量结果的相关程度。

评分者信度:用于测量工具的标准化程度较低的情况下,比较典型的是评委主观评分的测量。不同评委的判分标准会影响测量的信度,因此需用计算两位评委评分的相关程度。

效度

效度表示评价的正确性程度,即评价工具准确地反映到它要测量的内容的程度。一般来说,检验效度有以下几种方法:

内容效度:系统地检查测量内容的适当性,即根据对要测量内容的了解去鉴别测验题目。

准则效度:用已经被假设或定义为测量某一内容有效的工具作为效标,当用新的测量工具对该内容进行测量时,统计测量结果与效标测量结果的一致性程度。

结构效度:系统地检查测量工具是否反映了要测量内容的概念和命题结构,这种方法常常在理论的研究中使用,因此也被称为理论效度。

从信度和效度的关系上来看,信度不高,效度必定不高;信度高,效度不一定高;效度不高,信度不一定不高;效度高,信度必定高。

常模

 测量结果是否准确,常模(Norm)的适合性是非常关键的因素。常模是一群人在同一测量工具中得分的分布情形,这群人就是获得该常模的样本。某人在某一测量工具中的得分,需要经过常模的比较才具有意义和参考价值。例如,某人完成100题数学题,答对了70题,那么他的成绩属于优秀、普通还是不及格,就需要和他同年龄、同教育水平的群体进行比较。因此,为使测量结果更为准确,常模需要依据性别、年龄、学历,甚至所在区域、岗位性质、职位高低、行业背景等进行细分。

标准九分

它是一种标准分,将样本的测验原始得分划分为9部分,最高是9分,最低1分,除1和9的范围略大以外,其余均是以5为中心向两边各包含0.5个标准差的分数段。简单理解,即9为最高分,1为最低分,5为中间分。

掩饰性

 受到测评动机的影响,被评价者在完成某些测验(如个性特征测验)时,有时会掩饰自身的真实情况,揣测测验编制者的出题用意,从社会赞许度较高的方向答题,容易导致测评结果不能准确反映被评价者的实际,甚至与实际截然相反。为鉴别真实回答与虚假回答,测验编制者在非能力测评的测验中加入掩饰性分量表,通过分析被评价在掩饰性分量表上的得分高低,了解其在测验过程中是否存在掩饰性以及掩饰程度,从而推断整个测验结果的准确性和有效性。

随便看

 

百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。

 

Copyright © 2004-2023 Cnenc.net All Rights Reserved
更新时间:2025/1/11 8:11:41