词条 | OHSUMED |
释义 | OHSUMED 数据集合由William Hersh和他的同事们一起建立,其文档来源于医药信息数据库MEDLINE10,它包含了从1987 年到1991 年五年间270 个医药类杂志的标题和/或摘要,包含了348566个文档。一个OHSUMED 文档由8 个域组成,含义如下:z .I 文章的OHSUMED 序列号,从1 到348566 z .U MEDLINE 标识 z .S 文章来源 z .M MeSH 索引词 z .T 文章标题 z .P 文章类型 z .W 文章摘要 z .A 文章作者 OHSUMED 的作者还为文档集合构造了106 个查询,这些查询来源于医生在给病人看病的过程中所提交的查询字符串,每一个查询由两部分组成:病人情况的简单描述和所需信息的描述。一个OHSUMED 查询由如下3 不同域组成: z .I 文章的OHSUMED 序列号,从1 到106 z .B 患者信息 z .W 信息需求 基于以上的文档集合和查询集合,OHSUMED 一共标注了16140 个查询-文 档对,每一个查询-文档对都被标注成相关(definitely relevant)、部分相关(partially relevant)或者不相关(not relevant),最终的标注结果中一共包含了2557个相关、2932 个部分相关以及12498 个不相关的查询-文档对(一个文档可能被标记成多个级别,在本节的实验中,取其级别最高的标号作为其最终标号)。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。