请输入您要查询的百科知识:

 

词条 TDT
释义

话题检测与跟踪

话题检测与跟踪(Topic Detection and Tracking)是近年提出的一项信息处理技术,这项技术旨在帮助人们应对日益严重的互联网信息爆炸问题,对新闻媒体信息流进行新话题的自动识别和已知话题的持续跟踪。自从1996年以来,该领域进行了多次大规模评测,为信息识别、采集和组织等相关技术提供了新的测试平台。由于话题检测与跟踪相对于信息检索、数据挖掘和信息抽取等自然语言处理技术具有很多共性,并且面向具备突发性和延续性规律的新闻语料,因此逐渐成为当前信息处理领域的研究热点。

与一般的信息检索或者信息过滤不同,TDT所关心的话题不是一个大的领域(如美国的对华政策)或者某一类事件(如恐怖活动),而是一个很具体的“事件(Event)”,如美国911事件、江泽民访美等等。为了区别于语言学上的概念,TDT评测会议对“话题”进行了定义:所谓话题(Topic),就是一个核心事件或活动以及与之直接相关的事件或活动。而一个事件(Event)通常由某些原因、条件引起,发生在特定时间、地点,涉及某些对象(人或物),并可能伴随某些必然结果。通常情况下,可以简单地认为话题就是若干对某事件相关报道的集合[1]。“话题检测与跟踪”则定义为“在新闻专线(Newswire)和广播新闻等来源的数据流中自动发现主题并把主题相关的内容联系在一起的技术”

。例如,“俄克拉荷马城爆炸案”这个主题包括1995年美国联邦大楼被炸、悼念仪式、州和美国联邦政府的一系列调查、对Timothy McVeigh的指控等等。这个定义和其它与话题有关的研究不同,那些研究主要处理信息分类问题,比如任何与爆炸有关的事件。处理分类问题需要专门的分类体系,注解起来效率低而且主观色彩浓厚。TDT与其它研究不同之处还在于它强调新事件的发现,希望找出不在人们意料之中的或没有人知道如何去查询的事件。

TDT是一项综合的技术,需要比较多的自然语言处理理论和技术作为支撑,因此这些测评对其进行了细化。根据不同的应用需求,TDT评测会议把话题检测和跟踪分成五个子任务。

报道切分(Story Segmentation)找出所有的报道边界,把输入的源数据流分割成各个独立的报道。

话题跟踪(Story Tracking)给出某话题的一则或多则报道,把后输入进来的相关报道和该话题联系起来。它实际上包括两步,首先给出一组样本报道,训练得到话题模型,然后在后续报道中找出所有讨论目标话题的报道。

话题检测(Story Detection)发现以前未知的新话题。

首次报道检测(New Event Detection)在数据流中检测或发现首次,并且只能是首次讨论某个话题的报道。与话题检测本质相同,区别只在于结果输出的形式不同。

关联检测(Link Detection)判断两则报道是否讨论的是同一个话题。

主要实现方法

构造一个实用化的TDT系统是进行TDT研究的主要目的之一,也是检验现有方法优劣的基础。从参评的数量来看,话题发现和话题跟踪两个子任务最受关注。因此我们介绍的实现方法也以这两个任务为主。总体而言,要实现话题发现与跟踪功能,需要解决以下主要问题:

(1)话题/报道的模型化

(2)话题-报道相似度的计算

(3)聚类策略

(4)分类策略(阈值选择策略)

[1]显然,对这种相关性必须做一个界定,不能任由集合无限扩大。为此,TDT会议组织者在构造TDT语料时,对挑选出来的每个话题都定义了相关性判定规则。

末端脱氧核苷酸转移酶

末端脱氧核苷酸转移酶 : This enzyme functions physiologically by adding extra nucleotides to the joining regions between antigen receptor gene segments during the gene rearrangement process, thereby increasing genetic diversity.

TDT:MPEG-2传送流中的时间与日期表

在数字电视领域中,TDT是MPEG-2传送流中包含的各种业务信息(SI)表之一,是时间与日期表的缩写,用于更新IRD的内部时钟,其语法结构如下图所示:

table_id section
syntax
indicator reserved
future
use reserved section
length UTC
time它只运载UTC-时间和日期信息,由单个的分段组成。该TDT分段以PID值为0X0014的TS包传输。Table_id值为0X70。该表指示出当前的时间即协调世界时(UTC:Co_ordinate UniversalTime)及日期修正儒略日(MJD:Modified Julian Day)。TDT传输已编码为MJD的实际UTC时间。可以用来同步化一个

IRD的内部时钟。至少30s要传输TDT。

".tdt" 网点纸文件

TDT格式是日本专业漫画软件Comicstudio中,滤镜《PowerTone3》的网点纸格式。将《PowerTone3》滤镜安装到Adobe Photoshop的滤镜中同样可以运行".tdt"格式的网点纸文件。

TDT: Transmission disequilibrium test(传递不平衡分析)

用于消除群体遗传学中由于奠基者效应,瓶颈效应和遗传漂变等造成的群体间基因频率超级较大的群体分层或层化现象的统计学方法

列车发车计时器(TDT)

列车发车计时器(Train Depart Timer, TDT),设于各车站,为列车运行提供车站发车时机,列车到站晚点情况的时间指 示,提示列车按计划时刻表运行.正常情况下,在列车整列进入站台后,按系统给定站 停时间倒计时显示距计划时刻表的发车时间,为零时指示列车发车;若列车晚点发车, 则 TDT 增加停站时间的计时.在特殊情况下,若实施了站台扣车控制,TDT 给出"H"显 示;如有提前发车命令,TDT 立即显示零;列车通过车站时 TDT 显示"="

热力致死时间

热力致死时间

(thermal death time)

指在某一恒定温度条件下,将食品中的某种微生物活菌全部杀死所需要的时间 min.

热中子衰减时间

thermal decay time 热中子衰减时间测井(TDT) 斯伦贝谢开发的一种核测井仪器,阿特拉斯称为中子寿命测井仪,国内多接受后者的称法(简称其为sigma log)。

随便看

 

百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。

 

Copyright © 2004-2023 Cnenc.net All Rights Reserved
更新时间:2025/3/4 13:00:27