词条 | 多示例学习 |
释义 | 多示例学习是20世纪90年代人们在研究药物活性时提出来的。 1997年,T. G. Dietterich 等人对药物活性预测问题进行了研究。其目的是构建一个学习系统,通过对已知适于或不适于制药的分子进行学习,尽可能正确地预测其他新的分子是否适合制药。由于每个分子都有很多种可能的稳定同分异构体共存,而生物化学家目前只知道哪些分子适于制药,并不知道其中的哪一种同分异构体起到了决定性作用。如果使用传统的有监督学习的方法,将适合制药的分子的所有稳定同分异构体作为正样本显然会引入很多噪声。因此,提出来多示例学习的问题。 多示例学习是在包的粒度对样本进行标记,而每个包中包含若干个示例,示例并无标记。若某个包被标记为正包,则该包中至少有一个正示例;反之,若某个包被标记为负包,则该包中的所有示例为负示例。多示例学习的目的就是通过对这些标注的包学习,尽可能准确地对新的包做出判断。 多示例学习自提出十几年以来,一直成为研究的热点。从最初T. G. Dietterich等人提出该方法时给出的三个基于轴平行矩形的方法,到后来的DD、EMDD、Citation-kNN,以及SVM、神经网络、条件随机场方法在多示例学习中的运用。 多示例学习具有广泛的应用,例如:图像检索、文本分类等。 |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。