“相似性度量”的意思、由来-中文百科全书

聚类通常按照对象间的相似性进行分组，因此如何描述对象间相似性是聚类的重要问题。数据的类型不同，相似性的含义也不同。例如，对数值型数据而言，两个对象的相似度是指它们在欧氏空间中的互相邻近的程度；而对分类型数据来说，两个对象的相似度是与它们取值相同的属性的个数有关。

聚类分析按照样本点之间的亲疏远近程度进行分类。为了使类分得合理，必须描述样本之间的亲疏远近程度。刻画聚类样本点之间的亲疏远近程度主要有以下两类函数：

（1）相似系数函数：两个样本点愈相似，则相似系数值愈接近1；样本点愈不相似，则相似系数值愈接近0。这样就可以使用相似系数值来刻画样本点性质的相似性。

（2）距离函数：可以把每个样本点看作高维空间中的一个点，进而使用某种距离来表示样本点之间的相似性，距离较近的样本点性质较相似，距离较远的样本点则差异较大。

相似性的度量方法很多，有的用于专门领域，也有的适用于特定类型的数据，如何选择相似性的度量方法是一个相当复杂的问题，需要由领域专家确定采用哪些指标特征变量来精确刻画样本的性质，以及如何定义样本之间的相似性测度。

词条	相似性度量
释义	聚类通常按照对象间的相似性进行分组，因此如何描述对象间相似性是聚类的重要问题。数据的类型不同，相似性的含义也不同。例如，对数值型数据而言，两个对象的相似度是指它们在欧氏空间中的互相邻近的程度；而对分类型数据来说，两个对象的相似度是与它们取值相同的属性的个数有关。聚类分析按照样本点之间的亲疏远近程度进行分类。为了使类分得合理，必须描述样本之间的亲疏远近程度。刻画聚类样本点之间的亲疏远近程度主要有以下两类函数：（1）相似系数函数：两个样本点愈相似，则相似系数值愈接近1；样本点愈不相似，则相似系数值愈接近0。这样就可以使用相似系数值来刻画样本点性质的相似性。（2）距离函数：可以把每个样本点看作高维空间中的一个点，进而使用某种距离来表示样本点之间的相似性，距离较近的样本点性质较相似，距离较远的样本点则差异较大。相似性的度量方法很多，有的用于专门领域，也有的适用于特定类型的数据，如何选择相似性的度量方法是一个相当复杂的问题，需要由领域专家确定采用哪些指标特征变量来精确刻画样本的性质，以及如何定义样本之间的相似性测度。
随便看	重庆市职业技能鉴定指导中心重庆市植物病害生物学重点实验室重庆市志愿者夕阳红总队重庆市智能水表有限责任公司重庆市中安宾馆重庆市中等职业学校招生工作实施办法重庆市中典计算机职业培训学院重庆市中科职业技术培训学校重庆市中山医院重庆市中西医结合康复中心重庆市中西医结合医院重庆市中小学生人身伤害事故预防与处理条例重庆市中药研究院重庆市中医骨科医院重庆市中医条例重庆市中医院重庆市忠县拔山中学校重庆市忠县东溪中学重庆市忠县汝溪中学重庆市忠县三汇中学重庆市忠县新立中学重庆市忠县职业教育中心重庆市肿瘤医院重庆市肿瘤医院生物治疗中心重庆市重点中学田径运动会