层次聚类及谱系图 介绍及python实现 | 您所在的位置:网站首页 › 谱系图如何分析 › 层次聚类及谱系图 介绍及python实现 |
层次聚类及谱系图
1.谱系图介绍2.代码实现3.参数介绍
1.谱系图介绍
如何看懂谱系图 2.代码实现数据:test.xlsx
scipy.cluster.hierarchy.linkage(y, method='single',metric='euclidean',optimal_ordering=False) y:需要进行层次聚类的数据,这里即可用使用开始读取的数据变量df method:层次聚类选用的方法,下面罗列了七种方法,比如: single方法代表将两个组合数据点中距离最近的两个数据点间的距离作为这两个组合数据点的距离。 这种方法容易受到极端值的影响。两个很相似的组合数据点可能由于其中的某个极端的数据点距离较近而组合在一起。 两个簇之间的距离公式: complete方法与Single Linkage相反,将两个组合数据点中距离最远的两个数据点间的距离作为这两个组合数据点的距离。 Complete Linkage的问题也与Single Linkage相反,两个不相似的组合数据点可能由于其中的极端值距离较远而无法组合在一起。 两个簇之间的距离公式: average方法代表是计算两个组合数据点中的每个数据点与其他所有数据点的距离。将所有距离的均值作为两个组合数据点间的距离。这种方法计算量比较大,但结果比前两种方法更合理。两个簇之间的距离公式: weighted 即两个簇之间的距离公式: centroid 即两个簇之间的距离公式: median 同centroid ward 即两个簇之间的距离公式: metric:距离计算的方法,即上面方法中的dist()函数具体的计算方式,具体方式可以见这个页面。 The distance metric to use. The distance function can be ‘braycurtis’, ‘canberra’, ‘chebyshev’, ‘cityblock’, ‘correlation’, ‘cosine’, ‘dice’, ‘euclidean’, ‘hamming’, ‘jaccard’, ‘jensenshannon’, ‘kulsinski’, ‘kulczynski1’, ‘mahalanobis’, ‘matching’, ‘minkowski’, ‘rogerstanimoto’, ‘russellrao’, ‘seuclidean’, ‘sokalmichener’, ‘sokalsneath’, ‘sqeuclidean’, ‘yule’. ———————————————— 版权声明:代码实现及参数介绍部分 经CSDN博主「冬之晓东」的原创文章 修改完成。 原文链接:https://blog.csdn.net/qq_19528953/article/details/79133889 |
CopyRight 2018-2019 实验室设备网 版权所有 |