分类：聚类算法

scikit-learn之聚类算法之Hierarchical clustering(层次聚类)

算法流程层次聚类分为分裂法和凝聚法，分裂法由上向下把大的类别（cluster）分割，凝聚法由下向上对小的类别进行聚合，但是一般用的比较多的是由下向上的凝聚法。下面只介绍凝聚法，分裂法和凝聚法类似： 1、将样本集中的所…

算法流程 DBSCAN（Density-Based Spatial Clustering of Applications with Noise，具有噪声的基于密度的聚类方法）算法将聚类视为被低密度区域分隔的高密度区域。 …

K-均值聚类算法的原理与实现聚类是一种无监督的学习，它将相似的对象归到同一个簇中，聚类方法几乎可以应用于所有对象，簇内的对象越相似，聚类的效果越好，本文主要介绍K-均值聚类的算法，之所以称之为K-均值是因为它可以发现k…

class sklearn.cluster.KMeans(n_clusters=8, init=’k-means++’, n_init=10, max_iter=300, tol=0.0001, precompute_d…

class DBSCAN(BaseEstimator, ClusterMixin): """Perform DBSCAN clustering from vector array or distance matrix. …

一、算法简介算法接受参数k，然后将事先输入的n个数据对象划分为k个聚类以便使得所获得的聚类满足：同一聚类中的对象相似度较高；而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得的一个“中心对象”来进行…

一、算法简介一趟聚类算法是由蒋盛益教授提出的无监督聚类算法，该算法具有高效、简单的特点。数据集只需要遍历一遍即可完成聚类。算法对超球状分布的数据有良好的识别，对凸型数据分布识别较差。一趟聚类可以在大规模数据，或者二次聚…

文中的概念和定义部分摘自于百度百科和一些论文中，把我觉得写的不错的解释放上来供参考。一、文本聚类定义文本聚类主要是依据著名的聚类…

原文地址：http://blog.csdn.net/jackaduma/article/details/5273473 1. 聚类算法简介聚类的目标是使同一类对象的相似度尽可能地大；不同类对象之间的相似度尽可能地小。目…

程序实现：上面的公式看似复杂，其实我们关心的就是最后的5个计算步骤，这里说明一下，有的书上以隶属度矩阵的某一范数小于一定值作为收敛的条件，这也可，不过计算量稍微要大一点了…

1.BIRCH算法概念 BIRCH（Balanced Iterative Reducing and Clustering Using H…

占坑资料如下： http://scikit-learn.org/stable/modules/classes.html#module-sklearn.cluster http://www.cnblogs.com/pin…