分类：聚类算法

初识聚类算法:K均值、凝聚层…

很不错，给我很大的启发原文地址：初识聚类算法:K均值、凝聚层次聚类和DBSCAN 作者：Intergret 聚类分析就仅根据在数据中发现的描述对象及其关系的信息，将数据对象分组(簇)。其目标是，组内的对象相互之间是相似…

聚类分析的K均值算法(Python实现) 聚类分析仅根据在数据中发现的描述对象及其关系的信息，将数据分组。其目标是，组内的对象之间是相似的，而不同组中的对象是不同的。 K均值用于n维空间中的对象…

　K-Means算法是无监督的聚类算法，它实现起来比较简单，聚类效果也不错，因此应用很广泛。K-Means算法有大量的变体，本文就从最传统的K-Means算法讲起，在其基础上讲述K-Means的优化变体方法。包括初始化优…

Kmeans算法是一种简单的聚类算法，现在仍然广泛使用，其优点就是收敛速度快，人为干涉少，但是缺点也很明显：需要提前了解K值，以及聚类结果不稳定，其原理可以参照： http://blog.csdn.net/…

单高斯分布多维变量X服从高斯分布时，它的概率密度函数PDF为： x是维度为d的列向量，u是模型期望，Σ是模型方差。在实际应用中u通常用样本均值来代替，Σ通常用样本方差来代替。很容易判断一个样x本是否属于类别C。因为每个…

参考wiki https://en.wikipedia.org/wiki/DBSCAN DBSCAN(Density-Based Spatial Clustering of Applications with Noise…

参考百度百科http://baike.baidu.com/link?url=LDYen7bEqt8o2l5mUrnZjQk1topFi36-MwLuhjuGf-1z4sQFtFq1xCEe0TCJwYVjGbu0C6cp…

ISODATA算法是在k-均值算法的基础上，增加对聚类结果的“合并”和“分裂”两个操作，并设定算法运行控制参数的一种聚类算法。迭代次数会影响最终结果，迭代参数选择很重要。算法步骤如下： ①初始…

划分方法聚类分析最简单、最基本的版本是划分，它把对象组织成多个互斥的簇。这一方法，要求每个对象必须/恰好属于每一个簇。（事实上，我们应该知道，这个要求是很不合理的，因为它忽略了离群点，假若把噪声数据强行划分在簇里，那势…

BIRCH算法是在凝聚和分裂算法之后发展起来的。它克服了凝聚聚类算法一些存在的劣势。 BIRCH算法比较适合于数据量大，类别数K也比较多的情况。它运行速度很快，只需要单遍扫描数据集就能进行有效的聚类。这得益于它采用的一…

Chamelon是一种层次聚类算法，它采用动态建模来确定一对簇之间的相似度，从而实现聚类。这里我们重点关注动态建模这个词？那么，何为动态建模呢？要回答这个问题，我们首先要搞清楚簇的相似度依据是什么。在Chamel…

DBSCAN（Density-Based Spatial Clustering of Applications with Noise）聚类算法，它是一种基于高密度连通区域的、基于密度的聚类算法，能够将具有足够高密度的区域…