分类：聚类算法

【聚类算法】Mean-shift 算法

转自here 基本思想在数据集中选定一个点，然后以这个点为圆心，r为半径，画一个圆，求出这个点到所有点的向量的平均值，而圆心与向量均值的和为新的圆心，然后迭代此过程，直到满足一点的条件结束。后来加了权重系数和核函数，目…

Canopy聚类算法是一个将对象分组到类的简单、快速、精确地方法。每个对象用多维特征空间里的一个点来表示。这个算法使用一个快速近似距离度量和两个距离阈值 T1>T2来处理。基本的算法是，从一个点集合开始并且随机删除…

四种主流聚类方法 2015-07-29 聚类就是按照某个特定标准(如距离准则，即数据点之间的距离)把一个数据集分割成不同的类或簇，使得…

k-means和EM算法适合发现凸型的聚类（大概就是圆形，椭圆形比较规则的类），而对于非凸型的聚类，这两种方法就很难找到准确的聚类了。比如如下图： &n…

首先要来了解的一个概念就是聚类，简单地说就是把相似的东西分到一组，同 Classification (分类)不同，对于一个 classifier ，通常需要你告诉它“这个东西被分为某某类”这样一些例子，理想情况下，一个 …

一、分类与聚类分类作为一种监督学习方法，要求必须事先明确知道各个类别的信息，并且断言所有待分类项都有一个类别与之对应。但是很多时候上述条件得不到满足，尤其是在处理海量数据的时候，如果通过预处理使…

频繁模式是频繁地出现在数据集中的模式，包括频繁项集（如牛奶和面包）、频繁子序列（首先购买PC，然后是数码相机，再后是内存卡）或频繁子结…

聚类是一个把数据对象集划分成多个组或簇的过程，使得簇内的对象具有很高的相似性，但与其他簇中的对象很不相似。通常涉及距离度量。数据对象的簇可以看做隐含的类。在这种意义下，聚类有时又称自动分类。聚类可以自动地发现这些分组，这…

更多数据挖掘代码：https://github.com/linyiqun/DataMiningAlgorithm 介绍 BIRCH算法本身上属于一种聚类算法，不过他克服了一些K-Means算法的缺点，比如说这个k的确定，…

参考文献：百度百科 http://baike.baidu.com 我的算法库：https://github.com/linyiqun/lyq-algorithms-lib 算法介绍说到聚类算法，大…

参考文献：http://www.cnblogs.com/zhangchaoyang/articles/2182752.html(用了很多的图和思想)博客园（华夏35度）作者:Orisun数据挖掘算法-Chameleon…

目录 1、基本概念 2、DBSCAN聚类算法原理的基本要点 3、工作流程 4、sklearn 参数设置 5、实例python实现 6、总结： DBSCAN：基本概念：（Density-Based Spat…