转自here 基本思想 在数据集中选定一个点,然后以这个点为圆心,r为半径,画一个圆,求出这个点到所有点的向量的平均值,而圆心与向量均值的和为新的圆心,然后迭代此过程,直到满足一点的条件结束。后来加了权重系数和核函数,目…
分类:聚类算法
Canopy聚类算法说明
Canopy聚类算法是一个将对象分组到类的简单、快速、精确地方法。每个对象用多维特征空间里的一个点来表示。这个算法使用一个快速近似距离度量和两个距离阈值 T1>T2来处理。基本的算法是,从一个点集合开始并且随机删除…
四种主流聚类方法
四种主流聚类方法 2015-07-29 聚类就是按照某个特定标准(如距离准则,即数据点之间的距离)把一个数据集分割成不同的类或簇,使得…
基于密度的聚类算法(DBSCAN)的java实现
k-means和EM算法适合发现凸型的聚类(大概就是圆形,椭圆形比较规则的类),而对于非凸型的聚类,这两种方法就很难找到准确的聚类了。比如如下图: &n…
聚类算法——K-means(上)
首先要来了解的一个概念就是聚类,简单地说就是把相似的东西分到一组,同 Classification (分类)不同,对于一个 classifier ,通常需要你告诉它“这个东西被分为某某类”这样一些例子,理想情况下,一个 …
K-均值聚类算法学习心得
一、分类与聚类 分类作为一种监督学习方法,要求必须事先明确知道各个类别的信息,并且断言所有待分类项都有一个类别与之对应。但是很多时候上述条件得不到满足,尤其是在处理海量数据的时候,如果通过预处理使…
购物篮分析分类算法——频繁模式挖掘(聚类算法)
频繁模式是频繁地出现在数据集中的模式,包括频繁项集(如牛奶和面包)、频繁子序列(首先购买PC,然后是数码相机,再后是内存卡)或频繁子结…
无监督学习中的常用聚类算法总结
聚类是一个把数据对象集划分成多个组或簇的过程,使得簇内的对象具有很高的相似性,但与其他簇中的对象很不相似。通常涉及距离度量。数据对象的簇可以看做隐含的类。在这种意义下,聚类有时又称自动分类。聚类可以自动地发现这些分组,这…
BIRCH算法---使用聚类特征树的多阶段算法
更多数据挖掘代码:https://github.com/linyiqun/DataMiningAlgorithm 介绍 BIRCH算法本身上属于一种聚类算法,不过他克服了一些K-Means算法的缺点,比如说这个k的确定,…
dbscan基于密度的空间聚类算法
参考文献:百度百科 http://baike.baidu.com 我的算法库:https://github.com/linyiqun/lyq-algorithms-lib 算法介绍 说到聚类算法,大…
Chameleon两阶段聚类算法
参考文献:http://www.cnblogs.com/zhangchaoyang/articles/2182752.html(用了很多的图和思想)博客园(华夏35度) 作者:Orisun数据挖掘算法-Chameleon…
聚类算法(3)--DBSCAN
目录 1、基本概念 2、DBSCAN聚类算法原理的基本要点 3、工作流程 4、sklearn 参数设置 5、实例python实现 6、总结: DBSCAN: 基本概念:(Density-Based Spat…