分类：聚类算法

K-means聚类与DBSCAN的比较

K-means与DBSCAN都是常见的聚类算法，在比较它们之前，我们先看一下两个算法的处理过程。 1 K-means聚类的过程： 1）从n个数据对象中任意选出k个对象作为初始的聚类中心； 2）计算剩余的各个对象到聚类中心…

层次聚类分为两种：（1）凝聚的层次聚类：自底向上的策略，首先将每个对象作为一个簇，然后合并这些原子簇为更大的簇，直到所有的对象都在同一…

最近学习了ap聚类算法，有几点需要注意： 1 记得两幅图片获取的相似矩阵一定是一个全为负值的矩阵； 2 相似矩阵的对角线上都是取除对角线以外的一半的（因为是对角矩阵所以取一半就行）的中值：即把矩阵一半的数排序然后取中间的…

…

基于划分聚类算法（partition clustering) 名字特点 k-means 是一种典型的划分聚类算法，它用一个聚类的中心来代表一个簇，即在迭代过程中选择的聚点不一定是聚类中的一个点，该算法只能处理数值型数据…

今天学习了ap算法。 Affinity Propagation (AP) 聚类是2007年在Science杂志上提出的一种新的聚类算法。它根据N个数据点之间的相似度进行聚类,这些相似度可以是对称的,即两个数据点互相之间的…

基于主题模型的聚类算法是假定数据的分布是符合一系列的概率分布，用概率分布模型去对数据进行聚类，而不是像层次聚类和划分聚类那样基于距离来进行聚类。因此，模型的好坏就直接决定了聚类效果的好坏。目前比较常用的基于主题聚类算法有…

这段时间因为工作需要，了解了一些聚类算法，发现目前国内的一些资料中对于AP（Affinity Propagation）聚类算法的描述和理解局限在列举公式，说明计算流程层面，没有去深入解读，为什么要这样设计公式，…

邻近算法，或者说K最近邻(kNN，k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻，就是k个最近的邻居的意思，说的是每个样本都可以用它最接近的k个邻居来代表。 kNN算法的核…

一、基本凝聚层次聚类算法 1：如果需要，计算近邻度矩阵 2：repeat 2.1：合并最接近的两个簇 …

使用R语言实现聚类算法本次仅展示简单的使用R语言实现kmeans算法和基于密度的算法：首先是基于密度的R语言脚本： >library(cluster) >library(fpc) >#如果提示没有f…

聚类是一种无监督学习，它将相似的对象归到同一个簇中。所谓无监督学习是指事先并不知道要寻找的内容，即没有目标变量。K-means 是一种典型的聚类算法，它可以发现k个不同的簇，且每个簇的中心采用…