文本聚类算法之k-means聚类

1、算法的原理:

《文本聚类算法之k-means聚类》

2、算法的描述

《文本聚类算法之k-means聚类》

《文本聚类算法之k-means聚类》


3、算法的缺点:

(1)容易受到初始值的影响

(2)聚类的个数不知道,需要用户输入

(3)容易受到噪声点的影响


如何解决上面的三个问题?

(1)如何解决初始化中心点的问题?

《文本聚类算法之k-means聚类》

《文本聚类算法之k-means聚类》

(2)如何解决噪声、离群点的问题?

使用DBSAN算法进行噪声的过滤

(3)如何解决用户输入的问题?

首先使用层次聚类算法,看看大概需要几类,然后将类数传给k-means算法。


k-means聚类的过程:

《文本聚类算法之k-means聚类》

    原文作者:聚类算法
    原文地址: https://blog.csdn.net/u011955252/article/details/50804488
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞