没有输入参数的数据聚类

这更像是一个理论问题:

你知道任何聚类算法(平面或分层),它不需要任何输入参数,如簇的数量或邻域的大小等?换句话说,您只需将数据作为输入提供给算法,并将群集作为输出.

如果有关相关文件/文件的建议我会很高兴.

最佳答案 自动确定群集的数量确实是一个棘手的问题,仍然被认为是开放的研究问题.

最先进的聚类技术之一是将数据建模为Dirichlet Process Mixture,见Bayesian Hierarchical Clustering,但它不是微不足道的,需要在贝叶斯方法和马尔可夫链蒙特卡罗(MCMC)估计中具有扎实的背景.

这种方法可以自动估计簇的数量.

点赞