sklearn里的make_blobs

2024年2月4日 480次阅读来源: 人但有恒

make_blobs函数是为聚类产生数据集
产生一个数据集和相应的标签
n_samples:表示数据样本点个数,默认值100
n_features:表示数据的维度，默认值是2
centers:产生数据的中心点，默认值3
cluster_std：数据集的标准差，浮点数或者浮点数序列，默认值1.0
center_box：中心确定之后的数据边界，默认值(-10.0, 10.0)
shuffle ：洗乱，默认值是True
random_state:官网解释是随机生成器的种子
更多参数即使请参考：http://scikit-learn.org/dev/modules/generated/sklearn.datasets.make_blobs.html#sklearn.datasets.make_blobs

X, y = make_blobs(n_samples=n_samples, random_state=random_state)

n_samples
生成集合长度

n_features
X的纬度

centers
默认是3个也就是0、1、2，这是指y的取值范围

random_state
相同的值具有可重现性，也就是所指定一个相同的，以便于下次重现

下面几个是猜测的

cluster_std
数据集的标准差，浮点数或者浮点数序列，默认值1.0
一般用浮点数，y的范围是几就给几个参数，效果是使散点图中的点分散开

center_box shuffle 不常用，不说了

    原文作者：人但有恒
    原文地址: https://www.jianshu.com/p/069d8841bd8e
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。