sklearn里的make_blobs

make_blobs函数是为聚类产生数据集
产生一个数据集和相应的标签
n_samples:表示数据样本点个数,默认值100
n_features:表示数据的维度,默认值是2
centers:产生数据的中心点,默认值3
cluster_std:数据集的标准差,浮点数或者浮点数序列,默认值1.0
center_box:中心确定之后的数据边界,默认值(-10.0, 10.0)
shuffle :洗乱,默认值是True
random_state:官网解释是随机生成器的种子
更多参数即使请参考:http://scikit-learn.org/dev/modules/generated/sklearn.datasets.make_blobs.html#sklearn.datasets.make_blobs

X, y = make_blobs(n_samples=n_samples, random_state=random_state)

n_samples
生成集合长度

n_features
X的纬度

centers
默认是3个 也就是0、1、2, 这是指y的取值范围

random_state
相同的值具有可重现性,也就是所指定一个相同的,以便于下次重现

下面几个是猜测的

cluster_std
数据集的标准差,浮点数或者浮点数序列,默认值1.0
一般用浮点数,y的范围是几就给几个参数,效果是使散点图中的点分散开

center_box shuffle 不常用,不说了

    原文作者:人但有恒
    原文地址: https://www.jianshu.com/p/069d8841bd8e
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞