make_blobs函数是为聚类产生数据集
产生一个数据集和相应的标签
n_samples:表示数据样本点个数,默认值100
n_features:表示数据的维度,默认值是2
centers:产生数据的中心点,默认值3
cluster_std:数据集的标准差,浮点数或者浮点数序列,默认值1.0
center_box:中心确定之后的数据边界,默认值(-10.0, 10.0)
shuffle :洗乱,默认值是True
random_state:官网解释是随机生成器的种子
更多参数即使请参考:http://scikit-learn.org/dev/modules/generated/sklearn.datasets.make_blobs.html#sklearn.datasets.make_blobs
X, y = make_blobs(n_samples=n_samples, random_state=random_state)
n_samples
生成集合长度
n_features
X的纬度
centers
默认是3个 也就是0、1、2, 这是指y的取值范围
random_state
相同的值具有可重现性,也就是所指定一个相同的,以便于下次重现
下面几个是猜测的
cluster_std
数据集的标准差,浮点数或者浮点数序列,默认值1.0
一般用浮点数,y的范围是几就给几个参数,效果是使散点图中的点分散开
center_box shuffle 不常用,不说了