make_blobs函数是为聚类产生数据集 产生一个数据集和相应的标签 n_samples:表示数据样本点个数,默认值100 n_features:表示数据的维度,默认值是2 centers:产生数据的中心点,默认值3 …
分类:scikit-learn
K近邻(k-nearest neighbor, k-NN)算法笔记(一)-Python
大家好,我是一枚小小的北漂渣硕,为了更加有效率地督促自己系统的学习、及时将自己的学习心得分享给处于类似学习阶段的朋友,同时也为了获得大家的指导,我开启了自己的博文之旅,如果有侵权、错误等,请大家及时反馈,我一定改正。谢谢…
如何用Python从随机森林模型中可视化出一个决策树
在搭建机器学习模型时,如果能将模型可视化,能够大大帮助我们理解模型。此前集智曾分享一个叫做 ANN Visualizer 工具,只需一行 Python 代码就能给自己正在搭建的神经网络创建出简洁漂亮的可视化图形: htt…
scikit-learn 朴素贝叶斯分类器
在scikit-learn中,一共有3个朴素贝叶斯的分类算法类。分别是: GaussianNB 先验为高斯分布的朴素贝叶斯 MultinomialNB 先验为多项式分布的朴素贝叶斯 BernoulliNB 先验为伯努利分…
生成可视化决策树遇到的 GraphViz's executables not found
在Scikit的官网上 ,找到的生成可视化的决策树的代码如下: from IPython.display import Image import pydotplus dot_data = sklearn.tree.exp…
scikit_learn学习笔记六——scikit_learn里的fit与fit_transform
scikit_learn里的fit与fit_transform # 从sklearn.preprocessing导入StandardScaler from sklearn.preprocessing import Sta…
scikit-learn之决策树可视化
平时我们在用机器学习建模时,往往只是用建模去分析数据,得到结论。但有时,我们也需要一些可视化的东西,比如决策树可视化等。 在Python的机器学习库scikit-learn中,tree类中的export_grap…
scikit-learn_模型的保存与加载
主要介绍scikit-learn中的模型的保存与加载 我们训练好了一个Model 以后总需要保存和再次预测, 所以保存和读取我们的sklearn model也是同样重要的一步。这次主要介绍两种保存Model的模块pick…
机器学习中,使用Scikit-Learn简单处理文本数据
摘要:机器学习中,我们总是要先将源数据处理成符合模型算法输入的形式,比如将文字、声音、图像转化成矩阵。对于文本数据首先要进行分词(tokenization),移除停止词(stop words),然后将词语转化成矩阵形式,…
机器学习大作业(1):KNN分类器的研究
一、 任务目标 Develop a k-NN classifier with Euclidean distance and simple voting Perform 5-fold cross validation, f…
深度学习小技巧(一):如何保存和恢复TensorFlow训练的模型
摘要:深度学习小技巧掌握:作者通过一个简单的例子详细介绍了如何将训练过程中的深度学习模型保存,然后如何加载。有了这个小技巧,再也不用担心在训练模型中出错了。 深度学习小技巧(二):如何保存和恢复scikit-learn训…
使用Python创建LDA模型进行分类
来源:数据分析网 线性判别式分析(Linear Discriminant Analysis)简称LDA,是模式识别的经典算法。通过对历史数据进行投影,以保证投影后同一类别的数据尽量靠近,不同类别的数据尽量分开。并生成线性…