我刚刚发现了scikit-learn的 Pipeline特性,我发现它在训练模型之前测试预处理步骤的不同组合非常有用. 管道是实现拟合和转换方法的对象链.现在,如果我想添加一个新的预处理步骤,我曾经写过一个继承自skle…
标签:python scikit-learn
LDA与Python – 输入文件
我在 Python中运行lda库,我正在运行这个例子.有谁知道X,词汇和标题的格式?我找不到文档. import numpy as np import lda X = lda.datasets.load_reuters(…
python – sklearn的PLSRegression:“ValueError:数组不能包含infs或NaNs”
使用 sklearn.cross_decomposition.PLSRegression时: import numpy as np import sklearn.cross_decomposition pls2 = sk…
python – 使用机器学习进行简单的机器人控制
我想通过机器学习改进我的小机器人. 到目前为止,它使用简单的,如果然后在其主要功能的决定充当草坪割草机器人. 我的想法是将SKLearn用于此目的. 请帮我找到正确的第一步. 我有几个传感器告诉世界: World = {…
Python Sklearn Logistic回归模型错误拟合
对于逻辑回归,我试图从Wikipedia logistic regression页面重现结果.所以,我的代码如下所示: import numpy as np from sklearn.linear_model impor…
如何在sklearn中获取预测值和误差度量
我有两个单独的 python函数,其中一个使用cross_val_predict返回数据集的预测值,另一个使用cross_validate返回多个错误度量值.下面显示的是用于获取度量值的方法(我已经实现了类似的方法来获取…
python – Pip安装不适用于Scikit-Learn
当我尝试在 Python shell上输入pip install scikit-learn时,我收到了“无效语法”消息.我已经 有Scipy和Numpy安装,所以不应该有任何依赖问题.怎么了? 我还是Python的新手,…
python – Yellowbrick:在Yellowbrick生成的图表上增加字体大小
有没有办法增加Yellowbrick生成的图表的字体大小?我发现阅读文本很困难.我在文档中找不到任何内容. 我在Jupyter笔记本中使用Python 3.6,Yellowbrick 0.5. 最佳答案 Yellowbr…
python – scikit-learn CART字符串数据
您是否能够使用字符串数据训练DecisionTreeClassifier? 当我尝试使用String数据时,我得到一个ValueError:无法将转换器字符串浮动 clf = DecisionTreeClassifier…
python – 在scikit-learn中保存新数据的特征向量
为了创建机器学习算法,我制作了一个词典列表,并使用scikit的DictVectorizer为每个项目制作一个特征向量.然后,我使用部分数据从数据集创建SVM模型进行训练,然后在测试集上测试模型(您知道,这是典型的方法)…
在二进制分类中使用Lasso回归查找最佳特征
我正在处理大数据,我想找到重要的功能. 因为我是一名生物学家,所以请原谅我缺乏的知识. 我的数据集有大约5000个属性和500个样本,它们具有二进制类0和1.此外,数据集有偏差 – 样本大约400 0和100 1.我想找…
如何在python中的sklearn中打印tf-idf得分矩阵
我使用sklearn获取tf-idf值如下. from sklearn.feature_extraction.text import TfidfVectorizer myvocabulary = ['life', 'le…