目录 机器学习基础 什么是机器学习 机器学习 应用场景 海量数据 机器学习的重要性 机器学习的基本术语 监督学习和非监督学习 监督学习:supervised learning 非监督学习:unsupervised lea…
标签:机器学习
2-常见机器学习模型总结
一、机器学习模型按照可使用的数据类型分为监督学习和无监督学习两大类。 1-监督学习主要包括用于分类和用于回归的模型: 1)分类:线性分类器(如LR)、支持向量机(SVM)、朴素贝叶斯(NB)、K近邻(KNN)…
Python 机器学习框架 - 收藏集 - 掘金
DEAP – 一个用于快速原型和测试思想的新颖的进化计算框架 – 后端 – 掘金 DEAP is a novel evolutionary computation framework …
统计机器学习-方差/偏差的权衡
方差/偏差权衡 在统计学和机器学习领域,一个重要的理论结果是,模型的泛化误差可以被表示为三个截然不同的误差之和。 偏差 这部分泛化误差的原因在于错误的假设,比如假设数据是线性的,而实际上是二次的。高偏差模型最有可能对训练…
Windows10下安装原生TensorFlow GPU版
下载 CUDA 8.01 和 cuDNN v5.11 安装CUDA 解压cuDNN到一个你喜欢的位置,复制文件夹的绝对路径并加到 PATH 环境变量去,然后把该文件夹下的bin文件夹的路径也放到PATH里去 安装Anac…
机器学习基础一(TP,TN,FP,FN等)
TP:预测为正向(P),实际上预测正确(T),即判断为正向的正确率 TN:预测为负向(N),实际上预测正确(T),即判断为负向的正确率 FP:预测为正向(P),实际上预测错误(F),误报率,即把负向判断成了正向 FN:预…
机器学习实战1:朴素贝叶斯模型:文本分类+垃圾邮件分类
学习了那么多机器学习模型,一切都是为了实践,动手自己写写这些模型的实现对自己很有帮助的,坚持,共勉。本文主要致力于总结贝叶斯实战中程序代码的实现(python)及朴素贝叶斯模型原理的总结。python的numpy包简…
机器学习Model大乱斗
决策树 Decision Tree 简介 原理:通过一层一层的逻辑分支判断最终的结果 分类:监督学习 优势 可解释性强、逻辑简单 可以拟合非线性的模型 执行效率高 二分类和多分类问题都可以解决 缺点 容易过拟合 不能学习…
Python机器学习包
常用Python机器学习包 Numpy:用于科学计算的包 Pandas:提供高性能,易于使用的数据结构和数据分析工具 Scipy:用于数学,科学工程的软件 StatsModels:用于探索数据、估计统计模型、统计检验 S…
机器学习(二十二)— 数据缺失处理方法
1、数据清理中,处理缺失值的方法有两种: 删除法: 1 )删除观察样本 2 )删除变量:当某个变量缺失值较多且对研究目标影响不大时,可…
从pandas中的一个单元格的字符串中提取字符串
以titanic数据集为例。 其中name列是字符串,现在想从其中提取title作为新的一列。 例如: # create new Title column df['Title'] = df['Name'].str.ext…
学习笔记DL005:线性相关、生成子空间,范数,特殊类型矩阵、向量
线性相关、生成子空间。 逆矩阵A⁽-1⁾存在,Ax=b 每个向量b恰好存在一个解。方程组,向量b某些值,可能不存在解,或者存在无限多个解。x、y是方程组的解,z=αx+(1-α),α取任意实数。 A列向量看作从原点(or…