分类：机器学习

浅谈机器学习的职业发展方向

一、机器学习相关的公司分析1、大的有师傅的公司这类公司主要是百度，阿里和腾讯。共同的特点是数据很大，机器学习的团队比较庞大，一般进去的同学都可以有师傅带着学习，进步会比较快。但是三个公司的特点也有所不同。百度是我认为…

目录机器学习基础什么是机器学习机器学习应用场景海量数据机器学习的重要性机器学习的基本术语监督学习和非监督学习监督学习：supervised learning 非监督学习：unsupervised lea…

一、机器学习模型按照可使用的数据类型分为监督学习和无监督学习两大类。　　1-监督学习主要包括用于分类和用于回归的模型：　　　　1）分类：线性分类器（如LR)、支持向量机（SVM）、朴素贝叶斯（NB）、K近邻（KNN）…

DEAP – 一个用于快速原型和测试思想的新颖的进化计算框架 – 后端 – 掘金 DEAP is a novel evolutionary computation framework …

方差/偏差权衡在统计学和机器学习领域，一个重要的理论结果是，模型的泛化误差可以被表示为三个截然不同的误差之和。偏差这部分泛化误差的原因在于错误的假设，比如假设数据是线性的，而实际上是二次的。高偏差模型最有可能对训练…

接下来几章将进入Q语言的核心内容——函数、表、数据转换、查询和I/O等等， excited :) 1. 函数说明在q中，函数是可以修改全局变量的，所以q并不是一个纯正的函数式语言。1. 函数定义使用花括号{和}，函数的…

中文自然语言处理流程获取语料语料，即语言材料。语料是语言学研究的内容。语料是构成语料库的基本单元。所以，人们简单地用文本作为替代，并把文本中的上下文关系作为现实世界中语言的上下文关系的替代品。我们把一个文本集合称为语…

TP：预测为正向（P），实际上预测正确（T），即判断为正向的正确率 TN：预测为负向（N），实际上预测正确（T），即判断为负向的正确率 FP：预测为正向（P），实际上预测错误（F），误报率，即把负向判断成了正向 FN：预…

　　学习了那么多机器学习模型，一切都是为了实践，动手自己写写这些模型的实现对自己很有帮助的，坚持，共勉。本文主要致力于总结贝叶斯实战中程序代码的实现（python）及朴素贝叶斯模型原理的总结。python的numpy包简…

决策树 Decision Tree 简介原理：通过一层一层的逻辑分支判断最终的结果分类：监督学习优势可解释性强、逻辑简单可以拟合非线性的模型执行效率高二分类和多分类问题都可以解决缺点容易过拟合不能学习…

常用Python机器学习包 Numpy：用于科学计算的包 Pandas：提供高性能，易于使用的数据结构和数据分析工具 Scipy：用于数学，科学工程的软件 StatsModels：用于探索数据、估计统计模型、统计检验 S…

1、数据清理中，处理缺失值的方法有两种：删除法： 1 ）删除观察样本 2 ）删除变量：当某个变量缺失值较多且对研究目标影响不大时，可…