一、机器学习相关的公司分析1、大的有师傅的公司这类公司主要是百度,阿里和腾讯。共同的特点是数据很大,机器学习的团队比较庞大,一般进去的同学都可以有师傅带着学习,进步会比较快。 但是三个公司的特点也有所不同。 百度是我认为…
分类:机器学习
《机器学习实战》-机器学习基础
目录 机器学习基础 什么是机器学习 机器学习 应用场景 海量数据 机器学习的重要性 机器学习的基本术语 监督学习和非监督学习 监督学习:supervised learning 非监督学习:unsupervised lea…
2-常见机器学习模型总结
一、机器学习模型按照可使用的数据类型分为监督学习和无监督学习两大类。 1-监督学习主要包括用于分类和用于回归的模型: 1)分类:线性分类器(如LR)、支持向量机(SVM)、朴素贝叶斯(NB)、K近邻(KNN)…
Python 机器学习框架 - 收藏集 - 掘金
DEAP – 一个用于快速原型和测试思想的新颖的进化计算框架 – 后端 – 掘金 DEAP is a novel evolutionary computation framework …
统计机器学习-方差/偏差的权衡
方差/偏差权衡 在统计学和机器学习领域,一个重要的理论结果是,模型的泛化误差可以被表示为三个截然不同的误差之和。 偏差 这部分泛化误差的原因在于错误的假设,比如假设数据是线性的,而实际上是二次的。高偏差模型最有可能对训练…
6. Q语言学习之路—函数
接下来几章将进入Q语言的核心内容——函数、表、数据转换、查询和I/O等等, excited :) 1. 函数说明 在q中,函数是可以修改全局变量的,所以q并不是一个纯正的函数式语言。1. 函数定义使用花括号{和},函数的…
中文NLP处理方法-to-do-list
中文自然语言处理流程 获取语料 语料,即语言材料。语料是语言学研究的内容。语料是构成语料库的基本单元。所以,人们简单地用文本作为替代,并把文本中的上下文关系作为现实世界中语言的上下文关系的替代品。我们把一个文本集合称为语…
机器学习基础一(TP,TN,FP,FN等)
TP:预测为正向(P),实际上预测正确(T),即判断为正向的正确率 TN:预测为负向(N),实际上预测正确(T),即判断为负向的正确率 FP:预测为正向(P),实际上预测错误(F),误报率,即把负向判断成了正向 FN:预…
机器学习实战1:朴素贝叶斯模型:文本分类+垃圾邮件分类
学习了那么多机器学习模型,一切都是为了实践,动手自己写写这些模型的实现对自己很有帮助的,坚持,共勉。本文主要致力于总结贝叶斯实战中程序代码的实现(python)及朴素贝叶斯模型原理的总结。python的numpy包简…
机器学习Model大乱斗
决策树 Decision Tree 简介 原理:通过一层一层的逻辑分支判断最终的结果 分类:监督学习 优势 可解释性强、逻辑简单 可以拟合非线性的模型 执行效率高 二分类和多分类问题都可以解决 缺点 容易过拟合 不能学习…
Python机器学习包
常用Python机器学习包 Numpy:用于科学计算的包 Pandas:提供高性能,易于使用的数据结构和数据分析工具 Scipy:用于数学,科学工程的软件 StatsModels:用于探索数据、估计统计模型、统计检验 S…
机器学习(二十二)— 数据缺失处理方法
1、数据清理中,处理缺失值的方法有两种: 删除法: 1 )删除观察样本 2 )删除变量:当某个变量缺失值较多且对研究目标影响不大时,可…