图片描述 「观远AI实战」 栏目文章由观远数据算法天团倾力打造,观小编整理编辑。这里将不定期推送关于机器学习,数据挖掘,特征重要性等干货分享。本文8千多字,约需要16分钟阅读时间。 机器学习作为时下最为火热的技术之一受到…
分类:机器学习
机器学习工具
机器学习工具 参考网站: https://www.zhihu.com/question/20472776(知乎:学习机器学习有哪些好工具推荐?) http://blog.csdn.net/myarrow/article/…
机器学习和统计学习的交锋
转载自:https://zhuanlan.zhihu.com/p/43360613 机器学习≠数据统计 「融资的时候, 我们讲人工智能 ;找工作的时候,我们说深度学习;但做项目的时候,我们讲 logistic 回归。」 …
机器学习,数据挖掘,统计学,云计算,众包(crowdsourcing),人工智能,降维(Dimension reduction)
机器学习 Machine Learning:提供数据分析的能力,机器学习是大数据时代必不可少的核心技术,道理很简单:收集、存储、传输、管理大数据的目的,是为了“利用”大数据,而如果没有机器学习技术分析数据,则“利用”就无…
机器学习笔记--Hoeffding霍夫丁不等式
Hoeffding霍夫丁不等式 在< >第八章”集成学习”部分, 考虑二分类问题 \(y \in \{-1, +1\}\) 和真实函数 \(f\), 假定基分类器的错误率为 \(\ep…
Decision Tree 决策树
决策树(decision tree)是一种基本的分类与回归方法。《统计机器学习》主要介绍了用于分类的决策树,《机器学习实战》主要介绍了回归树,两者结合能帮助很好地理解决策树。 在分类问题中,表示基于特征对实例进行分类的过…
学习笔记DL004:标量、向量、矩阵、张量,矩阵、向量相乘,单位矩阵、逆矩阵
线性代数,面向连续数学,非离散数学。《The Matrix Cookbook》,Petersen and Pedersen,2006。Shilov(1977)。 标量、向量、矩阵、张量。 标量(scalar)。一个标量,…
Cross Validation交叉验证
训练集 vs. 测试集 在模式识别(pattern recognition)与机器学习(machine learning)的相关研究中,经常会将数据集(dataset)分为训练集(training set)跟测试集(te…
[读书笔记] MIT Optimization for Machine Learning/Chapter 4
增量方法,每次处理一小撮数据,增量更新参数,每一步更新的计算量都很小。统计梯度下降法。 有一个基本假设:数据有时序的到来,满足一定的分布(强假设:前面的数据和后面的数据是独立同分布)。所以对于前面的数据没有来得及catc…
学习笔记DL003:神经网络第二、三次浪潮,数据量、模型规模,精度、复杂度,对现实世界冲击
神经科学,依靠单一深度学习算法解决不同任务。视觉信号传送到听觉区域,大脑听学习处理区域学会“看”(Von Melchner et al., 2000)。计算单元互相作用变智能。新认知机(Fukushima,1980),哺…
机器学习之数据归一化
机器学习中,数据归一化是非常重要,如果不进行数据归一化,可能会导致模型坏掉或者训练出一个奇怪的模型。 为什么要进行数据归一化 现在有一个训练数据集,包含两个样本,内容如下: 肿瘤大小(cm) 发现时间(day) 样本1 …
机器学习——可视化绘图matplotlib和seaborn
安装matplotlib和seaborn https://blog.csdn.net/Jia_jinjin/article/details/80428598 seaborn pairplot:特征两两对比 参…