0.前置信息 欢迎大家关注我们学术团队的blog网站:http://www.ibigdata.wang/ 以下内容基本为本人血泪史整理而得以anaconda库为基础的一系列python机器学习必备环境,目的是为了少让后人…
标签:机器学习
面试—项目介绍部分
1、项目介绍 介绍自己的项目,分为三个步骤:1.尽量用两三句话介绍项目的功能或实现的目标。2.项目的难点在何处,或者说项目的具体需求是什么。3.通过什么方法解决上述的问题。 第一步时,我会尽量通俗易懂、不带任何专…
机器学习算法选择——特征提取
第4步:特征工程 或许比选择算法更重要的是正确选择表示数据的特征。从上面的列表中选择合适的算法是相对简单直接的,然而特征工程却更像是一门艺术。 主要问题在于我们试图分类的数据在特征空间的描述极少。利如,用像素的灰度值来预…
深度学习—池化、padding的理解
1、池化层的理解 pooling池化的作用则体现在降采样:保留显著特征、降低特征维度,增大kernel的感受野。另外一点值得注意:pooling也可以提供一些旋转不变性。 池化层可对提取到的特征信息进行降维,一方…
机器学习与R语言
此书网上有英文电子版:Machine Learning with R – Second Edition [eBook].pdf(附带源码) 评价本书:入门级的好书,介绍了多种机器学习方法,全部用R相关的包实现…
【转】机器学习发展简史
本文主要参考中科院自动化研究所复杂系统与智能科学实验室王珏研究员《关于机器学习的讨论》,讨论机器学习的描述,理论基础,发展历史以及研究现状。 0引言 20世纪90年代初,当时的美国副总统提出了一个重要的计划——国家信息基…
反向传播是什么?通俗易懂的解释!!!
反向传播算法是目前用来训练人工神经网络的最常用且最有效的算法。 反向传播工作原理就是: (1)前向传播:将训练集数据输入到ANN的输入层,经过隐藏层,最后到达输出层并输出结果。【输入层—隐藏层–输出层】 (2)反向传播:…
机器学习中的有监督学习,无监督学习,半监督学习
在机器学习(Machine learning)领域。主要有三类不同的学习方法: 监督学习(Supervised learning)、 非监督学习(Unsupervised learning)、 半监督学习(Semi-su…
Kaggle技巧总结
Kaggle技巧总结Introduction首先简单介绍一些关于 Kaggle 比赛的知识:不同比赛有不同的任务,分类、回归、推荐、排序等。比赛开始后训练集和测试集就会开放下载。比赛通常持续 2 ~ 3 个月,每个队…
【机器学习】KNN回归
回归的概念 http://book.2cto.com/201210/5831.html 《数据挖掘:概念与技术》1.4.3用于预测分析的分类与回归 http://www.zhihu.com/question/213297…
R: 学习Gradient Boosting算法,提高预测模型准确率
引言 预测模型的准确率可以用2种方法来提高:要么进行特征设计,要么直接使用boosting算法。参加过许多数据科学大赛后,我发现许多人喜欢用boosting算法,因为它只需更少的时间就能产生相似的结果。 目前有许多boo…
机器学习入门 - Google的机器学习速成课程
1 – MLCC 通过机器学习,可以有效地解读数据的潜在含义,甚至可以改变思考问题的方式,使用统计信息而非逻辑推理来处理问题。 Google的机器学习速成课程(MLCC,machine-learning cr…