特征选择的三种方法介绍: 过滤型: 选择与目标变量相关性较强的特征。缺点:忽略了特征之间的关联性。 包裹型: 基于线性模型相关系数以及模型结果AUC逐步剔除特征。如果剔除相关系数绝对值较小特征后,AUC无大的变化,或降低…
分类:机器学习
控制和机器学习书籍推荐
绘图:Geogebra和Visio http://muchong.com/bbs/viewthread.php?tid=4523749&fpage=1 现代控制理论粗略讲包括三个部分:线性系统理论…
时序数据特征提取方法
在对如传感器数据等时间序列数据进行机器学习时,特征提取是非常重要的一环,本文主要介绍时序数据特征提取的几种方法。 1 时域与频域 时域和频域是信号的基本性质,这样可以用多种方式来分析信号,每种方式提供了不同的角度。解决问…
matlab读.h5文件
之前用 python 给 nuswide 提取了 VGG19 特征,因为文件太大,超过 .mat 限制,存成 .h5,见 [1]。现在一个 matlab 程序要读,可以用 h5disp 查看 .h5 文件内容的结构(各个…
机器学习笔记--参数估计
我们进行参数估计的方法一般主要有最大似然估计和贝叶斯估计。这里提一下两种估计的门派来加深理解: 最大似然估计属于统计学里的频率学派。频率派从事件本身出发,认定事件本身是随机的。事件在重复试验中发生的频率趋于极限时,这个极…
从零开始构造决策树(python)
起步 本章介绍如何不利用第三方库,仅用python自带的标准库来构造一个决策树。不过这可能需要你之前阅读过这方面的知识。 前置阅读 分类算法之决策树(理论篇) 分类算法之决策树(应用篇) 本文使用将使用《应用篇》中的训练…
Awesome Data Science in Python | 一文整理Python常用数据科学第三方模块
1. 机器学习 EDA lantern 特征工程 yellowbrick Featuretools 模型解释 SHAP Lime 通用 Scikit-learn 自动化机器学习 mljar-supervised 2. 统…
独热编码(One-Hot Encoding)介绍、代码实现应用与优缺点
一、独热编码(One-Hot Encoding)介绍 One-hot在数字电路中被用来表示一种特殊的位元组合,该字节里,仅容许单一位元为1,其他位元都必须为0。之所以称为one-hot就是因为只能有一个1(hot)。若情…
机器学习总结
机器学习(maching learning)是什么? 总的来说就是教计算机怎么认识图片、自然语言等,现在主要是视觉,和听觉。 什么是神经网络? 1.生物神经网络:一般指生物的大脑神经元,细胞,触点等组成的网络,用于产生生…
用ADMM实现统计学习问题的分布式计算
最近研读了 Boyd 2011 年那篇关于 ADMM 的综述。我从这篇综述里整理出了一个条思路,顺着这个思路看下去,就能对 ADMM 原理和应用有个大概的了解。因此,此文可以当做 ADMM 的快速入门。 交替方向乘子法(…
【好东西传送门日报】2017-12-27 星期三
【机器学习】 1) 云端可视化机器学习/深度学习量化平台 http://t.cn/RHb9PxI 2) SWATS:自动由Adam切换为SGD而实现更好的泛化性能 http://t.cn/RHqPJuw 3) +Mome…
机器学习&深度学习视频资料汇总
第一部分 基础语言 pandax视频教程 链接: https://pan.baidu.com/s/1pLqavVX 密码: fath python入门到精通 链接: https://pan.b…