前言 该课程非常适合初学者,比原先Ng在斯坦福大学的公开课要简单许多,少去了许多数学,并且在课程内容安排上更加紧凑,涉及的内容广泛,旨在搭建初学者与机器学习的桥梁。值得一提的是,该课程较为接近工程的角度,故我建议有兴趣的…
分类:数据挖掘
[读书笔记] MIT Optimization for Machine Learning/Chapter 2.1
这一章干货比较多,看起来比较累,收获也比较大。 坚持看,坚持写。 写公式真累,希望segmentfault能尽快支持输入latex公式 一直拿不下最优化这块东西,理论和实践都有欠缺,争取这回能拿下。 $2.1 Intro…
数据挖掘与机器学习的关系
本文属于转发,以后会在该文基础上,加入自己的一些想法。 我最近看国外的学校,把机器学习和数据发掘分开了,数据发掘主要是跟数据库打交道,学什么数据仓库,用Oracle软件。而机器学习好像是跟统计更加贴近。 统计系和计算机系…
七个用于数据科学(Data Science)的命令行工具
数据科学是OSEMN(和 awesome 相同发音),它包括获取(Obtaining)、整理(Scrubbing)、探索(Exploring)、建模(Modeling)和翻译(iNterpreting)数据。作为一名数据…
【学习摘录】机器学习特征选择
应用过机器学习进行数据挖掘的同学应该都知道特征选择对模型表现的重要性。本文基于网上经典特征选择相关文章整理出干货:常用方法分类以及调包侠该如何用sklearn快速上手,供大家参考。 (一)预处理: 1 无量纲化: 1.1…
新书《全栈数据之门》预告
终于,可以给各位关心《全栈数据之门》的亲人、朋友一个交待了! 经过出版社三个多月的编辑与排版,目前已经编辑完成了最后的版本。就等过完年,吃好、喝好、玩好后回来,就可以开始印刷了。 预计在2017年3月份可以与各位读者见面…
Python遗传算法框架DEAP-Creating Types
DEAP是一个python遗传算法框架,这里是它的简介。DEAP documentation今天整理一下DEAP的概览,大体了解一下它的流程。初学,不严谨,仅作为自己的备忘学习笔记。 This tutorial show…
python遗传算法(GA)DEAP-Overview学习摘要
DEAP-Overview DEAP是一个python遗传算法框架,这里是它的简介。DEAP documentation今天整理一下DEAP的概览,大体了解一下它的流程。初学,不严谨,仅作为自己的备忘学习笔记。 一. T…
机器学习实战篇——用支撑向量算法在Kaggle上跑个分
之前写了关于人工智能和机器学习的理论基础文章,今天就理论联系实际,用机器学习算法跑个分。 机器学习最重要的就是数据,Kaggle平台提供了大量数据为机器学习的学习者和研究者提供一个跑分的平台。注册账号登录之后就可以进入比…
Pandas的使用
pandas是一个基于numpy的数据处理的库,我们可以简单的将pandas理解为对numpy的封装。 pandas有两个主要的数据结构:Series和DataFrame. Series Series是一种类似于一维数组…
机器学习读书笔记 — 朴素贝叶斯
什么是贝叶斯定理? 在贝叶斯定理中,每个名词都有约定俗成的名称: P(A|B)是已知B发生后A的条件概率,也由于得自B的取值而被称作A的后验概率。 P(A)是A的先验概率(或边缘概率)。之所以称为”先验…
numpy的学习
ndarray的属性 属性 说明 .ndim 秩,即轴的数量或维度的数量 .shape ndarray对象的尺度,对于矩阵,n行m列 .size ndarray对象元素的个数,相等于.shape中n*m的值 .dtype…