由于从事Python(机器学习)讲师的原因,机器学习相关核心文章无法发布,对机器学习感兴趣的,随时欢迎私聊我。 第一篇 学习路线参考 人工智能(机器学习)学习之路推荐 大数据分析和人工智能科普 第二篇 《机器学习实战》笔…
标签:机器学习
[ML] 特征工程
特征工程 特征工程包括:特征构建、特征提取、特征选择三个部分 Feature Construction 特征构建 描述 从原始数据中人工的构建新的特征,对数据敏感、分析能力强 方法 组合属性 切分属性如:将数据中的日期字…
聚类算法比较:K-means 和高斯混合模型
算法原理 K-means, K均值聚类算法 假设每个 cluster 存在一个中心点,该 cluster 内的所有数据项到这个中心点的欧式距离(勾股定理的扩展:各维度差的平方求和再开方)都小于到其他 cluster 中心…
朴素贝叶斯/SVM文本分类
import jieba import pandas as pd df_technology = pd.read_csv("./data/technology_news.csv", encoding='utf-8') d…
机器学习基本概念:batch_size、epoch、 iteration
batch_size 单次训练用的样本数,通常为2^N,如32、64、128… 相对于正常数据集,如果过小,训练数据就收敛困难;过大,虽然相对处理速度加快,但所需内存容量增加。 使用中需要根据计算机性能和训练…
机器学习中的矩阵向量求导(二) 矩阵向量求导之定义法
在机器学习中的矩阵向量求导(一) 求导定义与求导布局中,我们讨论了向量矩阵求导的9种定义与求导布局的概念。今天我们就讨论下其中的标量对向量求导,标量对矩阵求导, 以及向量对向量求导这三种场景的基本求解思路。 …
入门机器学习,我们都要学什么?
原文链接:http://www.jianshu.com/p/b2fd6ffebb1e 作为一个初学机器学习的人,确定学习目标很重要。这篇文章列举出机器学习中基础的常见算法。 机器学习的算法分为监督学习算法和非…
【深度剖析HMM(附Python代码)】4.HMM代码测试及hmmlearn介绍
相信经过上几节的说明,大家对于HMM应该有比较好的了解,也许大家已经自己试着运行代码了。 这一节主要介绍下另一个著名的HMM的Python库——hmmlearn,这个库提供了三个HMM模型(高斯HMM、离散HMM及高斯混…
机器学习(八)—Apriori算法
摘要:本文对Apriori算法进行了简单介绍,并通过Python进行实现,进而结合UCI数据库中的肋形蘑菇数据集对算法进行验证。 “啤酒与尿布”的例子相信很多人都听说过吧,故事是这样的:在一家超市中,人们发现了一…
【机器学习】Bregman迭代算法以及证明
Bregman系列算法是近几年在图像处理和压缩感知领域异军突起的算法,能够更好地从现有数据中还原真实目标结果。我们可以构造优化模型 argminH(u)+J(u) 来还原真实目标数据,一般理解为 H(u) 是我们的目标最…
朴素贝叶斯从公理到算法推导再到算法实现
github链接,使用jupyter实现 觉得帮到您了就在GitHub给个star吧
机器学习基本概念
1. 机器学习的定义 [Mitchell, 1997]对机器学习给出了一个形式化的定义:假设用P来评估计算机程序在某任务类T上的性能,若一个程序通过利用经验E在T中任务上获得了性能改善,则我们就说关于T和P,该程序对E进…