参见原书1.5节 构建预测模型的一般流程 问题的日常语言表述->问题的数学语言重述重述问题、提取特征、训练算法、评估算法 熟悉不同算法的输入数据结构:1.提取或组合预测所需的特征2.设定训练目标3.训练模型4.评估…
标签:机器学习
Apriori算法核心逻辑代码实现
概述Apriori算法是生成频繁集的一种算法。Apriori原理有个重要假设,如果某个项集是频繁的,那么它的所有子集势必也是频繁的。如果一个项集是非频繁项集,那么它所对应的超集就全都是非频繁项集。 实现 从大规模数据集中…
python实现牛顿法求解求解最小值(包括拟牛顿法)【最优化课程笔记】
什么是牛顿法 在第9章中介绍了一维搜索的牛顿法,什么是一维搜索的牛顿法?首先介绍一下一维搜索 一维搜索 一维搜索其实也很简单,在许多迭代下降算法中,具有一个共同的特点,就是得到点x(k)后,需要按照某种规则确定一个方向d…
Sklearn中二分类问题的交叉熵计算
二分类问题的交叉熵 在二分类问题中,损失函数(loss function)为交叉熵(cross entropy)损失函数。对于样本点(x,y)来说,y是真实的标签,在二分类问题中,其取值只可能为集合{0, 1}. 我…
机器学习算法综述
近些年来,随着大数据、云计算、移动互联网、人工智能技术的兴起,“机器学习”成为了行业内炙手可热的一个名词。从通信互联网领域的专家,到各式各样的企业,甚至到普通的老百姓,都对“机器学习”技术略知一二。那么,机器学习到底是什…
机器学习项目流程
在微博上看到七月算法寒老师总结的完整机器的学习项目的工作流程,结合天池比赛的经历写的。现在机器学习应用非常流行,了解机器学习项目的流程,能帮助我…
走进机器学习世界之TensorFlow.js快速上手
前言 近两年人工智能,机器学习等各种概念漫天飞舞,那人工智能,机器学习,深度学习这些名词之间是什么关系呢? 如果用三个同心圆来解释的话,人工智能是最大的圆,机器学习是中间的圆,深度学习是最小的圆。具体解释就是: 机器学习…
基于 Python 的简单自然语言处理实践
基于 Python 的简单自然语言处理实践 从属于笔者的 程序猿的数据科学与机器学习实战手册。 基于 Python 的简单自然语言处理 本文是对于基于 Python 进行简单自然语言处理任务的介绍,本文的所有代码放置在这…
学习笔记DL008:概率论,随机变量,概率分布,边缘概率,条件概率,期望、方差、协方差
概率和信息论。 概率论,表示不确定性声明数学框架。提供量化不确定性方法,提供导出新不确定性声明(statement)公理。人工智能领域,概率法则,AI系统推理,设计算法计算概率论导出表达式。概率和统计理论分析AI系统行为…
机器学习笔记(一)之监督学习重要问题
分类问题,标注问题,回归问题为监督学习重要问题 一.分类问题 分类问题是监督学习的核心问题。分类是监督学习的一个核心问题,在监督学习中,当输出变量Y取有限个离散值时,预测问题便成为分类问题。这时,输入变量X可以是离散的,…
大数据技术及算法学习清单
基础 数据结构与算法 极客时间专栏:数据结构与算法之美 https://time.geekbang.org/col… leetcode刷题:https://leetcode-cn.com/ 大数据技术 离线计…
机器学习:数据清洗及工具OpenRefine
数据分析中,首先要进行数据清洗,才可以继续训练模型,预测等操作。 首先介绍一下什么是数据清洗(定义来自 百度百科,有删减) 数据清洗从名字上也看的出就是把“脏”的“洗掉”,指发现并纠正数据文件中可识别的错误的…