学习数据挖掘、机器学习的同学们应该经常碰到数据归一化(也称标准化),数据的不同特征种类(评价指标)的取值范围差别可能很大,如果不做处理会影响数据分析的结果。因此需要把数据进行标准化处理,将数据进行比例缩放,以消除不同特征…
标签:机器学习
AI体统中提高模型泛化能力的两个思路
近几天做模式识别实验时遇到了一个问题。在A环境下采集的数据所训练出的模型,在B环境下几乎丧失了识别能力。很明显,该模型的泛化能力太差。 考虑两个思路:第一,在不同的环境中采集多组数据重新模型训练,以此提高模型的泛化能力;…
支持向量机SVM—实现多分类问题的解决方案
支持向量机SVM—实现多分类问题的解决方案 前言 一、支持向量机SVM如何应用在多分类问题中? 二、解决方案 1.One-Versus-Rest(一对多) 2.One-Versus-One(一对一) 3.Directed…
处理数据中分类变量的三种方法(附代码实现)
本文是将kaggle Courses中 Categorical Variables | Kaggle进行了翻译并且加入自己的理解,如有地方不清楚,可以查阅原文 文章目录 介绍 三种方法 1)删除分类变量 2)Ordina…
决策树算法如何切分特征如何选择节点、信息增益、熵值计算
决策树算法 决策树 树模型 决策树:从根节点开始一步步走到叶子节点(这一过程叫做决策的过程,叶子节点就是决策)。 所有的数据最终都会落到叶子节点,既可以做分类,也可以做回归。 例如下面的图示就是一个决策的过程。 根节点:…
从全连接神经网络FCN到LSTM
深度学习的发展是从最开始的感知机开始的,但是感知机只能解决0,1分类的问题;对于输出概率或者具体的值的问题该怎么办,于是就出现了线性判别分析;但是,我们往往处理的数据是维度比较高的,这个时候怎么处理维度较高的数据怎么办呢…
最优化理论与方法-牛顿迭代法
关注微信公众号【Microstrong】,我现在研究方向是机器学习、深度学习,分享我在学习过程中的读书笔记!一起来学习,一起来交流,一起来进步吧! 本文同步更新在我的微信公众号里,地址:https://mp.weixin…
学习笔记 | 描述集中趋势
01 描述性统计量 | 描述集中趋势 均值:即平均值,其为一组数据的总和除以数据的个数。 中位数:将一组数据升序排列,位于该组数据最中间位置的值,就是中位数。如果数据个数为偶数,则取中间两个数值的均值。 众数:一组数据中…
机器学习常见算法分类
1 机器学习概念 1.1 机器学习的定义 在维基百科上对机器学习提出以下几种定义: “机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能”。 “机器学习是对能通过经验自…
Python语言在人工智能(AI)中的优势
本文探讨了Python语言在AI领域的优势与运用。 谁会成为AI 和大数据时代的第一开发语言? 这本已是一个不需要争论的问题。如果说三年前,Matlab、Scala、R、Java 和 Python还各有机会,局面尚且不清…
tensorflow环境搭建教程
tensorflow环境搭建教程 前言 一、下载anaconda 二、修改Python版本 三、搭建tensorflow环境 四、安装其他库模块 总结 文章目录 前言 一、下载anaconda 二、修改Python版本 …
python获取决策树的叶节点与深度
本文摘自“机器学习实战”,感兴趣者可自行查看! 获取决策树的叶节点 现有决策树如下: mytree={'no surfing': {0: 'no', 1: {'flippers': {0: 'no', 1: 'yes'}…