特征选择 当数据预处理完成后,我们需要选择有意义的特征,输入机器学习的算法模型进行训练。 TensorFlow实现seq2seq 前言 前面在《深度学习的seq2seq模型》文章中已经介绍了seq2seq结构及其原理,接…
标签:机器学习
Python—numpy.flatnonzero()
numpy.flatnonzero(): 该函数输入一个矩阵,返回扁平化后矩阵中非零元素的位置(index) 这是官方文档给出的用法,非常正规,输入一个矩阵,返回了其中非零元素的位置. 1 >>> …
机器学习算法——信息熵
信息熵(Entropy) 信息是个很抽象的概念。我们常常说信息很多,或者信息较少,但却很难说清楚信息到底有多少。比如一本书中到底有多少信息量。直到 1948 年,香农(C. E. Shannon)提出了“信息熵”(shā…
神经元个数
隐藏层单元的神经元个数通常是特征个数的 1倍 2倍 4倍 等。
机器学习(五)—集成学习
1、boosting与bagging的概念: (1)bagging:从原始数据中随机抽样得到S个同样大小的数据集,来训练S个基学习器,各学习器之间互不依赖。是一种并行的方法。 各分类器的权重…
学习笔记TF060:图像语音结合,看图说话
斯坦福大学人工智能实验室李飞飞教授,实现人工智能3要素:语法(syntax)、语义(semantics)、推理(inference)。语言、视觉。通过语法(语言语法解析、视觉三维结构解析)和语义(语言语义、视觉特体动作含…
机器学习练习(二)-机器学习的四大应用领域
一·数据挖掘 数据挖掘主要是应用于大数据领域,利用机器学习的模型来挖掘数据中的潜在价值。发现数据之间的关系。比如根据房价的变化预测房价,根据天气信息预测天气等。会应用经典的回归类问题。 传统的监督学习,或者非监督…
机器学习建议(转)
机器学习说简单就简单,说难就难,但如果一个人不够聪明的话,他大概很难知道机器学习哪里难。基本上要学习机器学习,先修课程是algebra, calculus, probability theory, linear regr…
使用conda创建虚拟环境
conda创建python虚拟环境 前言 conda常用的命令: conda list 查看安装了哪些包。 conda env list 或 conda info -e 查看当前存在哪些虚拟环境 conda update…
学习笔记DL001:数学符号、深度学习的概念
数学符号。 数和数组。?,标量(整数或实数)。?,向量。?,矩阵。?,张量。??,?行?列单位矩阵。?,维度蕴含上下文单位矩阵。?⁽ⁿ⁾,标准基向量[0,…,0,10,…,0],其中索引n处值为1。diag(?),对象方…
C++(十二)— vector中pair的排序方法
1、利用自定义的排序函数 通过传递一个函数 cmp给sort函数 , 注意: cmp中return a<b; 决定为从小到大的排序 return a>b; &n…
ID3 ,C4.5 CART 三种算法的优缺点
ID3 算法的核心是最大信息熵增益, 原则选择划分当前数据集的最好特征,信息熵是信息论里面的,是信息的度量方式,不确定度越大或者说越混乱,熵就越大,在建立决策树的过程中,根据特征属性划分数据,使得原本“混乱” 的数据的熵…