偏度skewness 1. 随机变量的偏度定义 随机变量 X {X} X的偏度 γ 1 \gamma_1 γ1为三阶标准矩,标准定义为: γ 1 = E [ ( X − μ σ ) 3 ] = μ 3 σ 3 = E …
标签:machine-learning
一次性弄懂马尔可夫模型、隐马尔可夫模型、马尔可夫网络和条件随机场!(词性标注代码实现)
文章目录 1. 马尔可夫网络、马尔可夫模型、马尔可夫过程、贝叶斯网络的区别 2. 马尔可夫模型 2.1 马尔可夫过程 3. 隐马尔可夫模型(HMM) 3.1 隐马尔可夫三大问题 3.1.1 第一个问题解法 3.1.2 第…
【机器学习】一型模糊集和二型模糊集
模糊集(一型模糊) 在经典的集合理论中,一个元素要么属于要么不属于这个集合。相比之下,模糊集则通过隶属度函数来评价一个元素对于一个集合的隶属程度。因此,模糊集是对经典集合的一般化。在模糊集理论中,经典的二价集(bival…
数据不平衡问题的处理
引言 在分类问题中正负样本比例不平衡是很常见的问题,例如在预测CVR的时候,会有大量的负例,但是正例的数目缺不多,正负样本比例严重失衡。这是一个值得思考的问题。 解决思路 首先我们需要思考的是我们可否通过扩大数据集,得到…
【ML笔记】信息增益、Gini、信息增益率
前言 本文介绍三种决策树算法中的分枝依据,分别是ID3算法中的信息增益(Info Gain),CART算法中的Gini,C4.5中的信息增益率(Info Gain Ratio),我在这篇文章中介绍了决策树ID3和C4.5…
线性模型(二)之多项式拟合
1. 多项式拟合问题 多项式拟合(polynominal curve fitting)是一种线性模型,模型和拟合参数的关系是线性的。多项式拟合的输入是一维的,即 x=x x = x ,这是多项式拟合和线性回归问题的主…
图片特征提取
计算机视觉是一门研究如何使机器“看”的科学,让计算机学会处理和理解图像。这门学问有时需要借助机器学习。本文介绍一些机器学习在计算机视觉领域应用的基础技术。 通过像素值提取特征 数字图像通常是一张光栅图或像素图,将颜色映射…
Python在字符串中查找子字符串
这是小白博主在刷leetcode时遇到的一道题,这是博主近日刷的leetcode题库时结果表现最好的一道题,故在此分享这份喜悦。 希望在以后的日子里可以继续进步,持之以恒。 目录 题目介绍 解题思路及代码 …
参数估计的三种方法-MLE,MAP与BayesianEstimation
参数估计的三种方法 机器学习有三种典型的参数估计方法,分别是极大似然估计(MLE),极大后验估计(MAP)以及贝叶斯估计。除了参数估计,每种方法还对应有样本的密度估计。假设 X = [ x i ] i = 1 n X=[…
浅谈几种基本的点估计方法及实例
参数估计有两种形式:点估计与区间估计。本文选择几种常用的点估计方法作一些讨论。 用于估计未知参数的统计量称为点估计(量)。参数 θ \theta θ 的估计量常用 θ ^ = θ ^ ( x 1 , x 2 , … , …
利用随机森林对特征重要性进行评估 方法一
https://hal.archives-ouvertes.fr/file/index/docid/755489/filename/PRLv4.pdf 前言 随机森林是以决策树为基学习器的集成学习算法。随机森林非常简单,…