【12%】100小时机器学习——支持向量机SVM

总目录链接

前言

SVM

支持向量机(SVM)是一个有监督的机器学习算法,可以用于分类和回归分析,最主要是用于分类问题中。根据特征值,构建一个n维空间(n为特征数量), 把每个数据点投影到此空间内。

数据分类

查找一个超平面,把数据区分成两类。算法输出一个最佳超平面,用于数据分类。
最佳超平面:距离两类数据最远的一个超平面。即此超平面到达最近元素的距离在所有超平面中是最远的。

调整参数

核函数(Kernel)

学习线性SVM的超平面就是通过线性代数转化问题,这是核函数的功能。多项式和径向基用于更高维度。

系数(Gamma)

系数定义了单个训练集合的影响程度。小的系数值,距离远的点也会用于计算,大的系数值,更多使用距离近的点。

正则化(Regularization)

对于较大值的此参数,如果这个超平面可以更好的区分训练集合点,最好选择一个较小间距的超平面;相反的,对于非常小值的此参数,需要使用更大的间距,即使此超平面误区分更多的点。

间距(Margin)

间距指的是到最近点的分界线。
一个好的分解距离两类数据更远,且可以把一类的点区分开,而不需要穿过另外一个类。

初步笔记,将继续整理丰富

    原文作者:JustMe23
    原文地址: https://www.jianshu.com/p/c09474b0e605
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞