机器学习--支持向量机（一）什么是支持向量机

2023年1月1日 109次阅读来源: zsffuture

支持向量机的提出是为了解决线性无法分类的问题，想要深入理解就需要从线性分类开始探讨，找到线性分类的优缺点，然后在循序渐进的提出解决方法和思路进而引出支持向量机，在继续深入探讨支持向量机的特点，以及如何分类？分类的原理是什么，支持向量机的难点在哪里？如何解决？带着问题去探讨，这样才符合我们认识事物的规律，本篇讲述就按此进行。

线性分类器：

《机器学习--支持向量机（一）什么是支持向量机》

如图二维数据分类的例子，从图中看，这条分类函数还是可以准确做出判断的，但是这样的一元线性函数只存在一条吗？当然不是，能正确做出判断的函数有很多，如下图：

《机器学习--支持向量机（一）什么是支持向量机》

从图中可以看出这些一元线性函数都可以对此进行分类，但哪个线性分类函数最好呢？如何找出这个最好的线性分类函数呢？

在解释提出的问题之前，先把线性分类函数的一般表达式给出：

还记的Logistic回归中，他的分类函数的表达式是什么样的吗？直接引用博客里的式子：

《机器学习--支持向量机（一）什么是支持向量机》

其中：《机器学习--支持向量机（一）什么是支持向量机》

《机器学习--支持向量机（一）什么是支持向量机》为常数

下面就是如何找到最好的分类函数，什么是最好呢？就是分类预测的确信或者准确度达到最高就是最好的了

那么怎么找呢？

找这个分类函数其实就是找最佳的权值向量《机器学习--支持向量机（一）什么是支持向量机》和b，怎么找呢？找之前先引入几个概念：

最大边缘超平面（MMH）：

《机器学习--支持向量机（一）什么是支持向量机》

什么是最大边缘超平面呢？大家都知道，在一维中（横轴）一点可以把数分两类，在二维中，一条直线可以把数据分两类（上面讲的都二维的），在三维中，一个平面可以把数据分两类（大家可以想象空间一个球，过球心的水平面就可以把球分两部分），在四维，五维、六维、、、n维中（我们目前只知道一、二、三维的空间，三维空间可通过平面进行区分空间，更高维度的空间区分他们就叫超平面了，例如五维空间一般可以通过四维超平面进行分开，n维就是通过n-1维超平面进行区分，下面解释一下最大边界，以二维空间为例，我们知道区分二维平面的是直线，所谓最大边界，例如上图右，蓝色和红色边界的直线（黄色的）称为决策边界，他们分别经过了两边边沿的一个数据点，而这些数据点就称为支持向量点，为什么这样称呼下面会讲解，同时该两条直线之间的空间称为“隔离带”（自称的），如下图：

《机器学习--支持向量机（一）什么是支持向量机》

我们可以看到，b11和b12, b21和b22就是最大边缘决策边界（最大边缘超平面），他们分别经过两组数据的第一个点，以此称为决策边界，找到最大边缘分界有什么用呢？其实最优的分类一定就在这之间了，但是如何确定最优的呢？

假如我们找到的决策函数为上图的B1或者B2，大家觉得决策函数应该在哪里最好？直观是不是应该在中间，以B1的边缘为例，那么B1的决策决策函数就在b11和b12中间，因为中间位置到两遍的边缘分界的距离最大，那么他判断正确的确信度就越高，所以‘隔离带’越大越好，即通过求分界线之间的距离建立关系，一旦分界间的距离确定了，那么决策函数就容易求了，因此定义决策超平面（在二维中，是一条线，但是在高维中就是超平面了）如下：

《机器学习--支持向量机（一）什么是支持向量机》

把两边决策边界定义为：

《机器学习--支持向量机（一）什么是支持向量机》 ①

《机器学习--支持向量机（一）什么是支持向量机》 ②

那么从公式中我们可以看到，在决策边界上的数据点结果是等于1或者-1的（隔离带先假设不存在数据点），其余的应该不等于1或者-1的，结合下图，以二维数据为例，我们知道，下面的图形就是平面图形，边界直线经过坐标系的一二四象限，根据直线和坐标系的位置可知，以①式为例：数据点在①式上的等于1，数据点在它上面的肯定大于1，不信的可以拿个笔计算一下，初中知识了，那么分类方块代表数据总体可以写成这样了：

《机器学习--支持向量机（一）什么是支持向量机》

同理

《机器学习--支持向量机（一）什么是支持向量机》

即分两类了。1代表一类，-1代表一类，同时这两个不等式就是把数据分类了在说简单点，我们后面所要做的所有事情都希望满足这个，为什么呢？因为我们的目的是分类呀，这是最初的目的好吧，进行这一切的操作都是为了更好的分类，你说呢？

《机器学习--支持向量机（一）什么是支持向量机》

至于为什么是1和-1，那篇文章讲的很详细，我就不啰嗦了，不知道的可以查看一下，需要解释一下为什么边界线通过的点称为支持向量，以二维为例，上图中，我们可以看到x1和x2两个数据点分别是边界线进过的数据点，以0为原点建立直角坐标系，数据x1和x2分别构成的向量为：《机器学习--支持向量机（一）什么是支持向量机》和，，两向量相减得到：