Python 分类算法（2）——支持向量机Support vector machine分类案例（1）

2019年11月8日 71次阅读

在上一节中，应用sklearn包中的逻辑回归LogisticRegression对样本数据点进行分类。

Python 分类算法（1）——逻辑回归logistic regression之代码实现（2）

本节中，则采用支持向量机SVM算法对相同的样本点进行分类，可以对比一下两者的分类效果。

支持向量机的原理请参考《统计学习方法》书中的内容，这里讨论算法的实现方法。

import numpy as np
import pandas as pd
scatterdata=pd.read_csv("C:/Users/Ray/Desktop/logistic regression/data3.csv",header=None)#
data=np.array(scatterdata)

from numpy import where
import matplotlib.pyplot as plt
x=data[:,0:2]
y=data[:,2]
print(x.shape)
pos=where(y==1)
neg=where(y==0)
plt.scatter(x[pos[0],0],x[pos[0],1],marker='o',c='b')
plt.scatter(x[neg[0],0],x[neg[0],1],marker='x',c='r')

《Python 分类算法（2）——支持向量机Support vector machine分类案例（1）》

from sklearn.svm import SVC
clf=SVC(kernel='rbf')#高斯核函数
clf.fit(x,y)
y_pre=clf.predict(x)

from sklearn.metrics import confusion_matrix
import seaborn as sns
import matplotlib.pyplot as plt
import matplotlib
matplotlib.rcParams['font.sans-serif'] = ['SimHei']
mat = confusion_matrix(y,y_pre)
sns.heatmap(mat, square=True, annot=True, cbar=False)
plt.xlabel('预测值')
plt.ylabel('真实值');

《Python 分类算法（2）——支持向量机Support vector machine分类案例（1）》

以上采用的是高斯核函数进行的分类，和上节中利用逻辑回归算法相比，分类误差要小一些。逻辑回归算法的结果如下：

《Python 分类算法（2）——支持向量机Support vector machine分类案例（1）》

下面对分类结进行绘图显示。

from matplotlib.colors import ListedColormap
import matplotlib
matplotlib.rcParams['axes.unicode_minus']=False
matplotlib.rcParams['font.sans-serif'] = ['SimHei']
def plot_decision_regions(X, y, classifier, test_idx=None, resolution=0.02):
    markers = ('s', 'x', 'o', '^', 'v')
    colors = ('red', 'blue', 'lightgreen', 'gray', 'cyan')
    cmap = ListedColormap(colors[:len(np.unique(y))])
    x1_min, x1_max = X[:, 0].min() - 1, X[:, 0].max() + 1
    x2_min, x2_max = X[:, 1].min() - 1, X[:, 1].max() + 3
    xx1, xx2 = np.meshgrid(np.arange(x1_min, x1_max, resolution),
                           np.arange(x2_min, x2_max, resolution))
    Z = classifier.predict(np.array([xx1.ravel(), xx2.ravel()]).T)
    Z = Z.reshape(xx1.shape)
    plt.contourf(xx1, xx2, Z, alpha=0.3, cmap=cmap)
    pos=where(y==1)
    neg=where(y==0)
    plt.scatter(x[pos[0],0],x[pos[0],1],marker='o',c='b')
    plt.scatter(x[neg[0],0],x[neg[0],1],marker='x',c='r')
    plt.xlim(xx1.min(), xx1.max())
    plt.ylim(xx2.min(), xx2.max())
plot_decision_regions(X=x, y=y, classifier=clf)

《Python 分类算法（2）——支持向量机Support vector machine分类案例（1）》

上图是支持向量机算法的分类图，下图是映射到三维的视图，由图中可以看出来，没有完全的分隔开，所以还存在几个样本点出现分类错误。

《Python 分类算法（2）——支持向量机Support vector machine分类案例（1）》