支持向量机（SVM）的定义、分类及工作流程图详解

lviY_AI_shequ 2017-11-30 86296

电子说

1.4w人已加入

描述

关于SVM

可以做线性分类、非线性分类、线性回归等，相比逻辑回归、线性回归、决策树等模型（非神经网络）功效最好

机器学习

传统线性分类：选出两堆数据的质心，并做中垂线（准确性低）——上图左

SVM：拟合的不是一条线，而是两条平行线，且这两条平行线宽度尽量大，主要关注距离车道近的边缘数据点（支撑向量support vector），即large margin classification——上图右

机器学习

使用前，需要对数据集做一个scaling，以做出更好的决策边界（decision boundary）

机器学习

但需要容忍一些点跨越分割界限，提高泛化性，即softmax classification

机器学习

在sklearn中，有一个超参数c，控制模型复杂度，c越大，容忍度越小，c越小，容忍度越高。c添加一个新的正则量，可以控制SVM泛化能力，防止过拟合。（一般使用gradsearch）

SVM特有损失函数Hinge Loss

机器学习

(liblinear库，不支持kernel函数，但是相对简单，复杂度O(m*n)）

同SVM特点吻合，仅考虑落在分类面附近和越过分类面到对方领域的向量，给于一个线性惩罚（l1），或者平方项（l2）

import numpy as npfrom sklearn import datasetsfrom sklearn.pipeline import Pipelinefrom sklearn.preprocessing import StandardScalerfrom sklearn.svm import LinearSVCiris = datasets.load_iris()X = iris["data"][:,(2,3)]y = (iris["target"]==2).astype(np.float64)svm_clf = Pipeline(( ("scaler",StandardScaler()), ("Linear_svc",LinearSVC(C=1,loss="hinge")), ))svm_clf.fit(X,y)print(svm_clf.predit([[5.5,1.7]]))

对于nonlinear数据的分类

有两种方法，构造高维特征，构造相似度特征

使用高维空间特征（即kernel的思想），将数据平方、三次方。。映射到高维空间上

from sklearn.preprocessing import PolynomialFeaturespolynomial_svm_clf = Pipeline(( ("poly_features", PolynomialFeatures(degree=3)), ("scaler", StandardScaler()), ("svm_clf", LinearSVC(C=10, loss="hinge")) ))polynomial_svm_clf.fit(X, y)

这种kernel trick可以极大地简化模型，不需要显示的处理高维特征，可以计算出比较复杂的情况

但模型复杂度越强，过拟合风险越大

SVC（基于libsvm库，支持kernel函数，但是相对复杂，不能用太大规模数据，复杂度O(m^2 *n)-O(m^3 *n)）

可以直接使用SVC（coef0：高次与低次权重）

from sklearn.svm import SVCpoly_kernel_svm_clf = Pipeline(( ("scaler", StandardScaler()), ("svm_clf", SVC(kernel="poly", degree=3, coef0=1, C=5)) ))poly_kernel_svm_clf.fit(X, y)

机器学习