支持向量机原理详解(八): 多类分类SVM

前面七篇文章(从间隔最大化，支持向量开始)系统地推导了适用于二类分类(binary/two-class classification)问题的SVM。在此基础上可以将SVM推广到多类分类问题。在理解二类分类SVM后，多类分类SVM也不难理解。

本文对多类分类SVM做简单介绍，内容如下：

多类分类问题
成对分类方法(one-against-one， pairwise classification)
一类对余类(one-against-all，one-against-the-rest)
只需求解一个优化问题的多类方法

11. 多类分类SVM(multi-class SVM)

11.0 多类分类问题

前文在数据集只有两类 $left( y_nin left{ -1, 1 ight} ight)$ 的情况下推导了二类分类SVM(为方便起见，以下称binary SVM)。现在介绍如何将SVM推广到数据有个类的分类问题。

多类分类问题描述如下(参考文献[6])：

给定含个样本的训练集 $X=left{ (mathbf x_1, y_1),ldots, (mathbf x_N, y_N) ight}$ ，其中维特征向量，类标签 $y_nin left{ 1, 2,ldots, M ight}$ ，。训练集数据共个类。任务是找到决策函数 (或者说一个规则)用于预测新数据的类别。

11.1 成对分类方法(one-against-one，pairwise classification)

成对分类方法(文献[6])是基于binary SVM的，也叫one-against-one(文献[2-3])，pairwise classification(文献[1]引入)。one-against-one适合实际应用(文献[3])，也是LIBSVM库采用的方法(文献[2])。

设训练集数据共个类，one-against-one方法是在每两个类之间都构造一个binary SVM。以下图(a)为例，共三类(二维)数据，虚线 $d_{12}$ 表示1类和2类数据之间的binary SVM的决策边界， $d_{13}$ 表示1类和3类之间的决策边界， $d_{23}$ 则表示2类和3类之间的决策边界。