支持向量机(原问题和对偶问题)

电子说

1.2w人已加入

描述

本文主要介绍原问题(PRIME PROBLEM)和对偶问题(DUAL PROBLEM),支持向量机优化问题可通过原问题向对偶问题的转化求解。

一、原问题的定义

原问题的定义为:

最小化:f(ω);

限制条件:gi(ω)≤0,i=1~K;hi(ω)=0,i=1~M。

其中,ω为多维向量,限制条件中具有K个不等式(gi(ω)≤0),M个等式(hi(ω)=0)。

二、对偶问题的定义

首先定义函数:L(ω,α,β)=f(ω)+∑αigi(ω)+∑βihi(ω);

该函数向量形式的定义:L(ω,α,β)=f(ω)+αTg(ω)+βTh(ω);

该函数向量形式的定义中,α=[α1,α2,…,αK]T,β=[β1,β2,…,βM]T,g(ω)=[g1(ω),g2(ω),…,gK(ω)]T,h(ω)=[h1(ω),h2(ω),…,hM(ω)]T。

基于函数L(ω,α,β)的定义,原问题的对偶问题定义如下:

最大化:θ(α,β)=inf L(ω,α,β);

限制条件:αi≥0,i=1~K。

其中,inf L(ω,α,β)为遍历所有ω后,取值最小的L(ω,α,β)。        

三、定理一  

根据以上定义,可得出定理一:  

如果ω*是原问题的解,(α*,β*)是对偶问题的解,则有: f(ω*)≥θ(α*,β*)  

该定理的证明如下: θ(α*,β*)=inf L(ω,α*,β*)(将α*、β*代入对偶函数的定义)

≤L(ω*,α*,β*)(此步推导由于inf L(ω,α*,β*)的取值最小)

=f(ω*)+α*Tg(ω*)+β*Th(ω*)(此步推导根据L(ω,α,β)的定义)

≤f(ω*)(此步推导由于原问题的限制条件gi(ω)≤0,hi(ω)=0,对偶问题的限制条件αi≥0)    

四、强对偶定理  

将f(ω*)-θ(α*,β*)定义为对偶差距(DUALITY GAP),根据上述定理,对偶差距是大于等于零的函数。  

如果g(ω)=Aω+b,h(ω)=Cω+d,f(ω)为凸函数,则有f(ω*)=θ(α*,β*),此时对偶差距等于零。该定理为强对偶定理(STRONG DUALITY THEOREM)。  

强对偶定理可更通俗地表述为:原问题的目标函数(f(ω))是凸函数,原问题的限制条件是线性函数,则原问题的解与对偶函数的解相等。

五、KKT条件  

若f(ω*)=θ(α*,β*),则有: f(ω*)+α*Tg(ω*)+β*Th(ω*)=f(ω*); 即对于所有的i=1~K,要么αi=0,要么gi(ω*)=0(因为hi(ω)=0)。  

该结论被称为KKT条件,KKT分别代表先后独立发现该结论的研究人员Karush、Kuhn、Tucker,该结论在Kuhn、Tucker发现后逐步被推广。    






审核编辑:刘清

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分