线性分类器
线性判别函数
一般形式:
g(x)=∑wixi+w0=wTx+w0
wi 为加权因子,w0 为阈值权。
常用 g=wTx+w0 简化表示。
二分类中用线性判别函数 g,规则为:
则判别平面即 g=0.
或采用增广矩阵:y=⟨1∣x⟩,因此可以把它简化成 aTy.
a=⟨w0∣w⟩ 为增广权向量。在增广空间中 aTy=0 确定一个过原点的分类面。
多分类转二分类:A vs Aˉ,或者做 O(n2) 个分类器一一做二分类,最后投票。
垂直平分分类器
是一种线性分类器。
分类面取两类均值连线的中垂线。即
m1m2ww0=n11P∼ω1∑P=n21Q∼ω2∑Q=m1−m2=−wT2m1+m2
然后以 wTx+w0 为分类面。
Fisher 投影
这里只讲 RD→R.
用 Fisher 降维。
思想:将二分类的样本投影到直线 y=wTx 上,最大化均值之差、最小化类内方差。
具体做法:
先定义类内离散度矩阵
S1=P∼ω1∑(P−m1)(P−m1)T.S2=Q∼ω2∑(Q−m2)(Q−m2)T.SW=S1+S2
然后是类间的离散度矩阵
SB=(m1−m2)(m1−m2)T
接下来最小化 Rayleigh 商:
J(w)=wTSwwwTSBw
用 Lagrange 乘子法得到
w∗=Sw−1(m1−m2).
此时将样本点先投影到 y=w∗Tx,然后在直线上取一个分割点(通常取 (m1+m2)/2 即中点)。
感知机
唯一真神。
y=f(wTx+θ)
用 f 激活函数引入非线性部分。
由于类 2 的判据是内层 <0,为了方便将类 2 的分量都乘以 −1,这样 aTy 都会落在第一象限(大于 0)。
用惩罚函数 J.
最小化 J,通过梯度下降。