定义(感知机) 假设输入空间(特征空间)是$ \chi \in \mathbf {R}^{n} $,输出空间是$ \mathcal{Y} ={+1,-1} $.输入$ x \in \chi $表示实例的特征向量,对应于输入空间的点,输出$ y \in \mathcal{Y} $表示实例的类别.由输入空间到输出空间的如下函数 $ f(x) = sign(w\cdot x + b) $ 称为感知机.其中,w和b为感知机模型参数,$ w \in \mathbf {R}^{n} $叫作权值或权值向量,$ b \in \mathbf{R} $叫作偏置,$ w \cdot x $表示w和x的内积。sign是符号函数,即
感知机是一种线性分类模型,属于判别模型。感知机模型的假设空间是定义在特征空间中的所有线性分类模型或线性分类器,即函数集合$ {f|f(x)=w \cdot x + b} $
感知机学习策略 定义(数据集的线性可分性) 给定一个数据集 $ T = {(x{1},y{1}),(x{2},y{2}),\cdot \cdot \cdot,(x{N},y{N})} $,其中,$ x{i} \in \chi=\mathcal R^{n} $,$ y{i} \in \chi ={+1,-1} i=1,2,\cdot \cdot \cdot,N $,如果存在某个超平面S $ w \cdot x +b = 0 $ 能够将数据集的正实例点和负实例点完全正确的划分到超平面的 两侧,即对所有$ y{i}=+1 $的实例i,有$ w \cdot x{i} > 0 $,对所有$ y{i}=-1 $的实例i,有$ w \cdot x{i} \lt 0 $,则称数据集T为线性可分数据集;否则,称数据集T线性不可分。
假设训练数据集是线性可分的,感知机学习的目标是求得一个能够将训练集正实例点和负实例点完全正确分开的分离超平面。感知机采用误分类点到超平面S的总距离作为损失函数。 输入空间中任一点到超平面S的距离: ||w||是w的L2范数。
Ref:
1.统计学习方法-李航