泛化误差上界:
对二分类问题,当假设空间是有限个函数的集合F={f1,f2,f3,...,fn}时,对任意一个函数,至少以概率
,以下不等式成立:
其中,
不等式右端第一项为训练误差,训练误差越小,泛化误差就越小
第二项为N的单调递减函数,当N趋于无穷时其趋于0,且假设空间包含的函数越多,其值越大
以下为证明过程:
首先,因为证明过程要用到Hoeffding不等式,叙述如下:
设是独立随机变量X1,X2,...,Xn之和,
,则对任意t>0,以下不等式成立:
现有,对任意,
是N个独立随机变量L(Y,f(X))的样本均值,
是随机变量L(Y,f(X))的期望值,损失函数取值于区间[0,1],即对所有i,[ai,bi]=[0,1]则有:
因为
因此,由Hoeffding不等式得:
因为,假设空间是一个有限集合,则有:
等价于:
令,则至少以概率
有
成立
因此,训练误差小的模型,泛化误差也会小
版权声明:本文为qq_41910742原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。