这一章开始,进入凸优化的应用。
拟合、逼近、插值
- 拟合
- 一般是对于离散点
- 用函数代替列表函数使得误差在某种意义下最小
- 插值
- 一般是对于离散点
- 用一个函数来近似代替列表函数,并要求函数通过列表函数中给定的数据点
- 逼近
- 一般是对于连续函数
- 为复杂函数寻找近似替代函数,其误差在某种度量下最小
范数逼近
基本问题p286 p 286
最简单的范数逼近问题具有以下形式的无约束问题:
向量r=Ax−b r = A x − b称为这个问题的残差,其分量称为个体残差。
很明显,范数逼近问题是一个凸问题,也就是说,至少存在一个最优解。
由线性代数的知识,当b∈C(A) b ∈ C ( A )时,最优值为0,但我们更关心其不为A A的列空间的情况。
解释
可以看出,范数逼近问题目标是用A A的列空间的线性组合尽可能的逼近向量,其偏差由范数度量。
在几何上有更好的解释,其中,x x可认为是向量在A A的子空间中的投影点,也就是最靠近的点。
最小二乘逼近
最常见的范数逼近是l2 l 2范数。其问题描述为:
其目标函数为残差平方和。我们可以将目标函数转化为凸二次函数:
可以解析的求解得到:
这个方程为正规方程,并且总是有解的。
Chebyshev逼近
当使用l∞ l ∞范数时,逼近问题转化为:
表示为极小化最大残差。可以将其描述为线性规划问题:
残差绝对值之和逼近
如果使用l1 l 1范数,逼近问题表示为:
这是一种鲁棒估计器。也可以表示为线性规划问题:
罚函数逼近
我们把范数扩展开来,可以考虑目标函数:
我们可以不用管外面的幂次,具体来说,可写成如下罚函数逼近问题:
其中,ϕ ϕ称为罚函数,若其为凸函数,则该问题为凸优化问题。
我们可以将目标函数理解为总体惩罚:每个残差的罚函数之和。
有一些常见的罚函数p288 p 288:
- ϕ(u)=|u|p ϕ ( u ) = | u | p,为范数逼近问题
- 带有死区的线性罚函数
- 对数障碍罚函数
- Huber罚函数
对于这些罚函数的解释可以参考书上p288 p 288。
书中还考虑了野值(很大的噪声值)对用罚函数设计的影响。
最小范数问题
之前我们考虑的是范数逼近问题(在某种度量下残差最小),现在考虑范数最小问题:
该问题的解为Ax=b A x = b的最小范数解。
可重构为范数逼近问题,令x0 x 0为任意解,Z Z的列是的零空间的基:
几何解释
可行集{x|Ax=b} { x | A x = b }是仿射的,最小范数问题是在仿射集合中寻找距离0最近的点,即寻找0向仿射集合的投影。
线性方程组的最小二乘解p296 p 296
最常见的最小范数问题为l2 l 2范数:
其唯一解称为方程Ax=b A x = b的最小二乘解。类似于最小二乘逼近,此问题也可以被解析的求解。我们可以使用对偶问题来解决此凸优化问题,最优性条件为:
这很容易求解,不再赘述。
最小罚问题
在约束Ax=b A x = b下,最小罚问题找到了具有最小总惩罚的x x。
正则化逼近
双准则式
在正则化逼近中,我们的目标是寻找向量使其较小,同时使得残差较小的值。
可以描述为双目标凸向量优化问题:
注意,这两个范数可能是不同的,第一个用以度量残差的规模,第二个用于度量x x的规模。
正则化
正则化是求解双准则问题的一个常用的标量化方法:
其中γ>0 γ > 0为问题参数。
Tikhonov正则化p298 p 298
最常见的正则化基于上式并利用Euclid范数,得到一个凸二次优化问题(也称为领回归):
这个正则化有解析解:
鲁棒逼近
随机鲁棒逼近
当矩阵数据A A允许不确定和可能的变化时,记起均值为,U U为均值为0的随机矩阵,则可以将表示为:
自然的,可以用||Ax−b|| | | A x − b | |的期望来作为目标函数:
这种问题被称为随机鲁棒逼近问题。虽然是凸优化,但并不好解。
若A A仅有有限个可能值(离散点)时,即,则问题可以写为:
这被称为范数和问题。可以表述为:
可见,若为l2 l 2范数,则范数和问题是一个二阶锥规划。
鲁棒最小二乘问题
由于A=A¯+U A = A ¯ + U,则可以将目标函数改写为:
其中P=E(UTU) P = E ( U T U )。因此,可以将该问题化为正则化最小二乘形式:
不难通过求导可以得到解为:
最坏鲁棒逼近
我们用A A的可能值集合描述其不确定性,我们定义候选的逼近解x x的最坏误差为:
最坏情况鲁棒逼近问题是极小化最差情况的误差: