二次规划
其中这些问题在我考研的时候也想清楚了,只是读研以来一开始做的是进化算法,后来又做的深度学习,都是理论性不太强的方向。这些东西有点忘了,现在看到书突然一下记起来了,便做个笔记吧。
- 注:如何理解线性变换?向量经过可逆线性变换以后,向量还是那个向量,只不过换了一组基向量(或者说换了一个坐标系统)相当于换了一种表达方式。但是向量假如经过线性变换不是可逆的,那么这个变换过后就产生了信息丢失,比如一个向量( 1 , 1 ) (1,1)(1,1)经过一个不满秩的线性变换以后就变回不来了,向量就不是那个向量了。
- 定义:一类典型的优化问题,目标函数是变量的二次函数,而约束条件使变量的线性不等式
min 1 2 x T Q x + c T x s . t . A x ≤ b \min \frac1 2x^TQx+c^Tx \\ s.t.Ax\le bmin21xTQx+cTxs.t.Ax≤b
其中x xx为d维向量,Q ∈ R d × d Q\in\mathbb{R}^{d\times d}Q∈Rd×d为实对称矩阵 - 我们知道Q QQ的特征向量实质上是一组基向量,那么x xx可以转换为这组特征向量的线性组合。假如Q是正定的,那么
x T Q x = x ′ T Q ′ x ′ x^TQx = x^{\prime T}Q^{\prime}x^\primexTQx=x′TQ′x′
其中Q ′ Q^\primeQ′为一个对角阵,元素为Q QQ的特征值,x ′ x^\primex′为通过线性变换后得到的向量。其中
Q = M T Q ′ M , x ′ = M x Q = M^TQ^\prime M, x^\prime = MxQ=MTQ′M,x′=Mx
可以看成是一个特征分解的过程。
- 假如Q QQ是正定的(即Q的特征值都是大于0的),则二次规划具有全局唯一解x ′ = 0 x' = 0x′=0,根据x ′ x'x′求出x xx即可。试想一下,Q ′ Q'Q′是一个对角阵且对角元素全大于0,则x ′ T Q ′ x ′ x^{\prime T}Q^{\prime}x^\primex′TQ′x′展开必然是这样一种形式(懒得敲公式了我擦…直接写出来拍照吧)
- 假如Q QQ是半正定的(即Q的特征值都是大于或等于0的),且约束条件的可行域A x ≤ b Ax\le bAx≤b不为空,并且目标函数在此可行域具有下界,则二次规划具有局部最优。假如不存在约束条件,则最优解有无数个,只要令特征值为0对应的x ′ x'x′的元素为0即可(其他元素随你喜欢,天马行空都可以哈哈),这个也很好解释,也就是我懒得写的公式上边有些q i ′ = 0 q_i'=0qi′=0,其余的q i ′ > 0 q_i'>0qi′>0,只需要q i ′ > 0 q_i'>0qi′>0对应的x i ′ = 0 x_i'=0xi′=0即可,q i ′ = 0 q_i'=0qi′=0对应的x i ′ x_i'xi′=天马行空。
- 假如Q QQ是非正定矩阵,则…天马行空,有很多局部最优解,是一个np难问题
- 注意:在最优化问题中,只有hessian矩阵不定时才会出现鞍点(半正定也不会)!
版权声明:本文为nickkissbaby_原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。