最优化方法
1. Introduction to optimization
1.1. 范数
1.2. 泰勒展开
1.3. Hessian 矩阵
1.4. 矩阵正定的判定
- 各阶顺序主子式都大于0
(负定的判定是奇数阶为负,偶数阶为正)
1.5. 矩阵逆的计算
右侧即为逆矩阵
2. Approximation and fitting
2.1. 范数近似
求导:
3. Convex sets
3.1. affine set
集合中任意两点的连线也都在集合中
3.2. convex set
集合中任意两点的连线段也在集合中
3.3. convex hull
- convex combination
convex hull is:
3.4. convex cone
- conic combination
convex cone is: set that contains all conic combinations of points in the set
3.5. simplices (单纯型)
3.6. 是 norm 函数的要求
3.7. Positive semidefinite cone (半正定锥)
为什么是锥?举个例子
在的空间上是一个锥
3.8. closure, interior and boundary
- closure of
- interior of
- boundary of
3.9. relative interior
and relative boundary is
4. Convex functions
4.1. strict convex
4.2. strongly convex
which is equivalent to is convex
4.3. 扩充定义域
对于不在 定义域中的函数值定义为
需要是凸集
4.4. 凸函数的一阶判定条件
4.5. 凸函数的二阶判定条件
矩阵正定的一个判定方法:对于任意向量,都有
4.6. epigraph and -sublevel set
- -sublevel set
- epigraph
4.7. closed convex function
- 闭集(closed set)
- 包含其所有极限点的集合
- lower semi-continuous (l.s.c)
也叫下半连续
- closed function
-
- l.s.c everywhere
- or epigraph is closed
- or all sublevel sets are closed
- 紧集 (compact set)
- 有界闭集
4.8. Pointwise supremum and Minimization
if is convex in for each , then is convex
if is convex in and is convex set, then is convex
4.9. Conjugate function (共轭函数)
共轭函数 总是凸的,因为它是一系列直线的 sup
记几个例子:
4.10. 对偶范数
4.11. conjugate of conjugate
if is convex and closed
5. Convex optimization problems
5.1. standard form convex optimization problem
where are convex functions
等式约束需要是线性的(要不然定义域就不是凸的了)
5.2. Optimality criterion for differentiable
if is optimal, for all feasible
不仅对于无约束问题成立(废话因为),对于有约束问题也是成立的
5.3. Equivalent convex problems
如果一个问题的解很容易从另一个问题的解中得到,那么两个问题就是(非正式的)等价的,反之亦然 例如
可以等价于
又例如
可以等价于
5.4. piecewise-linear minimization
等价于
5.5. Chebyshev center of a polyhedron
求这个最大半径的问题可以化简成LP
5.6. Quadratic program (QP)
QP的不等式约束也是线性的,不等式约束是二次的叫QCQP
二阶锥规划的不等式约束形式是
6. Unconstrained minimization
6.1. 对于强凸函数
在右侧对求最小值 , 所以
带入到右式子是
6.2. general descent method
- given starting point
-
repeat
- 计算下降方向
- 选择更新步长
- until stopping criterion is satisfied
6.3. exact line search
6.4. backtracking line search
初始时
不断令 直到
6.5. gradient descent method
以指数收敛:
6.6. steepst descent method
- normalized steepst descent direction
- (unnormalized) steepst descent direction
6.7. Newton Step
因为取的二阶近似
可以认为牛顿步是下的最速下降
的对偶范数是
6.8. Newton decrement
Also,
6.9. Newton method
- given starting point , tolerance
-
repeat
- 计算 和
- 如果 结束
- backtracking line search 得到
收敛性要求的假设:
- 强凸
-
Lipschitz continuous ()
收敛的两个阶段:
存在常数
- if then
-
if then
达到的算法总步数为
7. Duality
7.1. Lagrange dual 和 conjugate function 的关系
当不等式约束是线性的时候
Lagrange dual function 是
7.2. Lagrange dual problem
最优解的值是
- weak duality
- 总是成立
- strong duality
- 如果 ,则称为强对偶性,一般对凸问题成立 成立的条件叫做 constraint qualification
7.3. Slater's constraint qualification
如果凸优化问题是 strict feasible 的,那么强对偶性成立
条件可以被放松: 也就是线性的不等式约束不要求严格小于,可以是小于等于
7.4. Complementary slackness
要么 ,要么
7.5. KKT conditions
7.6. 利用对偶问题求解原问题
- 求解 得到
- 固定 的情况下求解 得到
8. Equality constrained minimization
(ps. 也可以如 小节 7.6 用对偶问题求解)
8.1. 等式约束的二阶最小化
已知
由KKT条件
整理一下就得到
其中 叫做KKT矩阵
KKT矩阵是非奇异的
非奇异的等价条件
如果KKT矩阵是奇异的,并且等式不可解,那么问题是unbounded below 或 infeasible 的
如果KKT矩阵是奇异的并且可解,那么问题是多个最优解的
8.2. 等式约束的消元
可以写成 的形式,其中 是任意一个特解, 是的零空间的一组基
8.3. Newton step with equality constraints
将原问题看成二阶展开的近似
由KKT条件 (加上)
此时 的计算可以是
或者是
但是因为不满足等式约束,不能是
因为是线性变换,算法的收敛性质不变
9. Inequality constrained minimization
9.1. Logarithmic barrier
approximation improves as
Logarithmic barrier function :
9.2. 中心路径 (central path)
central path 是
对有barrier的最优化目标求KKT条件有
整体除以是
按照上式格式,定义
带入到不带barrier的中有:
因此有
有barrier的KKT条件变化的只有 complementary slackness
9.3. Barrier method (内点法)
- 给定 strictly feasible 和 tolerance
-
repeat
- 求解 得到
- 如果 结束
- 收敛性
-
-
外层循环要做次
- 内层循环与牛顿法相同
9.4. phase I methods
用来找到一个feasible的初始点,将原本的 feasibliity problem 转化为一个优化问题
如果解出来的,那么原问题是infeasible的