找回密码
 立即注册
查看: 346|回复: 2

【ADMM笔记】(二)ADMM算法细节、变体和常见技巧

[复制链接]
发表于 2022-1-31 16:09 | 显示全部楼层 |阅读模式
论文题目:《Distributed optimization and statistical learning via the alternating direction method of multipliers》
论文地址:
这篇笔记对应论文的章节:
3 Alternating Direction Method of Multipliers3.1 Algorithm
3.3 Optimality Conditions and Stopping Criterion
3.4 Extensions and Variations
4 General Patterns4.3 Smooth Objective Terms

Algorithm

考虑问题:




ADMM两种形式

unscaled form ADMM
上一个文章已经给了一种形式的ADMM算法,我们称之为unscaled form:






scaled form ADMM


化简得:





由此ADMM方法变为:






(3)被称为scaled form ADMM。
最优性条件

记原问题最优解为  ,对偶问题最优解为  。考虑(1)的KKT条件:






同时需要满足约束:  



根据对偶理论知:
(4a)、(4b)、(4c)是  、  分别为原问题和对偶问题最优解的充分必要条件。
Remark 1. (4a)、(4b)被称为dual feasibility,(4c)被称为primal feasibility。
终止准则

(4a)、(4b)、(4c)给了最优性的条件,根据这一条件,我们利用迭代点与最优性之间的差距作为终止条件。
比如对(4c):



被称为primal residual,终止时显然需要有
现在需要判断迭代结果尽可能接近(4a)、(4b)条件。
根据(2b):


因此, 处导数为0:




这说明在迭代的过程中(4b)始终成立。
同样,根据(2a), 处导数为0:




因此:


根据(7)可知,(4a)并不满足。
我们定义dual residual:
我们希望:


由此(6a)、(6b)是终止条件,保证当前迭代点尽可能接近最优性条件(4a)、(4b)、(4c)。
Extenstions

(2)、(3)是Standard ADMM的两种形式。基于Standard ADMM有非常多的扩展,这里就列举两个例子。
可变的惩罚参数(Varying Penalty Parameter)

之前讨论的惩罚系数 都是常数。论文中给了一个变化的惩罚参数:


一般性的增广项(General Argumenting Terms)

(2)的增广项为  ,现在可以用更一般的形式来代替:。其中P是自己设置的正定矩阵。当P=I是,就是。
Technique

ADMM算法迭代的时候也有很多小技巧。
非精确最小化(Inexact Minimization)

(2a)、(2b)计算最优解的时候,不用精确搜索,可以做一个非精确搜索,找一个次优解,这样会减少迭代次数。
热启动(Warm Start)

(2a)、(2b)迭代的时候,不用每次都从0点或者一个固定点开始迭代,每次迭代可以从上一次位置开始。

读书笔记小结

这篇笔记中讨论了ADMM算法的两种形式、最优性条件、终止准则。之后也补充了一些ADMM算法的扩展与技巧。
这些都是基于(1)这个问题的。(1)这个问题只有等式约束,如果遇到不等式约束怎么办,下一篇笔记会引入近端算子,来处理含不等式约束或者集合约束这一类问题。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
发表于 2022-1-31 16:13 | 显示全部楼层
韩德仁老师最近写了新的综述可以参考下,从DRS理解ADMM可以看18年开的一个会议,油管能搜到,汇报的都是这个领域活跃者[飙泪笑]
发表于 2022-1-31 16:18 | 显示全部楼层
嗯嗯,感谢提醒
懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )

GMT+8, 2024-11-16 19:33 , Processed in 0.093430 second(s), 26 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表