ADMM算法

2023-11-06

ADMM

对偶下降

m i n i m i z e f ( x ) s u b j e c t t o A x = b minimize\ \ f(x) \\ subject\ \ to \ \ Ax=b minimize f(x)subject to Ax=b

其中， x ∈ R n x\in R^n x∈Rn， A ∈ R m × n A\in R^{m×n} A∈Rm×n， f : R n → R f:R^n \to R f:Rn→R

该问题的拉格朗日式如下
L ( x , y ) = f ( x ) + y T ( A x − b ) L(x,y)=f(x)+y^T(Ax-b) L(x,y)=f(x)+yT(Ax−b)
对偶方程如下：
g ( y ) = * ⁡ i n f x L ( x , y ) = − * ⁡ s u p x ∈ d o m f ( − y T A x − f ( x ) ) − b T y = − f ∗ ( − A T y ) − b T y g(y)=\operatorname*{inf}_{x}L(x,y)=-\operatorname*{sup}_{x\in domf}(-y^TAx-f(x))-b^Ty=-f^*(-A^Ty)-b^Ty g(y)=*infxL(x,y)=−*supx∈domf(−yTAx−f(x))−bTy=−f∗(−ATy)−bTy
为什么这样做呢？
min ⁡ x L ( x , y ) = d ∗ ≤ p ∗ = min ⁡ x f ( x ) + I ( A x − b ) w h e r e    I ( u ) = { 0 u=0 ∞ u ≠ 0 \min_{x}L(x,y)=d^*\le p^*=\min_{x} f(x)+I(Ax-b) \\ where \ \ I(u)=\begin{cases} 0 & \text {u=0}\\[2ex] \infty & \text {u} \neq {0} \end{cases} xminL(x,y)=d∗≤p∗=xminf(x)+I(Ax−b)where  I(u)=⎩⎨⎧0∞u=0u̸=0
对偶问题最优化
m a x i m i z e    g ( y ) maximize \ \ g(y) maximize  g(y)
令 y ∗ = * ⁡ a r g m a x y    g ( y ) y*=\operatorname*{argmax}_{y}\ \ g(y) y∗=*argmaxy  g(y)， x ∗ = a r g m i n x    L ( x , y ∗ ) x*=argmin_x\ \ L(x,y*) x∗=argminx  L(x,y∗)

如果强对偶成立，则 d ∗ = p ∗ d*=p* d∗=p∗。 x ∗ x* x∗是原问题的最优解

对偶下降算法步骤如下：

x k + 1 : = a r g m i n x L ( x , y k ) y k + 1 : = y k + α k ( A x k + 1 − b ) x^{k+1}:=argmin_xL(x,y^k) \\ y^{k+1}:=y^k+\alpha^k(Ax^{k+1}-b) xk+1:=argminxL(x,yk)yk+1:=yk+αk(Axk+1−b)

先最小化 L ( x , y k ) L(x,y^k) L(x,yk)，后最大化 L ( x k + 1 , y ) L(x^{k+1},y) L(xk+1,y)

特点：

α k \alpha^k αk选择合适，且满足一定条件下， x k x^k xk， y k y^k yk收敛到最优点
然而，对许多例子不成立。比如 f ( x ) = B x f(x)=Bx f(x)=Bx，在更新 x x x时不存在最小值

对偶分解

在这里插入图片描述

每次迭代需要广播和集合两个步骤： x x x更新可以独立进行， y y y更新要集中进行

增广拉格朗日乘子法

L ρ ( x , y ) = f ( x ) + y T ( A x − b ) + ( ρ / 2 ) ∥ A x − b ∥ 2 2 L_\rho(x,y)=f(x)+y^T(Ax-b)+(\rho /2)\left\lVert Ax-b \right\rVert_2^2 Lρ(x,y)=f(x)+yT(Ax−b)+(ρ/2)∥Ax−b∥22

这等价于如下问题原拉格朗日：
m i n i m i z e f ( x ) + ( ρ / 2 ) ∥ A x − b ∥ 2 2 s u b j e c t t o A x = b minimize \ \ f(x)+(\rho /2)\left\lVert Ax-b \right\rVert_2^2 \\ subject\ to \ \ Ax=b minimize f(x)+(ρ/2)∥Ax−b∥22subject to Ax=b

算法步骤：

x k + 1 : = a r g m i n x L ρ ( x , y k ) y k + 1 : = y k + ρ ( A x k + 1 − b ) x^{k+1}:=argmin_x\ \ L_\rho(x,y^k) \\ y^{k+1}:=y^k+\rho(Ax^{k+1}-b) xk+1:=argminx Lρ(x,yk)yk+1:=yk+ρ(Axk+1−b)

为什么选择 ρ \rho ρ作为迭代步长？

最优条件必须满足
A x ∗ − b = 0 ∇ f ( x ∗ ) + A T y ∗ = 0 Ax^*-b=0 \\ \nabla f(x^*)+A^Ty^*=0 Ax∗−b=0∇f(x∗)+ATy∗=0
根据定义， x k + 1 x^{k+1} xk+1最小化 L ρ ( x , y k ) L_\rho(x,y^k) Lρ(x,yk)，因此
0 = ∇ x L ρ ( x k + 1 , y k ) = ∇ x f ( x k + 1 ) + A T ( y k + ρ ( A x k + 1 − b ) ) = ∇ x f ( x k + 1 ) + A T y k + 1 0 =\nabla_xL_\rho(x^{k+1},y^k)\\ =\nabla_xf(x^{k+1})+A^T(y^k+\rho(Ax^{k+1}-b))\\ = \nabla_xf(x^{k+1})+A^Ty^{k+1} 0=∇xLρ(xk+1,yk)=∇xf(xk+1)+AT(yk+ρ(Axk+1−b))=∇xf(xk+1)+ATyk+1
随着迭代的进行，只需要原条件的残差收敛到0，即可

评价：

大大增加了收敛性
不能进行分解

ADMM算法

m i n i m i z e f ( x ) + g ( z ) s u b j e c t t o A x + B z = c minimize \ \ f(x)+g(z) \\ subject\ to \ \ Ax+Bz=c minimize f(x)+g(z)subject to Ax+Bz=c

最优解表示如下：
p ∗ = i n f { f ( x ) + g ( z ) ∣ A x + B z = c } p^*=inf\{ f(x)+g(z)\ |\ Ax+Bz=c \} p∗=inf{f(x)+g(z) ∣ Ax+Bz=c}
增广拉格朗日：
L ρ ( x , y ) = f ( x ) + g ( z ) + y T ( A x + B z − c ) + ( ρ / 2 ) ∥ A x + B z − c ∥ 2 2 L_\rho(x,y)=f(x)+g(z)+y^T(Ax+Bz-c)+(\rho /2)\left\lVert Ax+Bz-c \right\rVert_2^2 Lρ(x,y)=f(x)+g(z)+yT(Ax+Bz−c)+(ρ/2)∥Ax+Bz−c∥22
算法步骤：
x k + 1 : = * ⁡ a r g m i n x L ρ ( x , z k , y k ) z k + 1 : = * ⁡ a r g m i n z L ρ ( x k + 1 , z , y k ) y k + 1 : = y k + ρ ( A x k + 1 + B z k + 1 − c ) x^{k+1}:=\operatorname*{argmin}_{x}L_\rho(x,z^k,y^k)\\ z^{k+1}:=\operatorname*{argmin}_{z}L_\rho(x^{k+1},z,y^k)\\ y^{k+1}:=y^k+\rho (Ax^{k+1}+Bz^{k+1}-c) xk+1:=*argminxLρ(x,zk,yk)zk+1:=*argminzLρ(xk+1,z,yk)yk+1:=yk+ρ(Axk+1+Bzk+1−c)

归一化形式：

令 r = A x + B z − c r=Ax+Bz-c r=Ax+Bz−c，则
y T r + ( ρ / 2 ) ∥ r ∥ 2 2 = ( ρ / 2 ) ∥ r + u ∥ 2 2 − ( ρ / 2 ) ∥ u ∥ 2 2 y^Tr+(\rho/2)\left\lVert r \right\rVert_2^2 = (\rho/2)\left\lVert r+u \right\rVert_2^2-(\rho/2)\left\lVert u \right\rVert_2^2 yTr+(ρ/2)∥r∥22=(ρ/2)∥r+u∥22−(ρ/2)∥u∥22
其中， u = ( 1 / ρ ) y u=(1/\rho)y u=(1/ρ)y是归一化对偶变量

归一化算法步骤如下：
x k + 1 = * ⁡ a r g m i n x ( f ( x ) + ( ρ / 2 ) ∥ A x + B z k − c + u k ∥ 2 2 ) z k + 1 = * ⁡ a r g m i n z ( g ( z ) + ( ρ / 2 ) ∥ A x k + 1 + B z − c + u k ∥ 2 2 ) u k + 1 = u k + A x k + 1 + B z k + 1 − c x^{k+1}=\operatorname*{argmin}_{x}(f(x)+(\rho/2)\left\lVert Ax+Bz^k-c+u^k \right\rVert_2^2)\\ z^{k+1}=\operatorname*{argmin}_{z}(g(z)+(\rho/2)\left\lVert Ax^{k+1}+Bz-c+u^k \right\rVert_2^2)\\ u^{k+1}=u^k+Ax^{k+1}+Bz^{k+1}-c xk+1=*argminx(f(x)+(ρ/2)∥∥Ax+Bzk−c+uk∥∥22)zk+1=*argminz(g(z)+(ρ/2)∥∥Axk+1+Bz−c+uk∥∥22)uk+1=uk+Axk+1+Bzk+1−c
可见，
u k = u 0 + ∑ j = i k r j r k = A x k + B z k − c u^k=u^0+\sum_{j=i}^{k}r^j \\ r^k = Ax^k+Bz^k-c uk=u0+j=i∑krjrk=Axk+Bzk−c

收敛性

假设1： e p i f = { ( x , t ) ∈ R n × R ∣ f ( x ) ≤ t } epi \ f=\{(x,t)\in R^n×R \ |\ f(x)\le t \} epi f={(x,t)∈Rn×R ∣ f(x)≤t}是闭的且非空的凸集
假设2：存在 ( x ∗ , z ∗ , y ∗ ) (x^*,z^*,y^*) (x∗,z∗,y∗)使得下式成立

L 0 ( x ∗ , z ∗ , y ) ≤ L 0 ( x ∗ , z ∗ , y ∗ ) ≤ L 0 ( x , z , y ∗ ) L_0(x^*,z^*,y)\le L_0(x^*,z^*,y^*) \le L_0(x,z,y^*) L0(x∗,z∗,y)≤L0(x∗,z∗,y∗)≤L0(x,z,y∗)

满足上述条件下，有

残差收敛： r k → 0 a s k → ∞ r^k \to 0 \ as \ k \to ∞ rk→0 as k→∞
目标函数收敛： f ( x k ) + g ( z k ) → p ∗ a s k → ∞ f(x^k)+g(z^k) \to p^* \ as \ k \to ∞ f(xk)+g(zk)→p∗ as k→∞。其中， p ∗ p^* p∗是最优值
对偶变量收敛： y k → y ∗ a s k → ∞ y^k \to y^* \ as \ k \to ∞ yk→y∗ as k→∞。其中， y ∗ y^* y∗是对偶最优点

注意， x k , y k x^k,y^k xk,yk不一定收敛到最优值，仅在上述条件满足下。

最优条件

原问题的可行性

A x ∗ + B z ∗ − c = 0 Ax^*+Bz^*-c=0 Ax∗+Bz∗−c=0

对偶可行性

0 = ∇ f ( x ∗ ) + A T y ∗ 0=\nabla f(x^*)+A^Ty^* \\ 0=∇f(x∗)+ATy∗

0 = ∇ g ( z ∗ ) + B T y ∗ 0=\nabla g(z^*)+B^Ty^* 0=∇g(z∗)+BTy∗

因为 z k + 1 z^{k+1} zk+1最小化 L ρ ( x k + 1 , z , y k ) L_\rho (x^{k+1},z,y^k) Lρ(xk+1,z,yk)，所以有
0 = ∇ g ( z k + 1 ) + B T y k + ρ B T ( A x k + 1 + B z k + 1 − c ) = ∇ g ( z k + 1 + + B T y k + ρ B T r k + 1 ) = ∇ g ( z k + 1 ) + B T y k + 1 0 =\nabla g(z^{k+1})+B^Ty^k+\rho B^T(Ax^{k+1}+Bz^{k+1}-c) \\ =\nabla g(z^{k+1}++B^Ty^k+\rho B^Tr^{k+1}) \\ = \nabla g(z^{k+1})+B^Ty^{k+1} 0=∇g(zk+1)+BTyk+ρBT(Axk+1+Bzk+1−c)=∇g(zk+1++BTyk+ρBTrk+1)=∇g(zk+1)+BTyk+1
所以，式(25)总是成立的。

因为 x k + 1 x^{k+1} xk+1最小化 L ρ ( x , z k , y k ) L_\rho (x,z^k,y^k) Lρ(x,zk,yk)，所以有
0 = ∇ f ( x k + 1 ) + A T y k + ρ A T ( A x k + 1 + B z k − c ) = ∇ f ( x k + 1 + + A T ( y k + ρ r k + 1 + ρ B ( z k − z k + 1 ) ) ) = ∇ f ( x k + 1 ) + A T y k + 1 + ρ A T B ( z k − z k + 1 ) 0 =\nabla f(x^{k+1})+A^Ty^k+\rho A^T(Ax^{k+1}+Bz^{k}-c) \\ =\nabla f(x^{k+1}++A^T(y^k+\rho r^{k+1}+\rho B(z^k-z^{k+1}))) \\ = \nabla f(x^{k+1})+A^T y^{k+1}+\rho A^TB(z^k-z^{k+1}) 0=∇f(xk+1)+ATyk+ρAT(Axk+1+Bzk−c)=∇f(xk+1++AT(yk+ρrk+1+ρB(zk−zk+1)))=∇f(xk+1)+ATyk+1+ρATB(zk−zk+1)
因此， s k + 1 = ρ A T B ( z k + 1 − z k ) s^{k+1}=\rho A^TB(z^{k+1}-z^k) sk+1=ρATB(zk+1−zk)可以看做式(24)的残差

停止条件

收敛条件得出：
f ( x k ) + g ( z k ) − p ∗ ≤ − ( y k ) T r k + ( x k − x ∗ ) T s k f(x^k)+g(z^k)-p^*\le -(y^k)^Tr^k+(x^k-x^*)^Ts^k f(xk)+g(zk)−p∗≤−(yk)Trk+(xk−x∗)Tsk
假设 ∣ ∣ x k − x ∗ ∣ ∣ ≤ d ||x^k-x^*||\le d ∣∣xk−x∗∣∣≤d，则
f ( x k ) + g ( z k ) − p ∗ ≤ − ( y k ) T r k + d ∣ ∣ s k ∣ ∣ 2 ≤ ∣ ∣ y k ∣ ∣ 2 ∣ ∣ r k ∣ ∣ 2 + d ∣ ∣ s k ∣ ∣ 2 f(x^k)+g(z^k)-p^*\le -(y^k)^Tr^k+d||s^k||_2 \le ||y^k||_2||r^k||_2+d||s^k||_2 f(xk)+g(zk)−p∗≤−(yk)Trk+d∣∣sk∣∣2≤∣∣yk∣∣2∣∣rk∣∣2+d∣∣sk∣∣2
因此，终止条件设为：
∣ ∣ r k ∣ ∣ 2 ≤ ϵ p r i a n d ∣ ∣ s k ∣ ∣ 2 ≤ ϵ d u a l ||r^k||_2\le \epsilon^{pri} \ \ and \ \ ||s^k||_2\le \epsilon^{dual} ∣∣rk∣∣2≤ϵpri and ∣∣sk∣∣2≤ϵdual
其中，
ϵ p r i = p ϵ a b s + ϵ r e l m a x { ∣ ∣ A x k ∣ ∣ 2 , ∣ ∣ B z k ∣ ∣ 2 , ∣ ∣ c ∣ ∣ 2 } ϵ d u a l = n ϵ a b s + ϵ r e l ∣ ∣ A T y k ∣ ∣ 2 \epsilon^{pri} = \sqrt{p}\epsilon^{abs}+\epsilon^{rel}max\{ ||Ax^k||_2,||Bz^k||_2 ,||c||_2\} \\ \epsilon^{dual} = \sqrt{n}\epsilon^{abs}+\epsilon^{rel}||A^Ty^k||_2 ϵpri=p ϵabs+ϵrelmax{∣∣Axk∣∣2,∣∣Bzk∣∣2,∣∣c∣∣2}ϵdual=n ϵabs+ϵrel∣∣ATyk∣∣2
其中， p , n p,n p,n是各自向量的维度

ADMM变种

变化的惩罚参数

ρ k + 1 : = { τ i n c r ρ k , if ∣ ∣ r k ∣ ∣ 2 > μ ∣ ∣ s k ∣ ∣ 2 ρ k / τ d e c r , if ∣ ∣ s k ∣ ∣ 2 > μ ∣ ∣ r k ∣ ∣ 2 ρ k , o t h e r w i s e \rho^{k+1}:=\begin{cases} \tau^{incr}\rho^k, & \text{if} ||r^k||_2>\mu ||s^k||_2 \\ \rho^k/\tau^{decr}, & \text{if} ||s^k||_2>\mu ||r^k||_2 \\ \rho^k, &otherwise \end{cases} ρk+1:=⎩⎪⎨⎪⎧τincrρk,ρk/τdecr,ρk,if∣∣rk∣∣2>μ∣∣sk∣∣2if∣∣sk∣∣2>μ∣∣rk∣∣2otherwise

其中，一般 μ = 10 > 1 , τ i n c r = 2 > 1 , τ d e c r = 2 > 1 \mu=10>1,\tau^{incr}=2>1,\tau^{decr}=2>1 μ=10>1,τincr=2>1,τdecr=2>1

直观地， ρ \rho ρ变大，会使得 r k r^k rk变小

广义增广

( ρ / 2 ) ∣ ∣ r ∣ ∣ 2 2 → ( 1 / 2 ) r T P r (\rho/2)||r||_2^2 \to (1/2)r^TPr (ρ/2)∣∣r∣∣22→(1/2)rTPr

其中，P是正定的。这可以看做一个新的标准ADMM。不过， r = 0 → F r = 0 r=0 \to Fr=0 r=0→Fr=0。其中， F T F = P F^TF=P FTF=P

超松弛

在更新z和y时，
A x k + 1 → α k A x k + 1 − ( 1 − α k ) ( B z k − c ) Ax^{k+1} \to \alpha^kAx^{k+1}-(1-\alpha^k)(Bz^k-c) Axk+1→αkAxk+1−(1−αk)(Bzk−c)
一般，选择超松弛参数 α k ∈ [ 1.5 , 1.8 ] \alpha^k \in [1.5,1.8] αk∈[1.5,1.8]

常见形式

下面只考虑 x x x更新步骤，其他类似
x + = a r g m i n x ( f ( x ) + ρ / 2 ∣ ∣ A x − v ∣ ∣ 2 2 ) w h e r e v = − B z + c − u x^+=argmin_x(f(x)+\rho/2||Ax-v||_2^2)\\ where \ \ v=-Bz+c-u x+=argminx(f(x)+ρ/2∣∣Ax−v∣∣22)where v=−Bz+c−u

二次目标函数

f ( x ) = ( 1 / 2 ) x T P x + q T x + r f(x)=(1/2)x^TPx+q^Tx+r f(x)=(1/2)xTPx+qTx+r

则
x + = ( P + ρ A T A ) − 1 ( ρ A T v − q ) x^+=(P+\rho A^TA)^{-1}(\rho A^Tv-q) x+=(P+ρATA)−1(ρATv−q)
式(43)可以利用稀疏性、保存重复的分解等来加快速度

元素软阈值

当 f ( x ) = λ ∣ ∣ x ∣ ∣ 1 ， A = I f(x)=\lambda ||x||_1，A=I f(x)=λ∣∣x∣∣1，A=I时。对于每个标量 x i x_i xi的更新为
x i + : = a r g m i n x i ( λ ∣ x i ∣ + ( ρ / 2 ) ( x i − v i ) 2 ) x_i^+:=argmin_{x_i}(\lambda|x_i|+(\rho/2)(x_i-v_i)^2) xi+:=argminxi(λ∣xi∣+(ρ/2)(xi−vi)2)
尽管， f ( x ) f(x) f(x)不可导。但是存在简单的解析解：
x i + : = S λ / ρ ( v i ) x_i^+:=S_{\lambda/\rho}(v_i) xi+:=Sλ/ρ(vi)
软阈值操作符 S S S：
S k ( a ) = { a − k a > k 0 ∣ a ∣ ≤ k a + k a < − k S_k(a)=\begin{cases} a-k & a>k\\ 0 & |a|\le k \\ a+k & a<-k \end{cases} Sk(a)=⎩⎪⎨⎪⎧a−k0a+ka>k∣a∣≤ka<−k
或者表示为
S k ( a ) = ( a − k ) + − ( − a − k ) + S_k(a)=(a-k)_+-(-a-k)_+ Sk(a)=(a−k)+−(−a−k)+
这也是shrinkage operator，如下
S k ( a ) = ( 1 − k / ∣ a ∣ ) + a , f o r a ≠ 0 S_k(a)=(1-k/|a|)_+a,\ \ for \ \ a \ne 0 Sk(a)=(1−k/∣a∣)+a, for a̸=0

一阶范数问题

最小化 ∣ ∣ A x − b ∣ ∣ 1 ||Ax-b||_1 ∣∣Ax−b∣∣1，转化为ADMM形式
m i n i m i z e ∣ ∣ z ∣ ∣ 1 s u b j e c t t o A x − z = b minimize \ \ ||z||_1 \\ subject\ \ to \ \ Ax-z=b minimize ∣∣z∣∣1subject to Ax−z=b
上面式子中， f = 0 , g = ∣ ∣ ∗ ∣ ∣ 1 f=0,g=||*||_1 f=0,g=∣∣∗∣∣1。假设 A T A A^TA ATA可逆，则ADMM算法步骤如下：
x k + 1 = ( A T A ) − 1 A T ( b + z k − u k ) z k + 1 = S 1 / ρ ( A x k + 1 − b + u k ) u k + 1 = u k + A x k + 1 − z k + 1 − b x^{k+1} = (A^TA)^{-1}A^T(b+z^k-u^k) \\ z^{k+1} = S_{1/\rho}(Ax^{k+1}-b+u^k) \\ u^{k+1} = u^k+Ax^{k+1}-z^{k+1}-b xk+1=(ATA)−1AT(b+zk−uk)zk+1=S1/ρ(Axk+1−b+uk)uk+1=uk+Axk+1−zk+1−b

`openMVG`代码

`eigen`线性代数

template <typename Linear_SolverT>
inline void Compute
(
  const Eigen::SparseMatrix<double>& spd_mat,
  Linear_SolverT * linear_solver
)
{
  linear_solver->compute(spd_mat);
}

template <typename Linear_SolverT>
inline void Compute
(
  const Eigen::MatrixXd& spd_mat,
  Linear_SolverT * linear_solver
)
{
  linear_solver->compute(spd_mat.sparseView());
}

迭代参数

struct Options {
    int max_num_iterations = 1000;
    // Rho is the augmented Lagrangian parameter.
    double rho = 1.0;
    // Alpha is the over-relaxation parameter (typically between 1.0 and 1.8).
    double alpha = 1.0;

    double absolute_tolerance = 1e-4;
    double relative_tolerance = 1e-2;
};

私有成员

  Options options_;

  // Matrix A where || Ax - b ||_1 is the problem we are solving.
  MatrixType a_;

  // Cholesky linear solver.
#ifdef EIGEN_MPL2_ONLY
  using Linear_Solver_T = Eigen::SparseLU<Eigen::SparseMatrix<double>>;
#else
  // Since our linear system will be a SPD matrix we can
  // utilize the Cholesky factorization.
  using Linear_Solver_T = Eigen::SimplicialLLT<Eigen::SparseMatrix<double>>;
#endif
  Linear_Solver_T linear_solver_;

  Eigen::VectorXd Shrinkage
  (
    const Eigen::VectorXd& vec, const double kappa
  ) const
  {
    Eigen::ArrayXd zero_vec(vec.size());
    zero_vec.setZero();
    return zero_vec.max( vec.array() - kappa) -
           zero_vec.max(-vec.array() - kappa);
  }

初始化

  L1Solver
  (
    const Options& options,
    const MatrixType& mat
  )
  : options_(options), a_(mat)
  {
    // Analyze the sparsity pattern once. Only the values of the entries will be
    // changed with each iteration.
    const MatrixType spd_mat = a_.transpose() * a_;
    l1_solver_internal::Compute(spd_mat, &linear_solver_);
  }

核心

  bool Solve
  (
    const Eigen::VectorXd& rhs,  // b = rhs
    Eigen::VectorXd* solution
  )
  {
    // Since constructor was called before we check Compute status
    if (linear_solver_.info() != Eigen::Success)
    {
      std::cerr << "Cannot compute the matrix factorization" << std::endl;
      return false;
    }

    Eigen::VectorXd& x = *solution;
    Eigen::VectorXd z(a_.rows()), u(a_.rows());
    z.setZero();
    u.setZero();

    Eigen::VectorXd a_times_x(a_.rows()), z_old(z.size()), ax_hat(a_.rows());
    // Precompute some convergence terms.
    const double rhs_norm = rhs.norm();
    const double primal_abs_tolerance_eps =
      std::sqrt(a_.rows()) * options_.absolute_tolerance;
    const double dual_abs_tolerance_eps =
      std::sqrt(a_.cols()) * options_.absolute_tolerance;

    for (int i = 0; i < options_.max_num_iterations; ++i)
    {
      // Update x.
      x.noalias() = linear_solver_.solve(a_.transpose() * (rhs + z - u));
      a_times_x.noalias() = a_ * x;
      ax_hat.noalias() = options_.alpha * a_times_x;
      ax_hat.noalias() += (1.0 - options_.alpha) * (z + rhs);

      // Update z and set z_old.
      std::swap(z, z_old);
      z.noalias() = Shrinkage(ax_hat - rhs + u, 1.0 / options_.rho);

      // Update u.
      u.noalias() += ax_hat - z - rhs;

      // Compute the convergence terms.
      const double r_norm = (a_times_x - z - rhs).norm();
      const double s_norm =
        (-options_.rho * a_.transpose() * (z - z_old)).norm();
      const double max_norm =
        std::max({a_times_x.norm(), z.norm(), rhs_norm});
      const double primal_eps =
        primal_abs_tolerance_eps + options_.relative_tolerance * max_norm;
      const double dual_eps =
        dual_abs_tolerance_eps +
        options_.relative_tolerance *
          (options_.rho * a_.transpose() * u).norm();

      // Log the result to the screen.
      // std::ostringstream os;
      // os << "Iteration: " << i << "\n"
      //   << "R norm: " << r_norm << "\n"
      //   << "S norm: " << s_norm << "\n"
      //   << "Primal eps: " << primal_eps << "\n"
      //   << "Dual eps: " << dual_eps << std::endl;
      // std::cout << os.str() << std::endl;

      // Determine if the minimizer has converged.
      if (r_norm < primal_eps && s_norm < dual_eps)
      {
        return true;
      }
    }
    return false;
    }

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

OpenMVG

ADMM算法的相关文章

PyTorch-07 卷积神经网络（什么是卷积、卷积神经网络、池化层、Batch normalization、经典卷积网络、深度残差网络 ResNet、nn.Module、数据增强）

PyTorch 07 卷积神经网络什么是卷积卷积神经网络池化层 Batch normalization 经典卷积网络 LeNet 5 AlexNet VGG GoogLeNet 深度残差网络 ResNet nn Module 使用nn
Python No module named ‘mlxtend‘ 解决方法

做了以下尝试 pip install mlxtend安装失败 conda install mlxtend安装失败 anaconda里搜索找不到最终解决办法在anaconda prompt界面输入conda install c conda
2023年计划

2022年技师职业资格国家以年限不够为由拒绝录入十分生气痛定思痛一步步来 1 申报初级职称 2 因2022年疫情全年取消考试现疫情政策已放开上半年考高项 2 2023年领证 4 下半年学习英语在职 5 学习代码完全学会spr
【Vue3】学习笔记-响应式ref

Vue3 学习笔记响应式ref vite创建Vue3项目 Vue3 声明全局变量响应式ref 总结 vite创建Vue3项目 npm 7 用以下指令 npm init vite latest my vue app template vu
FAT16 FAT32 文件系统

FAT 英文为File Allocation Table 文档分配表先要记住几个概念扇区一般扇区为512个字节簇由若干个扇区组成而FAT文件系统其他文件系统应该相似就是专门管理这些簇的一个文件可能占据一个或者多个簇按正确
计算机图形学【GAMES-101】3、着色计算(深度缓存、着色模型、着色频率)

快速跳转 1 矩阵变换原理Transform 旋转位移缩放正交投影透视投影 2 光栅化反走样傅里叶变换卷积 3 着色计算深度缓存着色模型着色频率 4 纹理映射重心坐标插值透视投影矫正双线性插值MipMap 环境光遮
一篇文章搞懂最容易入的坑之一：java语言中equals和==的区别，同时也搞清栈和堆，基本数据类型和引用数据类型等基本概念的区别

经常我们在比较字符串是否相等时会使用或equals方法但往往却得不到自己想要的结果纠其原因是需要搞清这两者比较到底是什么要搞清这个问题首先我们要理解一个问题就是我们的对象是如何在内存空间中存放的栈内存和堆内存在JVM中
模式分类与“组件协作模式”

1 GOF 23 模式分类从目的来看创建型 Creational 模式将对象的部分创建工作延迟到子类或者其他对象从而应对需求变化为对象创建时具体类型实现引来的冲击结构型 Structural 模式通过类继承或者对象组合获得更灵活
java——内部类和异常处理

文章目录内部类成员内部类局部内部类匿名内部类静态内部类异常处理异常捕获与处理多重异常捕获和处理抛出异常内部类 Java内部类 Inner Class 是嵌套在其他类中的类它可以访问外部类的成员变量和方法同时也可以被外
Java 将两个有序数组合成为一个有序数组

基本思路 1 如果其中一个数组的元素均大于另一个数组的元素则可以直接组合不用拆分即其中一个数组的第一个元素大于或者小于另一个数组的最后一个元素 2 若不满足1中的情况则表明数组需要拆分拆分的方法如下 1 拆分前默认两个数组以及
matlab内置随机数生成器及随机模拟举例

一 matlab内置的密度函数于随机数生成器离散均匀分布离散均匀分布用于描述等概率发生事件的状况仅限于有限的事件数 matlab提供 1 2 N 上的均匀分布的概率密度函数黑累计分布函数其相应的命令为 unidpdf X N 给出X
Waiting for table metadata lock究极解决办法（绝对管用）

简单描述一下遇到的问题根据项目数据入库要求在之前没有设置唯一约束的表上添加唯一约束这就涉及到需要修改表结构在对其他表进行修改的时候无论是修改字段长度还是删除索引添加唯一约束都没有问题但是唯独有一张表无论进行什么表操作全部都会出
响应式函数编程

http blog csdn net lzyzsd article details 41833541 comments
如何判断dpr的倍数

1 js中有window devicePixelRatio可直接查看倍率 2 用css技术判断dpr的倍数响应式设计媒介查询通过设置断点来实现响应 max device pixel ratio 最大设备dpr max resoluti
react的ref三种使用方式，获取元素内容

react的ref三种使用方式获取元素内容注意应尽可能少的使用ref 优先使用state 1 字符串 refGetData1 gt alert 获取到的内容 this refs div1 innerText div 点我是ref字符串
运放的虚短与虚断

虚断理想情况下运放的同向反向输入端等效电阻无穷大而实际情况下输入电阻Ri也达到兆欧 M 级别例如OP07 7 31M 因此输入端电流很小微安级别 uA 可以将同相输入端与反相输入端的电流近似为0 输入阻抗无穷大电流近似为零
QT 使用qcustomplot 图库总结

qcutomplot是一个写好的图标库下面讲几点注意事项使用步骤一导入qcustomplot h cpp文件后要在 pro 文件中加入 QT printsupport 使用步骤二添加一个widget 打开ui 在widget右键点

随机推荐

java 延迟执行代码（定时作用）

延时执行间隔某段时间之后再去执行某段代码实现这种结果有两种方式 1 使用Sleep方法就是去新建一个线程然后里边放一个Thread sleep 方法这也是比较通俗的做法 new Thread public void run tr
手把手教你配置CUDA, cuDNN-十分钟配置本地CUDA, cuDNN

前文书说到类似tensorflow和pytorch这种框架有一个很大的优点就是提供了对GPU的支持那么如果我们的电脑上正好有一块十分强劲的显卡就请跟着下面的教程配置本地的CUDA cuDNN环境这样就可以让我们使用GPU版本的te
NFS高可用方案：NFS+keepalived+Sersync

1 背景因为某系统需要部署生产但是云平台的nas存储资源不足需要重新采购采购周期较长需要有一个临时的解决方案这样时候就需要采用nfs服务来提供网络存储服务了在部署nfs服务的时候需要考虑生产环境需要有一定的高可用性经过考虑之后
el-date-picker组件设定指定时间起一个月的限制（PS：日常笔记）
eclipse运行项目时用内置浏览器能打开项目，但是在外置浏览器输入地址无法访问

解决方案 window gt perferences gt General gt Web Browser gt use external web browser
【管理篇 / 配置】❀ 02. 常用设置 ❀ FortiGate 防火墙

简介这个实验提供FortiGate飞塔防火墙命令及图形管理入门此外这个实验将指导你怎样正确的备份和恢复一个配置文件建立一个新的管理员帐号和改变管理员访问权限工作在命令行界面你可以使用命令行界面 CLI 访问一台FortiGate
评分卡建模工具scorecardpy全解读

说到评分卡建模工具做过评分卡的应该都能想到谢博士的scorecardpy和专为工业界模型开发设计的Python工具包 Toad 两者相比 scorecardpy更加轻量级且依赖较少可以满足大多数场景下的评分卡构建为了使评分卡建模流程
MarkDown编辑器字体颜色设置

文章目录一颜色二大小三字体四背景色五文章转载 CSDN的markdown编辑器是其衍生版本扩展了Markdown的功能如表格脚注内嵌HTML等等就是内嵌HTML 接下来要讲的功能就需要使用内嵌HTML的方法来实
2019你会被裁员吗？

2018年我的经历整个互联网行业都在裁员1 3 我也是亲历者我想弄清楚为什么所谓的行业凛冬具体是什么是真的来了或是老板们在忽悠我们找到原因我希望反思 2019年可以不会被裁员现在我有了答案和你分享烧脑准备哈开始
centos7 磁盘刷新容量

1 添加一块新的硬盘sdb 40G lsblk mkdir test mkfs ext4 dev sdb blkid grep sdb echo blkid grep sdb gt gt etc fstab vim etc fstab UU
Qt 样式表、绘图事件设置渐变色

先放效果图这里的窗体颜色字体 pushbutton背景都是渐变色渐变色的颜色可以在链接获取对应网址 https webgradients com 现在来说具体操作步骤关于这个窗体的背景颜色这里是直接重写了绘图事件注意这里的
Spring、Springboot入门之事务处理

1 什么是事物通俗讲事物就是一组原子操作单元组内的操作要么全部执行成功要么全部失败事务有四个特性 ACID 1 原子性 Atomicity 事务是一个原子操作由一系列动作组成事务的原子性确保动作要么全部完成要么完全不起作用 2
echarts中横坐标显示为time，使用手册

需求后端传递两段数据不同时间间隔的24h实时数据前端需要根据24小时时间展示要求 x轴为0 24h 每个两小时一个刻度误区刚开始通过二维数据的形式秒点 data x y x y 因为是两组数据的横纵坐标不一样所有没法固定x
Microsoft Dynamics CRM 2013升级2015（二）正式安装升级 2015及 Reporting Extensions安装

Microsoft Dynamics CRM 2015 系统要求和所需技术 Microsoft Dynamics CRM 本地版本需要以下软件 Microsoft Windows Server Microsoft Windows Serv
多路复用IO与NIO

最近在学习NIO相关知识发现需要掌握的知识点非常多当做笔记记录就下在学NIO之前得先去了解IO模型 1 同步阻塞IO Blocking IO 即传统的IO模型 2 同步非阻塞IO Non blocking IO 默认创建的socket
QT播放窗口随鼠标拖拽实时移动位置+坐标点的获取方式

QT播放窗口随鼠标拖拽实时移动位置坐标点的获取方式 QT坐标获取方式使用相对坐标获取当前item 视频窗口的拖拽移动窗口相对坐标示意代码使用 QT坐标获取方式相对位置每个Qwidget都能通过pos 获取到相对自己父类窗口的位置
解决IDEA运行Flink报错java.lang.NoClassDefFoundError: org/apache/flink/api/common/ExecutionConfig....

解决方法将provided改为compile 比如
pytorch出现RuntimeError: cublas runtime error :cu:259问题，及解决方法

在跑程序时出现下面的错误 RuntimeError cublas runtime error the GPU program failed to execute at C w 1 s tmp conda 3 6 041836 conda
Android SDK Manager下载包失败问题解决方案

Android SDK Manager下载失败的主要原因是Google资源被国内禁止访问了所以才会出现很多开源资源无法访问的情况但是国家在禁止Google的同时就已经为我们做开发的人员想好了解决方法所以出现了一些镜像代理可以访问 ht
ADMM算法

ADMM 对偶下降 m i n i m i z e

ADMM算法

ADMM

对偶下降

对偶下降算法步骤如下：

特点：

对偶分解

增广拉格朗日乘子法

算法步骤：

ADMM算法

归一化形式：

收敛性

最优条件

停止条件

ADMM变种

变化的惩罚参数

广义增广

超松弛

常见形式

二次目标函数

元素软阈值

一阶范数问题

openMVG代码

eigen线性代数

迭代参数

私有成员

初始化

核心

ADMM算法 的相关文章

随机推荐

热门标签

`openMVG`代码

`eigen`线性代数

ADMM算法的相关文章