CO C1 Complexity bounds for global optimization

N-dimensional Box Constraint Problem

考虑没有泛函约束的有约束最小化问题:

minxBnf(x)\min_{x\in \mathbb{B}_n} f(x)

其中Bn\mathbb{B}_n是一个Rn\mathbb{R}^n上的 nn 维盒子:

Bn={xRn0x(i)1,i=1n}\mathbb{B}_n = \{x \in\mathbb{R}^n| 0\le x^{(i)}\le1, i=1\cdots n\}

  • lpl_p范数:

  • Lipschitz 连续:函数 f(x)f(x)Bn\mathbb B_n 上是 Lipschitz 连续的,若

    x,yBn,f(x)f(y)Lxy\forall x,y \in \mathbb B_n,|f(x)-f(y)| \le L||x-y||_{\infty}

    LL 是某个 Lipschitz constant。

Uniform Grid Method

现介绍方法 G(pG(p) :

  • 构造 (p+1)n(p+1)^n 个点,形成形如网格的结构:

    x(i1,,in)=(i1p,,inp)x_{(i_1,\cdots,i_n)} = (\frac{i_1}{p},\cdots,\frac{i_n}{p})^\top

    其中 (i1,,in){0,,p}(i_1,\cdots,i_n) \in \{0,\cdots,p\}

  • 在以上所有点中找到具有最小目标函数值的点,记为 x\overline x

  • 返回 (x,f(x))(\overline x,f(\overline x))

总结即:均匀网格法在盒子内构建了一个由测试点构成的均匀网格,在这个网格上计算目标函数的最小值,并返回这个最小值,作为问题 的逼近解。

Thm. 令$f^∗ $是问题的全局最优值。那么

f(xˉ)fL2pf( \bar x)− f^∗ ≤ \frac{L}{2p}

Pf. 假设 xx_* 是问题的全局最小点。若对于 x,yRn,xyiffi=1n,x(i)y(i)x,y \in \mathbb R^n, x \le y \mathrm{iff} \forall i = 1\cdots n, x^{(i)} \le y^{(i)},则存在一个坐标 (i1,,in)(i_1,\cdots,i_n) 满足

xx(i1,,in)xx(i1+1,,in+1)yx \equiv x_{(i_1,\cdots,i_n)} \le x_* \le x_{(i_1 + 1,\cdots,i_n + 1)}\equiv y

注意到:y(i)x(i)=1py^{(i)} - x^{(i)} = \frac{1}{p}x(i)[x(i),y(i)]x_*^{(i)} \in [x^{(i)},y^{(i)}],记 x^=x+y2\hat x = \frac{x + y}{2},则根据 ll_{\infty} 范数的定义可构造一点:

x~={y(i),ifx(i)x^(i)x(i),otherwise\tilde x = \begin{cases} y^{(i)}, \mathrm{if} x^{(i)}_* \ge \hat x^{(i)}\\ x^{(i)}, \mathrm{otherwise} \end{cases}

i=1n,x~(i)x(i)12pi=1\cdots n, |\tilde x^{(i)} - x_*^{(i)}|\le \frac{1}{2p},且该点是一个网格点。综上即

f(x^)f(x)f(x~)f(x)Lx~xL2pf(\hat x)− f(x_∗) ≤ f( \tilde x)− f(x_∗) ≤L∥ \tilde x−x_∗∥_∞ ≤ \frac{L}{2p}

考虑优化的误差 ϵ\epsilon,有 L2pϵ\frac{L}{2p} \le \epsilon,即 pL2ϵp \ge \frac{L}{2\epsilon}。那么对每个维度,有p+1=L2ϵ+2p + 1 = ⌊\frac{L}{2\epsilon}⌋ + 2 个格点取值,共构造了 (p+1)n(p+1)^n 个格点。即解析复杂度至多为

A(G)=(L2ϵ+2)nA(G) = (⌊\frac{L}{2\epsilon}⌋ + 2)^n

Lower Complexity Bound

  • 基于黑盒 (black box) 概念

  • works 所有合理的迭代方案下: lower estimate

  • resisting oracle

    resisting oracle 对于每个特定的方法 (for example, G§) 试图创建一个最坏 worst 问题。

    • 最坏的方式回答该方法的每一个调用
    • 同时每个回答与 前述回答 + 问题的描述 相容 compatible

    它重构 reconstruct 了一个问题:完全符合算法最后累积的信息集合。若我们对该问题执行该方法,将从 oracle 得到相同的回答序列,因而它将重现同样的测试点序列。

重新考虑 N-dimensional Box Constraint Problem, 考虑零阶局部黑盒抵抗 oracle的工作:

定义问题类 \scr C:

  • 模型: minxBnf(x)\min_{x∈\mathbb B_n} f(x),$ f(x)$ 在 Bn\mathbb B_n 上是 Lipschitzℓ_∞-Lipschitz 连续的。
  • Oracle: 零阶局部黑盒。
  • 逼近解: 寻找xˉBn:f(xˉ)fϵ\bar x ∈ \mathbb B_n : f( \bar x)− f^∗ ≤ ϵ

Thm .对于零阶方法,要取得 ϵϵ 精度,则 \scr C解析复杂度至少为 (L2ϵ)n(\lfloor \frac{L}{2ϵ}\rfloor)^n

: 这里 ϵ<12L\epsilon < \frac{1}{2}L。且测试点不是按照前述的均分格点选取的。

Pf. 方便起见记 p=L2ϵ(1)p = ⌊ \frac{L}{ 2ϵ} ⌋(≥ 1)。 假定对于求解来自问题类 \scr l 的任意问题,存在一个方法需要 N<pnN< p^noracle 调用。

设计以下的 抵抗策略 应用:在任何测试点 xxoracle返回 f(x)=0f(x) = 0。即此方法只能寻找到xˉRn,f(xˉ)=0\bar x \in \mathbb R^n, f(\bar x) = 0

由于测试点的数量 N<pnN< p^n,故必然存在 (Rmk.2)$\hat x ∈\mathbb B_n:\hat x + \frac{1}{p}e ∈\mathbb B_n, e = (1, . . . ,1)^⊤ ∈\mathbb R^n $使得一个区间 B={xx^xx^+1pe}\mathbb B= \{x| \hat x ≤ x ≤ \hat x+ \frac{1}{p} e\}中不含有任何测试点。

作偏移 x=x^+12pex_* = \hat x + \frac{1}{2p}e。则 x^=x12pe,B\hat x = x_* - \frac{1}{2p}e, \mathbb B 可写作

{xx12pexx+12pe}{x xx<12p}\{x | x_* - \frac{1}{2p}e \le x \le x_* + \frac{1}{2p}e\} \equiv \{x|\ ||x - x_*||_{\infty} < \frac{1}{2p}\}

考虑 Lipschitzℓ_∞-Lipschitz 连续的性质,设计函数

fˉ(x)=min{0,Lxxϵ}\bar f(x) = \min\{0,L||x - x_*||_{\infty} - \epsilon \}

显然这是一个取非正值的函数,且只有在 Lxxϵ<0L||x - x_*||_{\infty} - \epsilon < 0xx<ϵL||x - x_*||_{\infty} < \frac{\epsilon}{L} 时函数取值非零。将该区间记为 B\mathbb B'

p=L2ϵ(1)p = ⌊ \frac{L}{ 2ϵ} ⌋(≥ 1),则 12(p+1)<ϵL12p\frac{1}{2(p+1)} < \frac{\epsilon}{L} \le \frac{1}{2p}。那么

B={x xx<ϵL}B={x xx<12p}\mathbb B' = \{x|\ ||x - x_*||_{\infty} < \frac{\epsilon}{L}\}\\ \sube\mathbb B = \{x|\ ||x - x_*||_{\infty} < \frac{1}{2p}\}

即说明没有测试点落入函数取非零值的空间。也即所有的测试点 fˉ(x)=0\bar f(x) = 0。由于函数取值的非零说明 f(x)f(x)Lxxϵ|f(x)-f(x_*)| \le L||x-x_*||_{\infty} \le \epsilon,即在调用 oracle 的数量小于 pnp^n 时,结果的准确度不可能好于 ϵϵ

Remarks

  • 函数 fˉ(x)\bar f(x) 的 Lipschitz 连续性。
  • 由于 N<pnN < p^n,那么前述 x^\hat x 一定存在。
    反证法:若不存在,则若划一个均匀网格,格边长为 1p\frac{1}{p},那么此时每个格子中都有测试点。从而测试点的数量大于等于 pnp^n,和条件矛盾。

综上,对于该问题,计算的上界是

(L2ϵ+2)n(⌊\frac{L}{2\epsilon}⌋ + 2)^n

下界为

(L2ϵ)n(\lfloor \frac{L}{2ϵ}\rfloor)^n

如果 ϵ=O(Ln)ϵ =O(\frac{L}{n}),下界和上界乘上一个因子后是重合的。这说明 G(p)G(p)\scr C 的一个优化的 optimal 方法。


CO C1 Complexity bounds for global optimization
http://example.com/2023/09/25/ConvexOpti-02/
Author
Tekhne Chen
Posted on
September 25, 2023
Licensed under