五种常见的最优化方法

五种常见的最优化方法简介

Divide and Conquer - 分治法

概念

分治法字面上的解释是“分而治之”,就是把一个复杂的问题分成两个或更多的相同或相似的子问题,再把子问题分成更小的子问题……直到最后子问题可以简单的直接求解,并且原问题的解即子问题的解的合并。这个技巧是很多高效算法的基础,如排序算法(快速排序,归并排序),傅立叶变换(快速傅立叶变换)。

分治法的设计思想

将一个难以直接解决的大问题,分割成一些规模较小的相同问题,以便各个击破,分而治之。

分治策略

对于一个规模为 的问题,若该问题可以容易地解决(比如说规模 较小)则直接解决,否则将其分解为 个规模较小的子问题,这些子问题互相独立且与原问题形式相同,递归地解这些子问题,然后将各子问题的解合并得到原问题的解。这种算法设计策略叫做分治法。

如果原问题可分割成 个子问题,,且这些子问题都可解并可利用这些子问题的解求出原问题的解,那么这种分治法就是可行的。由分治法产生的子问题往往是原问题的较小模式,这就为使用递归技术提供了方便。在这种情况下,反复应用分治手段,可以使子问题与原问题类型一致而其规模却不断缩小,最终使子问题缩小到很容易直接求出其解,这自然导致递归过程的产生。分治与递归像一对孪生兄弟,经常同时应用在算法设计之中,并由此产生许多高效算法。

适用场合

分治法所能解决的问题一般具有以下特征:

  1. 该问题的规模缩小到一定的程度就可以容易地解决
  2. 该问题可以分解为若干个规模较小的相同问题,即该问题具有最优子结构性质。
  3. 利用该问题分解出的子问题的解可以合并为该问题的解;
  4. 该问题所分解出的各个子问题是相互独立的,即子问题之间不包含公共的子子问题。

特征1 是绝大多数问题都可以满足的,因为问题的计算复杂性一般是随着问题规模的增加而增加;

特征2 是应用分治法的前提,它也是大多数问题可以满足的,此特征反映了递归思想的应用;

特征3 是关键,能否利用分治法完全取决于问题是否具有第三条特征,如果具备了第一条和第二条特征,而不具备第三条特征,则可以考虑用贪心法动态规划法

特征4 涉及到分治法的效率,如果各子问题是不独立的则分治法要做许多不必要的工作,重复地解公共的子问题,此时虽然可用分治法,但一般用动态规划法较好。

基本步骤

1
2
3
4
5
6
7
8
9
10
11
12
13
14
fuction Divide-and-Conquer(P):

# if question small enough to solve directly
if |P| ≤ n0:
return(ADHOC(P))

# divide P into subquestion (P_1 ,P_2 ,...,P_k), solve them recursively
for i ← 1 to k:
do y_iDivide-and-Conquer(Pi)

# merge all solution
TMERGE(y_1, y_2, ... ,y_k)

return(T)
  1. 一定是先找到最小问题规模时的求解方法
  2. 然后考虑随着问题规模增大时的求解方法
  3. 找到求解的递归函数式后(各种规模或因子),设计递归程序即可。

时间复杂度

一个分治算法将规模为 的问题分成 个规模为 的子问题去解。设分解阈值 ,且 ADHOC 解决规模为 的问题用 个单位时间。用 表为解决规模为 的问题所需的计算时间。

递归方程及其解只给出n等于m的方幂时T(n)的值,但是如果认为T(n)足够平滑,那么由n等于m的方幂时T(n)的值可以估计T(n)的增长速度。通常假定T(n)是单调上升的,从而当 时,

常见解决问题

  • 二分搜索
  • 大整数乘法
  • Strassen矩阵乘法
  • 棋盘覆盖
  • 合并排序
  • 快速排序
  • 线性时间选择
  • 最接近点对问题
  • 循环赛日程表
  • 汉诺塔

Dynamic Programming - 动态规划

概念

基本思想与分治法类似,也是将待求解的问题分解为若干个子问题(阶段),按顺序求解子阶段,前一子问题的解,为后一子问题的求解提供了有用的信息。在求解任一子问题时,列出各种可能的局部解,通过决策保留那些有可能达到最优的局部解,丢弃其他局部解。依次解决各子问题,最后一个子问题就是初始问题的解。

由于动态规划解决的问题多数有重叠子问题这个特点,为减少重复计算,对每一个子问题只解一次,将其不同阶段的不同状态保存在一个二维数组中。

动态规划实质上是一种以空间换时间的技术,它在实现的过程中,不得不存储产生过程中的各种状态,所以它的空间复杂度要大于其它的算法。

与分治法最大的差别在于适合于用动态规划法求解的问题,经分解后得到的子问题往往不是互相独立的。

适用场合

适用动态规划的问题往往具有的特征如下

  1. 最优化原理:如果问题的最优解所包含的子问题的解也是最优的,就称该问题具有最优子结构,即满足最优化原理。
  2. 无后效性:即某阶段状态一旦确定,就不受这个状态以后决策的影响。也就是说,某状态以后的过程不会影响以前的状态,只与当前状态有关。
  3. 有重叠子问题:即子问题之间是不独立的,一个子问题在下一阶段决策中可能被多次使用到。这条性质并不是动态规划适用的必要条件,但是如果没有这条性质,动态规划算法同其他算法相比就不具备优势。

基本步骤

  1. 划分阶段:按照问题的时间或空间特征,把问题分为若干个阶段。在划分阶段时,注意划分后的阶段一定要是有序的或者是可排序的,否则问题就无法求解。

  2. 确定状态和状态变量:将问题发展到各个阶段时所处于的各种客观情况用不同的状态表示出来。当然,状态的选择要满足无后效性。

  3. 确定决策并写出状态转移方程:因为决策和状态转移有着天然的联系,状态转移就是根据上一阶段的状态和决策来导出本阶段的状态。所以如果确定了决策,状态转移方程也就可写出。但事实上常常是反过来做,根据相邻两个阶段的状态之间的关系来确定决策方法和状态转移方程。

  4. 寻找边界条件:给出的状态转移方程是一个递推式,需要一个递推的终止条件或边界条件。

实际应用中可以按以下几个简化的步骤进行设计:

  1. 分析最优解的性质,并刻画其结构特征。

  2. 递归的定义最优解。

  3. 以自底向上或自顶向下的记忆化方式(备忘录法)计算出最优值。

  4. 根据计算最优值时得到的信息,构造问题的最优解。

确定了动态规划的这三要素,整个求解过程就可以用一个最优决策表来描述,最优决策表是一个二维表,其中行表示决策的阶段,列表示问题状态,表格需要填写的数据一般对应此问题的在某个阶段某个状态下的最优值(如最短路径,最长公共子序列,最大价值等),填表的过程就是根据递推关系,从1行1列开始,以行或者列优先的顺序,依次填写表格,最后根据整个表格的数据通过简单的取舍或者运算求得问题的最优解。

代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
// 第一个阶段 
for(j=1; j<=m; j=j+1){
xn[j] = 初始值;

// 其他n-1个阶段
for(i=n-1; i>=1; i=i-1){

// f(i)与i有关的表达式
for(j=1; j>=f(i); j=j+1){
xi[j] = j = max(或min) {g(xi-1[j1:j2]),... ,g(xi-1[jk:jk+1])};
}
}
}

// 由子问题的最优解求解整个问题的最优解的方案
t = g(x1[j1:j2]);

for(i=2; i<=n-1; i=i+1){
t = t-xi-1[ji];

for(j=1; j>=f(i); j=j+1){
if(t=xi[ji]){
break;
}
}
}

Greedy Algorithm - 贪心算法

概念

所谓贪心算法是指,在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,他所做出的仅是在某种意义上的局部最优解。

贪心算法没有固定的算法框架,算法设计的关键是贪心策略的选择。必须注意的是,贪心算法不是对所有问题都能得到整体最优解,选择的贪心策略必须具备无后效性,即某个状态以后的过程不会影响以前的状态,只与当前状态有关。

所以对所采用的贪心策略一定要仔细分析其是否满足无后效性。

适用场合

贪心策略适用的前提是:局部最优策略能导致产生全局最优解

实际上,贪心算法适用的情况很少。一般,对一个问题分析是否适用于贪心算法,可以先选择该问题下的几个实际数据进行分析,就可做出判断。

狭义的贪心算法指的是解最优化问题的一种特殊方法,解决过程中总是做出当下最好的选择,因为具有最优子结构的特点,局部最优解可以得到全局最优解;这种贪心算法是动态规划的一种特例。能用贪心解决的问题,也可以用动态规划解决。

而广义的贪心指的是一种通用的贪心策略,基于当前局面而进行贪心决策。

基本步骤

  1. 把求解的问题分成若干个子问题。

  2. 对每一子问题求解,得到子问题的局部最优解。

  3. 把子问题的解局部最优解合成原来解问题的一个解。

常见解决问题

  1. 纸币找零问题

  2. 服务器任务安排问题

  3. 分糖果问题

  4. 小船过河问题

  5. 跳一跳

Back Tracking Algorithm - 回溯法

概念

回溯算法实际上一个类似枚举的搜索尝试过程,主要是在搜索尝试过程中寻找问题的解,当发现已不满足求解条件时,就“回溯”返回,尝试别的路径。

回溯法是一种选优搜索法,按选优条件向前搜索,以达到目标。但当探索到某一步时,发现原先选择并不优或达不到目标,就退回一步重新选择,这种走不通就退回再走的技术为回溯法,而满足回溯条件的某个状态的点称为“回溯点”。

许多复杂的,规模较大的问题都可以使用回溯法,有“通用解题方法”的美称。

在包含问题的所有解的解空间树中,按照深度优先搜索的策略,从根结点出发深度探索解空间树。当探索到某一结点时,要先判断该结点是否包含问题的解,如果包含,就从该结点出发继续探索下去,如果该结点不包含问题的解,则逐层向其祖先结点回溯。

基本步骤

  1. 针对所给问题,确定问题的解空间:首先应明确定义问题的解空间,问题的解空间应至少包含问题的一个(最优)解。

  2. 确定结点的扩展搜索规则。

  3. 以深度优先方式搜索解空间,并在搜索过程中用剪枝函数避免无效搜索。

代码

非递归

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
int a[n],i;
i = 1;
while (i>0 (有路可走) and (未达到目标))
{
if(i > n){
搜索到一个解,输出;
}
else{
a[i]第一个可能的值;

while(a[i]在不满足约束条件且在搜索空间内){
a[i]下一个可能的值;
}

if(a[i]在搜索空间内){
标识占用的资源;
i = i+1; // 扩展下一个结点
}

else{
清理所占的状态空间; // 回溯
i = i – 1;
}
}
}

递归

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
int a[n];
function Search(int i)
{
if(i > n){
输出结果;
}
else{
// 枚举i所有可能的路径
for(j = 下界; j <= 上界; j=j+1){

// 满足限界函数和约束条件
if(fun(j)){
a[i] = j;
...
Search(i + 1);
回溯前的清理工作(如a[i]置空值等);
}
}
}
}

常见解决问题

  1. N皇后问题

Branch and Bound - 分支定界法

概念

类似于回溯法,也是一种在问题的解空间树T上搜索问题解的算法。但在一般情况下,分支定界法与回溯法的求解目标不同。回溯法的求解目标是找出T中满足约束条件的所有解,而分支定界法的求解目标则是找出满足约束条件的一个解,或是在满足约束条件的解中找出使某一目标函数值达到极大或极小的解,即在某种意义下的最优解。

所谓“分支”就是采用广度优先的策略,依次搜索E-结点的所有分支,也就是所有相邻结点,抛弃不满足约束条件的结点,其余结点加入活结点表。然后从表中选择一个结点作为下一个E-结点,继续搜索。

选择下一个E-结点的方式不同,则会有几种不同的分支搜索方式。

  1. FIFO搜索

  2. LIFO搜索

  3. 优先队列式搜索

一般过程

由于求解目标不同,导致分支定界法与回溯法在解空间树T上的搜索方式也不相同。回溯法以深度优先的方式搜索解空间树T,而分支定界法则以广度优先或以最小耗费优先的方式搜索解空间树T。

分支定界法的搜索策略是:在扩展结点处,先生成其所有的儿子结点(分支),然后再从当前的活结点表中选择下一个扩展对点。为了有效地选择下一扩展结点,以加速搜索的进程,在每一活结点处,计算一个函数值(限界),并根据这些已计算出的函数值,从当前活结点表中选择一个最有利的结点作为扩展结点,使搜索朝着解空间树上有最优解的分支推进,以便尽快地找出一个最优解。

分支定界法常以广度优先或以最小耗费(最大效益)优先的方式搜索问题的解空间树。问题的解空间树是表示问题解空间的一棵有序树,常见的有子集树和排列树。在搜索问题的解空间树时,分支定界法与回溯法对当前扩展结点所使用的扩展方式不同。在分支定界法中,每一个活结点只有一次机会成为扩展结点。活结点一旦成为扩展结点,就一次性产生其所有儿子结点。在这些儿子结点中,那些导致不可行解或导致非最优解的儿子结点被舍弃,其余儿子结点被子加入活结点表中。此后,从活结点表中取下一结点成为当前扩展结点,并重复上述结点扩展过程。这个过程一直持续到找到所求的解或活结点表为空时为止。

和回溯法的区别

有一些问题其实无论用回溯法还是分支定界法都可以得到很好的解决,但是另外一些则不然。也许我们需要具体一些的分析——到底何时使用分支限界而何时使用回溯呢?

回溯法深度优先搜索堆栈活结点的所有可行子结点被遍历后才被从栈中弹出找出满足约束条件的所有解

分支定界法广度优先或最小消耗优先搜索队列、优先队列每个结点只有一次成为活结点的机会找出满足约束条件的一个解或特定意义下的最优解