现代优化算法-启发式介绍+禁忌算法+模拟退火

APSchmidt 发表于 2022-5-3 19:09

由于之前用公众号，第一次来知乎，所有一下发所有库存哈~
之后会学一个算法，发一下~~
自己也是初学者，可能有错，一起学习啦~~

[*]1. 启发式算法

[*]1.1 介绍
[*]1.2 优点

[*]2. 禁忌算法（Tabu Search）

[*]2.1 介绍
[*]2.2 禁忌对象
[*]2.3 禁忌长度
[*]2.4 特赦规则
[*]2.5 流程图
[*]2.5 代码

[*]3. 模拟退火算法

[*]3.1 模型
[*]3.2 算法和流程图
[*]3.3模型的建立
[*]3.4 马尔科夫链介绍
[*]3.5 实现的技术问题
[*]3.6 Code

现代优化算法

1. 启发式算法

1.1 介绍

在某些情况下，特别是实际问题中，最优算法的计算时间使人无法忍受或因问题的难度使其计算时间随实例规模的增加以指数速度增加，如表1.2.1列举的TSP枚举算法的情况，此时只能通过启发式算法求到实例的一个可行解。

启发式算法是一种技术。这种技术使得在可接受的计算费用内去寻找最好的解，但不一定能保证所得解的可行性和最优性，甚至在多数情况下，无法阐述所得解同最优解的近似程度。
采用最坏实例下的误差界限来评价启发式算法，则可以定义近似算法：
称H是A的 ε 近似算法当且仅当：

现代优化算法是20世纪80年代初以来得到深入研究和广泛应用的启发式算法。主要包括贪婪算法(greedy algorithm)、邻域搜索(local search)算法、禁忌搜索算法，模拟退火算法，遗传算法，蚁群优化算法，人工神经网络算法等。
1.2 优点

相比于最优化算法，启发式算法能够迅速发展的优点：

[*]数学模型本身是实际问题的简化，或多或少地忽略了一些因素；而且数据采集具有不精确性；参数估计具有不准确性；这些因素可能造成最优算法所得到的解比启发式算法所得到的解更差。
[*]有些难的组合最优化问题可能还没有找到最优算法（例如NP-Hard问题），即使存在，由算法复杂性理论，它们的计算时间是无法接受或不实际的。
[*]一些启发式算法可以用在最优算法中。如在分枝定界算法中，可以用启发式算法估计下（上）界。
2. 禁忌算法（Tabu Search）

[*]局部领域搜索算法的推广

[*]在使用局部搜索算法时，邻域结构和初始点的选取非常关键

[*]人工智能在组合优化问题中的一个成功应用
领域搜索+禁忌表
2.1 介绍

为了找到“全局最优解”，就不应该执着于某一个特定的区域。局部搜索的缺点就是太贪婪地对某一个局部区域以及其邻域搜索，导致一叶障目，不见泰山。禁忌搜索就是对于找到的一部分局部最优解，有意识地避开它（但不是完全隔绝），从而获得更多的搜索区间。兔子们找到了泰山，它们之中的一只就会留守在这里，其他的再去别的地方寻找。就这样，一大圈后，把找到的几个山峰一比较，珠穆朗玛峰脱颖而出。
当兔子们再寻找的时候，一般地会有意识地避开泰山，因为他们知道，这里已经找过，并且有一只兔子在那里看着了。这就是禁忌搜索中禁忌表（tabu list) 的含义。那只留在泰山的兔子一般不会就安家在那里了，它会在一定时间后重新回到找最高峰的大军，因为这个时候已经有了许多新的消息，泰山毕竟也有一个不错的高度，需要重新考虑，这个归队时间，在禁忌搜索里面叫做禁忌长度（tabu length）；如果在搜索的过程中，留守泰山的兔子还没有归队，但是找到的地方全是华北平原等比较低的地方，兔子们就不得不再次考虑选中泰山，也就是说，当一个有兔子留守的地方优越性太突出，超过了“best so far”的状态，就可以不顾及有没有兔子留守，都把这个地方考虑进来，这就叫特赦准则（aspiration criterion）。这三个概念是禁忌搜索和一般搜索准则最不同的地方，算法的优化也关键在这里。

[*]禁忌长度：

[*]过短：在一个局部最优解内循环
[*]过长：造成算法的领域点都为T标记，被禁，无法进行

其中https://www.zhihu.com/equation?tex=STEP+2不受禁忌的元素包含两类：一类是那些没有被禁忌的元素，另一类是可以被解除禁忌的元素。
组成元素
2.2 禁忌对象

造成解变化的状态为禁忌对象。

[*]解的变化

[*]解的分量的变化

[*]目标值变化

[*]初始点为https://www.zhihu.com/equation?tex=x，目标值值为https://www.zhihu.com/equation?tex=a,https://www.zhihu.com/equation?tex=H%28a%29%3D%5Cleft%5C%7B++x%5Cin+D+%7C+f%28x%29%3Da+%5Cright%5C%7D+。
[*]两个目标值蕴含着两个解集。

相对来说，1，2，3三种方法的禁忌范围逐渐变大，计算快，但是搜索范围表小，易陷入局部最优解。
2.3 禁忌长度

禁忌对象被禁用的次数，也可以用禁忌集合T长度去更新被禁对象。
2.4 特赦规则

[*]出现候选集中的全部对象都被禁忌

[*]或一对象被禁但若解禁后其当前最优值将下降的情况。

[*]如果一个影响大的变化成为被禁对象，我们应该使其自由
2.5 流程图

[*]一般思想，具体问题具体分析！

流程图-禁忌算法

2.5 代码

禁忌算法：处理TSP问题的python代码

[*]实测可以跑通
[*]其中设定了一个长度为10的禁忌表，运用确定步数终止，但需要记录最优解。
3. 模拟退火算法

[*]扩展局部搜索算法的方面：以一定概率选择领域中费用值大的状态，跳出局部最优解
[*]一种升温再降温回原温度的方法，从而达到最小内能稳定
[*]金属达到稳定状态，就相当于最优化问题找到最优解
3.1 模型

右统计力学表示，温度T时。分子在状态r的概率分布满足波兹曼(Boltzmann)函数:

https://www.zhihu.com/equation?tex=Pr+%5Cleft%5C%7B%5Cbar+E%3DE%28r%29%5Cright%5C%7D+%3D%5Cfrac%7B1%7D%7BZ%28T%29%7Dexp%28-%5Cfrac%7BE%28r%29%7D%7Bk_BT%7D%29+%5C%5C
其中，https://www.zhihu.com/equation?tex=%5Cbar+E为一个随机变量，https://www.zhihu.com/equation?tex=E%28r%29为在温度T下处以状态r的能量，https://www.zhihu.com/equation?tex=Z%28T%29为概率分布的标准化因子https://www.zhihu.com/equation?tex=Z%28T%29%3D%5Csum_%7Bs%5Cin+D%7Dexp%5Cleft%5C%7B+-%5Cfrac%7BE%28s%29%7D%7Bk_BT%7D%5Cright%5C%7D，https://www.zhihu.com/equation?tex=k_B%3E0为波兹曼常数。
1.由公式可知，当温度很高时，概率分布接近平均分布
2.由求导可知，固定最小能量状态为https://www.zhihu.com/equation?tex=r_%7Bmin%7D，则 https://www.zhihu.com/equation?tex=Pr+%5Cleft%5C%7B%5Cbar+E%3DE%28r%29%5Cright%5C%7D关于温度T时单调下降的。
3.当T趋于0时，https://www.zhihu.com/equation?tex=Pr+%5Cleft%5C%7B+%5Cbar+E+%3DE%28r_%7Bmin%7D%29%5Cright%5C%7D%5Crightarrow+%5Cfrac%7B1%7D%7B%7CD_0%7C%7D,其中https://www.zhihu.com/equation?tex=D_0为具有最低能量的所有状态集合。表明模拟退火方法以接近概率1的可能逼近最优解

原理

将组合优化问题同金属物体退火进行类比：

对等换算

3.2 算法和流程图

算法：

流程图：

流程图-模拟退火算法

[*]学到现在，感觉跟禁忌算法差不多，都是给非局部最小解一个可能。禁忌约束局部最优解，模拟退火给一概率选非最优解。
3.3模型的建立

利用马尔可夫链进行建立。

[*]由于给定领域结构后，模拟退火过程是一个状态转移到另一个状态不断的随机游走。状态i转移到状态j的概率为：

https://www.zhihu.com/equation?tex=%5Cbegin%7Bequation%2A%7D+p_%7Bij%7D%28t%29%3D+%5Cend%7Bequation%2A%7D++%5Cbegin%7Bcases%7DG_%7Bij%7D%28t%29A_%7Bij%7D%28t%29%EF%BC%8C%26%5Cforall+j%5Cneq+i%EF%BC%8C%5C%5C+1-%5Csum_%7Bl%3D1%2Cl%5Cneq+i%7D%5E%7B%7CD%7C%7DG_%7Bil%7D%28t%29A_%7Bil%7D%28t%29%EF%BC%8C+%26j%3Di%EF%BC%9B%5Cend%7Bcases%7D+%5C%5C
其中https://www.zhihu.com/equation?tex=G_%7Bij%7D%28t%29表示在状态i，状态j被选取的概率,假设领域中元素等概率选取时：

https://www.zhihu.com/equation?tex=%5Cbegin%7Bequation%2A%7D+G_%7Bij%7D%28t%29%3D%5Cend%7Bequation%2A%7D+%5Cbegin%7Bcases%7D%5Cfrac%7B1%7D%7B%7CN%28i%29%7C%7D%2C%26j%5Cin+N%28i%29%EF%BC%8C%5C%5C+0%EF%BC%8C%26j%5Cnotin+N%28i%29%EF%BC%9B%5Cend%7Bcases%7D+%5C%5C

https://www.zhihu.com/equation?tex=A_%7Bij%7D%28t%29表示产生状态j后，状态j被接受的概率,如在模拟退火算法中接受的概率为

https://www.zhihu.com/equation?tex=%5Cbegin%7Bequation%2A%7D+A_%7Bij%7D%28t%29%3D%5Cend%7Bequation%2A%7D+%5Cbegin%7Bcases%7D1%2C%26f%28i%29%5Cgeq+f%28j%29%EF%BC%8C%5C%5C+%5Cexp%28-%5Cfrac%7B%5CDelta+f_%7Bij%7D%7D%7Bt%7D%29%EF%BC%8C%26f%28i%29%3C+f%28j%29%EF%BC%9B%5Cend%7Bcases%7D+%5C%5C

https://www.zhihu.com/equation?tex=%7CD%7C表示状态集合（解集合）中状态的个数。 https://www.zhihu.com/equation?tex=P%28t%29%3D%28p_%7Bij%7D%28t%29%29_%7B%7CD%7C%5Ctimes+%7CD%7C%7D%2CG%28t%29%3D%28G_%7Bij%7D%28t%29%29_%7B%7CD%7C%5Ctimes+%7CD%7C%7D%5Cmbox%7B%E5%92%8C%7DA%28t%29%3D%28A_%7Bij%7D%28t%29%29_%7B%7CD%7C%5Ctimes+%7CD%7C%7D分别称为一步转移概率矩阵，产生矩阵和接受矩阵。
上面三个公式为模拟退火的基本数学模型。模拟退火可以分两类：

[*]1.时齐算法：对每一个固定温度，计算一个马尔可夫链，直到达到稳定状态，再让温度下降。
[*]2.非时齐算法：由一个马尔科夫链组成，要求两个相邻的转移中，温度t时下降的。？？
马尔科夫链应满足下列条件：

[*]可达性：无论起点，任何一个状态都可以达到。
[*]渐近不依赖起点
[*]分布稳定性：1.温度不变时，马尔科夫链的极限分布存在。2.当温度渐近0时，马尔科夫链也有极限分布。
[*]收敛到最优解：当温度渐近0时，最优状态的极限分布和为1。
3.4 马尔科夫链介绍

https://www.zhihu.com/equation?tex=p_%7Bij%7D%28n-1%29%3DP%28X%28n%29%3Dj%7CX%28n-1%29%3Di%29%5C%5C为一步转移概率。当状态空间有限时，称为有限马氏链，一步转移概率矩阵记为https://www.zhihu.com/equation?tex=P%28n-1%29%3D%28p_%7Bij%7D%28n-1%29%29_%7B%7CD%7C%5Ctimes%7CD%7C%7D+%5C%5C
当每一步的转移概率矩阵都相等时，称马氏链为时齐的（homogenneous）。

https://www.zhihu.com/equation?tex=p_%7Bij%7D%5E%7B%28n%29%7D%3DP%28X%28n%29%3Dj%7CX%280%29%3Di%29+%5C%5C
表示n步转移概率。

[*]由此可知，模拟退火的一步转移概率与第几次迭代无关，因此，马氏链是时齐的。
定义从i到达j首达时刻的随机变量为

https://www.zhihu.com/equation?tex=T_%7Bij%7D%3Dmin%5Cleft%5C%7Bn%7CX%280%29%3Di%2CX%28n%29%3Dj%2Cn%5Cgeq+1%5Cright%5C%7D+%5C%5C
其概率定义为

https://www.zhihu.com/equation?tex=f_%7Bij%7D%5E%7B%28n%29%7D%3DP%28T_%7Bij%7D%3Dn%7CX%280%29%3Di%29+%5C%5C
迟早到达概率为

https://www.zhihu.com/equation?tex=f_%7Bij%7D%3D%5Csum_%7Bn%3D1%7D%5E%7B%5Cinfty%7Df_%7Bij%7D%5E%7B%28n%29%7D%E3%80%82+%5C%5C
由马氏链性质的讨论，当下面性质得以证明后，说明模拟退火算法收敛全局最优解。
定理 3.3.3 和定理 3.3.4 给出时齐算法全局收敛应满足的充分条件，但这些条件的限制是比较强的，如(3.1.6)的发生概率就不一定满足定理 3.3.3 的(2)，因此，研究模拟退火算法全局收敛应满足的充分条件是理论研究的一个方向。
3.5 实现的技术问题

[*]不能保证解的领域结构中都是可行解：利用罚函数法或构造比较精巧的邻域结构，这样可以节省大量的计算时间
[*]选取初始温度：选取初始温度https://www.zhihu.com/equation?tex=t_%7B0%7D使得每一个状态的概率接近相等，即https://www.zhihu.com/equation?tex=exp%28-%5Cfrac%7B%5CDelta+f_%7Bij%7D%7D%7Bt_0%7D%29%5Cthickapprox+1%5C%5C故取https://www.zhihu.com/equation?tex=t_0%3DK%5CDelta_0%2C%5Cmbox%7BK%E5%85%85%E5%88%86%E5%A4%A7%E7%9A%84%E6%95%B0%7D%5C%5C其中https://www.zhihu.com/equation?tex=%5CDelta_0%3Dmax%5Cleft%5C%7Bf%28i%29%7Ci%5Cin+D%5Cright%5C%7D-min%5Cleft%5C%7Bf%28i%29%7Ci%5Cin+D%5Cright%5C%7D
产生数值计算估计和统计推断估计方法给出一个近似估计值。
3.温度下降方法：固定下降速率或者固定间隔。
4.实际计算中达到理论的平稳分布是不可能的，只能在同一温度时，近似找个步数停止，当作极限。每一固定温度的迭代长度：固定长度或者由接受和拒绝的比率控制迭代步数。（温度高时，接受的概率大，迭代步数小，温度低，则迭代步数高。）
5.算法的终止原则：零度法、循环总数控制、不改进规则、接受概率控制、领域法...
3.6 Code

模拟退火：处理TSP问题的python代码

[*]实现起来就是加上个判断语句
[*]关键模拟退火算法的全局收敛性条件运用马尔科夫链的原理分析比较复杂
参考资料

禁忌算法：处理TSP问题的python代码网址: https://blog.csdn.net/adkjb/article/details/81712969

模拟退火：处理TSP问题的python代码网址: https://blog.csdn.net/qq_34798326/article/details/79013338

页: [1]

Unity开发者联盟's Archiver

现代优化算法-启发式介绍+禁忌算法+模拟退火