菜单 - 使用优化算法搜索正确的决策

5 分钟

菜单（即优化算法）是另一种方法，可以通过搜索用于评估决策的选项来做出自动决策。

优化算法搜索选项列表，并使用目标标准选择控制动作。在本单元中，我们将探讨多种优化方法。

暴力搜索优化

优化算法就像探险者一样，寻找地球表面上的最高山峰。确保找到最高峰的一种方法是踏上地球的每一平方米，在每个点进行测量，完成后按高度对测量结果进行排序。地球上的最高点现在将位于你的列表顶部。

由于地球上有5.1亿平方公里的陆地面积，要得到答案需要许多代人。该方法称为暴力搜索，仅在地理区域小的潜在决策情况下才可行。对于更复杂的地理区域或状态空间，我们需要其他方法，如以下部分所述。

基于梯度的优化

寻找地球最高峰的更有效方法是在陆地上行走，只沿向上倾斜最多的方向行走。通过这种方法，您可以通过只走上坡路线来避免探索大部分地形。在优化中，此类方法称为 基于渐变的方法 ，因为山的斜率称为等级或渐变。

此方法有两个挑战。第一个是，根据你开始探寻的位置，你可能最终会到达一座不是地球上最高点的高山（也称为局部最大值）。

此方法的第二个限制是，它只能在计算正在行走的地面的斜率的情况下使用。如果地形中存在间隙（认为垂直下降或无底坑），则无法在垂直下降处计算斜率（从技术上而言是无限的），因此不能使用基于渐变的优化方法在该空间中搜索解决方案。

基于渐变的方法的挑战。

上图显示了基于梯度的方法陷入局部最大值的挑战。

多方面优化

现在，假设你要雇用多个探险者，从风景中的不同位置出发，以寻找最高点。每完成一步，探险家都会比较他们当前的高度和地势，并利用他们的综合知识更好地绘制地球地图。这可能会导致搜索速度更快，并避免所有探险家被困在一个不是山峰的高处。珠穆朗玛峰。然而，仍然无法保证向全球最高值的趋同。

多面优化图示。

上图是多方面优化的示例。

其他优化方法

其中许多算法受本质上的进程启发。大自然有许多有效的方法可以彻底探索，就像水流过一片土地。以下是一些示例：

进化算法 受到达尔文自然选择理论的启发。进化算法产生潜在的解决方案决策群体，测试总体中每个解决方案实现过程目标有多好，扼杀无效的解决方案，然后改变总体继续探索。
群方法 的灵感来自蚂蚁、蜜蜂和粒子群、移动和交互的方式。这些优化方法通过许多探索者探索解决方案空间，这些探索者沿着景观移动，并相互通信，分享他们发现的结果。
树方法将 潜在的解决方案视为树上的树枝。想象一下一部选择自己的冒险小说（和其他互动小说），要求你决定在故事的某个时刻采取哪个方向。随着每个决策点的选项数量增加，决策本身也在不断扩散。基于树的方法使用各种技术高效搜索树（无需访问每个分支）来查找解决方案。一些更著名的树方法是分支定界和 Monte Carlo 树搜索 (MCTS)。
模拟退火 的灵感来自金属在加热后冷却的方式。所有金属都有一种以共同方式冷却的晶体结构。金属较热时，结构变化较多；较冷时，变化较少。退火是一种工艺，将金属等材料加热到其再结晶温度以上，然后缓慢冷却以使其在各种工业过程的下一步中更具延展性。此算法模拟该过程。模拟退火在一段时间内使用不同的搜索行为来搜索空间。模拟退火算法最初会进行广泛的搜索（探索更多），然后在了解到更多信息后，逐渐集中于发现的最有前途的区域，随着时间的推移，减少探索量。

优化算法的优势和弱点

优化算法不假设对问题有任何了解，因此，当我们不知道状态空间的情况并且我们想要进行探索时，使用优化算法更为合适。

他们的主要弱点是，它们是耗时的，除非状态空间很小，否则我们可能没有足够的时间来找到最佳决策。

反馈

此页面是否有帮助？