你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

使用 Azure 顾问降低服务成本

通过识别闲置和未充分利用的资源,Azure 顾问可帮助优化和降低 Azure 总支出。  可在顾问仪表板的“成本”选项卡获取成本建议。

  1. 登录到 Azure 门户

  2. 在任意页面中搜索并选择顾问

  3. 在顾问仪表板中,选择“成本”选项卡 。

通过调整大小或关闭未充分利用的实例来优化虚拟机 (VM) 或虚拟机规模集 (VMSS) 支出

虽然某些应用程序方案有意使虚拟机利用率较低,但通过管理虚拟机或虚拟机规模集的大小和数量通常可降低成本。

顾问使用机器学习算法来识别低利用率的情况并确定最合适的建议,以确保虚拟机和虚拟机规模集得到最优利用。 建议的操作是关机或重设大小,具体取决于要评估的资源。

关闭建议

顾问会识别过去 7 天内完全未使用的资源,并建议将其关闭。

  • 建议条件包括“CPU”和“出站网络利用率”指标。 不考虑“内存”,因为我们发现“CPU”和“出站网络利用率”已足够了。
  • 分析过去 7 天的利用率数据
  • 每 30 秒对指标采样一次,聚合 1 分钟内的指标,然后再聚合 30 分钟内的指标(聚合 30 分钟内的指标时,取平均值的最大值)。 在虚拟机规模集上,将使用不同实例的指标平均值聚合各个虚拟机的指标。
  • 在以下情况下将创建关闭建议:
    • 所有内核汇总的 CPU 利用率最大值的 P95 小于 3%。
    • 过去 3 天内平均 CPU 的 P100(所有内核的总和)<= 2%
    • 7 天内的出站网络利用率小于 2%。

重设 SKU 大小建议

顾问建议在可能的情况下调整虚拟机的大小,以适应更合适的 SKU 上的当前负载,这样成本更低(基于零售价格)。 在虚拟机规模集上,顾问建议在可能的情况下调整大小,以适应更合适且更便宜的 SKU 或者相同 SKU 的更少实例上的当前负载。

  • 建议条件包括“CPU”、“内存”和“出站网络利用率”。
  • 分析过去 7 天的利用率数据
  • 每 30 秒对指标采样一次,聚合 1 分钟内的指标,然后再聚合 30 分钟内的指标(聚合 30 分钟内的指标时,取平均值的最大值)。 在虚拟机规模集上,将使用实例计数建议的指标平均值以及 SKU 更改建议的最大指标聚合各个虚拟机的指标。
  • 根据以下条件确定适当的 SKU(对于虚拟机)或实例计数(对于虚拟机规模集资源):
    • 不应影响新 SKU 上工作负载的性能。
      • 面向用户的工作负载目标:
        • 推荐的 SKU 上 CPU 和出站网络利用率的 P95 不高于 40%
        • 推荐的 SKU 上内存利用率的 P100 不高于 60%
      • 不面向用户的工作负载目标:
        • 新 SKU 上 CPU 和出站网络利用率的 P95 不高于 80%
        • 新 SKU 上内存利用率的 P100 不高于 80%
    • 新 SKU(如果适用)具有相同的加速网络和高级存储功能
    • 建议的新 SKU(如果适用)在虚拟机的当前区域受支持
    • 新 SKU(如果适用)更便宜
    • 实例计数建议还会考虑虚拟机规模集是由 Service Fabric 还是 AKS 管理。 对于 Service Fabric 托管资源,建议考虑到了可靠性和持久性层。
  • 顾问通过分析工作负载的 CPU 使用率特征来确定工作负载是否面向用户。 该方法基于 Microsoft Research 的发现。 你可在此处找到更多详细信息:云平台中基于预测的功率过度订阅 - Microsoft Research
  • 根据最适合、成本最低且无性能影响的原则,顾问不仅建议使用同一系列中较小的 SKU(例如 D3v2 到 D2v2),还建议使用较新版本(例如 D3v2 到 D2v3)或不同系列中的 SKU(例如 D3v2 到 E3v2)。
  • 对于虚拟机规模集资源,顾问将实例计数建议优先于 SKU 更改建议,因为实例计数更改很容易执行,从而可以更快地节省成本。

可突发建议

我们评估工作负载是否适合在称为“可突发 SKU”的专用 SKU 上运行,这些 SKU 支持可变工作负载性能要求,并且比常规用途 SKU 便宜。 在此处详细了解可突发 SKU:B 系列可突发 - Azure 虚拟机

在下述条件下,建议使用可突发 SKU:

  • 平均 CPU 利用率低于可突发 SKU 的基线性能。
    • 如果 CPU 的 P95 低于可突发 SKU 基线性能的二分之一
    • 如果当前 SKU 未启用加速网络,因为可突发 SKU 尚不支持加速网络
    • 如果确定可突发 SKU 额度足以支持 7 天内的平均 CPU 利用率

生成的建议指出用户应将其当前虚拟机或虚拟机规模集调整为具有相同核心数的可突发 SKU。 提出此建议是为了让用户可以利用低成本和工作负载平均利用率低但在某些情况下峰值高这样的优势,这非常适合使用 B 系列 SKU。

顾问会显示与建议的操作(重设大小或关机)相对应的成本节省估算值。 对于调整大小,顾问提供当前和目标 SKU/实例计数信息。 若要对低利用率虚拟机或虚拟机规模集采取更有选择性的行动,可在每个订阅的基础上调整 CPU 利用率规则。

在某些情况下,建议无法采用或可能不适用,例如一些常见的场景(可能还有其他情况):

  • 预配的虚拟机或虚拟机规模集可以适应将来的流量
  • 虚拟机或虚拟机规模集使用调整大小算法未考虑的其他资源,例如 CPU、内存和网络以外的指标
  • 正在当前的 SKU(即使未有效利用)上执行特定测试
  • 需要保持虚拟机或虚拟机规模集 SKU 同质化
  • 用于灾难恢复目的的虚拟机或虚拟机规模集

在这种情况下,只需使用与建议关联的“消除/推迟”选项。

我们一直在努力改进这些建议。 欢迎随时在顾问论坛上分享反馈。

后续步骤

若要了解有关顾问建议的详细信息,请参阅以下资源: