你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure 负载均衡器运行状况事件日志

Azure 负载均衡器支持运行状况事件日志,以帮助你识别和排查会影响负载均衡器资源运行状况的持续问题。 这些事件通过 Azure Monitor 资源日志类别 LoadBalancerHealthEvent 提供。

标准层(区域层和全局层)和网关负载均衡器支持这些日志。

重要

Azure 负载均衡器的 LoadBalancerHealthEvent 日志目前为预览版,可在所有 Azure 公共区域使用。 在预览版中时,此功能的日志结构、事件类型和发布行为等方面可能会根据反馈而更改。

此预览版在提供时没有附带服务级别协议,不建议将其用于生产工作负荷。 某些功能可能不受支持或者受限。 有关详细信息,请参阅 Microsoft Azure 预览版补充使用条款

严重性定义

每个运行状况事件类型都具有关联的严重性,用于指示预期影响级别。 此属性有助于根据问题的紧迫性筛选日志和创建更个性化的警报。

严重性 描述
严重 负载均衡器资源需要立即关注。 负载均衡器的功能受到影响。 这种影响可能会导致连接失败、CRUD(创建、读取、更新、删除)操作失败或负载均衡器组件配置错误等问题。
警告 需要监视或查看负载均衡器资源。 负载均衡器的功能在某些情况下可能会受到影响,或者在部分降级状态下运行。

运行状况事件类型和发布频率

可通过各种方式检测运行状况事件,某些事件是通过主动检查负载均衡器的状态生成的,而其他事件可以在满足显式条件时生成。 如果事件发生在检测期间,则每个事件都有可能每分钟发布一次。

发布运行状况事件后,会有一个不重新发布该事件的扩展时间范围。 此时间范围可防止在出现永久性问题时发布过多的日志。 在此重新检测间隔之后,如果问题仍然存在,则会重新发布运行状况事件。

发布的每个事件日志都带有一个时间戳,该时间戳指示 Azure 负载均衡器在平台级别检测到事件的时间。 在 Azure Monitor 进行检测和发布事件之间可能存在延迟。

Status LoadBalancerHealthEventType 严重性 描述 检测时间范围 重新检测间隔 支持的属性
预览 DataPathAvailabilityWarning 警告 当前端 IP 的“数据路径可用性”指标由于平台问题而低于 90% 时,会根据受影响的负载均衡器前端 IP 发布此事件 1 分钟 5 分钟 前端 IP 地址,与受影响的负载均衡规则关联的前端端口列表
预览 DataPathAvailabilityCritical 严重 当前端 IP 的数据路径可用性指标小于 25% 时,会根据受影响的负载均衡器前端 IP 发布此事件 1 分钟 5 分钟 前端 IP 地址,与受影响的负载均衡规则关联的前端端口列表
预览 NoHealthyBackends 严重 当关联的后端池没有响应配置的运行状况探测的后端实例时,会根据负载均衡器前端 IP 发布此事件。 因此,负载均衡器没有用于将流量分发到的正常后端。 点播 60 分钟 前端 IP 地址,与受影响的负载均衡规则关联的协议和前端端口的成对列表
预览 HighSnatPortUsage 警告 当后端实例从单个前端 IP 使用了超过 75% 的已分配端口时,此事件在每个后端实例级别上发布。 点播 5 分钟 后端 IP 地址,前端 IP 地址
预览 SnatPortExhaustion 严重 此事件在每个后端实例级别上发布。 当后端实例耗尽所有分配的端口,并使任何进一步的出站连接失败时,会发布事件。 此事件一直持续到端口被释放或更多端口被分配。 点播 5 分钟 后端 IP 地址,前端 IP 地址

若要详细了解随每个运行状况事件日志发布的属性,请查看 Azure Log Analytics 参考文档上的日志表 ALBHealthEvent

后续步骤

在本文中,你学习了 Azure 负载均衡器运行状况事件日志和运行状况事件类型。

若要详细了解如何使用这些日志收集、分析和创建警报,并详细了解如何对每种运行状况事件类型进行故障排除,请参阅: