培训
你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure 负载均衡器运行状况事件日志
Azure 负载均衡器支持运行状况事件日志,以帮助你识别和排查会影响负载均衡器资源运行状况的持续问题。 这些事件通过 Azure Monitor 资源日志类别 LoadBalancerHealthEvent 提供。
标准层(区域层和全局层)和网关负载均衡器支持这些日志。
重要
Azure 负载均衡器的 LoadBalancerHealthEvent 日志目前为预览版,可在所有 Azure 公共区域使用。 在预览版中时,此功能的日志结构、事件类型和发布行为等方面可能会根据反馈而更改。
此预览版在提供时没有附带服务级别协议,不建议将其用于生产工作负荷。 某些功能可能不受支持或者受限。 有关详细信息,请参阅 Microsoft Azure 预览版补充使用条款。
每个运行状况事件类型都具有关联的严重性,用于指示预期影响级别。 此属性有助于根据问题的紧迫性筛选日志和创建更个性化的警报。
严重性 | 描述 |
---|---|
严重 | 负载均衡器资源需要立即关注。 负载均衡器的功能受到影响。 这种影响可能会导致连接失败、CRUD(创建、读取、更新、删除)操作失败或负载均衡器组件配置错误等问题。 |
警告 | 需要监视或查看负载均衡器资源。 负载均衡器的功能在某些情况下可能会受到影响,或者在部分降级状态下运行。 |
可通过各种方式检测运行状况事件,某些事件是通过主动检查负载均衡器的状态生成的,而其他事件可以在满足显式条件时生成。 如果事件发生在检测期间,则每个事件都有可能每分钟发布一次。
发布运行状况事件后,会有一个不重新发布该事件的扩展时间范围。 此时间范围可防止在出现永久性问题时发布过多的日志。 在此重新检测间隔之后,如果问题仍然存在,则会重新发布运行状况事件。
发布的每个事件日志都带有一个时间戳,该时间戳指示 Azure 负载均衡器在平台级别检测到事件的时间。 在 Azure Monitor 进行检测和发布事件之间可能存在延迟。
Status | LoadBalancerHealthEventType | 严重性 | 描述 | 检测时间范围 | 重新检测间隔 | 支持的属性 |
---|---|---|---|---|---|---|
预览 | DataPathAvailabilityWarning | 警告 | 当前端 IP 的“数据路径可用性”指标由于平台问题而低于 90% 时,会根据受影响的负载均衡器前端 IP 发布此事件 | 1 分钟 | 5 分钟 | 前端 IP 地址,与受影响的负载均衡规则关联的前端端口列表 |
预览 | DataPathAvailabilityCritical | 严重 | 当前端 IP 的数据路径可用性指标小于 25% 时,会根据受影响的负载均衡器前端 IP 发布此事件 | 1 分钟 | 5 分钟 | 前端 IP 地址,与受影响的负载均衡规则关联的前端端口列表 |
预览 | NoHealthyBackends | 严重 | 当关联的后端池没有响应配置的运行状况探测的后端实例时,会根据负载均衡器前端 IP 发布此事件。 因此,负载均衡器没有用于将流量分发到的正常后端。 | 点播 | 60 分钟 | 前端 IP 地址,与受影响的负载均衡规则关联的协议和前端端口的成对列表 |
预览 | HighSnatPortUsage | 警告 | 当后端实例从单个前端 IP 使用了超过 75% 的已分配端口时,此事件在每个后端实例级别上发布。 | 点播 | 5 分钟 | 后端 IP 地址,前端 IP 地址 |
预览 | SnatPortExhaustion | 严重 | 此事件在每个后端实例级别上发布。 当后端实例耗尽所有分配的端口,并使任何进一步的出站连接失败时,会发布事件。 此事件一直持续到端口被释放或更多端口被分配。 | 点播 | 5 分钟 | 后端 IP 地址,前端 IP 地址 |
若要详细了解随每个运行状况事件日志发布的属性,请查看 Azure Log Analytics 参考文档上的日志表 ALBHealthEvent。
在本文中,你学习了 Azure 负载均衡器运行状况事件日志和运行状况事件类型。
若要详细了解如何使用这些日志收集、分析和创建警报,并详细了解如何对每种运行状况事件类型进行故障排除,请参阅: