你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

可靠性建议

Azure 顾问可帮助确保并提高业务关键应用程序的连续性。 可以在顾问仪表板的“可靠性”选项卡上获取可靠性建议。

  1. 登录到 Azure 门户

  2. 在任意页面中搜索并选择顾问

  3. 在顾问仪表板中,选择“可靠性”选项卡。

AI 服务

即将超过 2 GB 的存储配额。 创建标准搜索服务

即将超过 2 GB 的存储配额。 创建标准搜索服务。 超过存储配额时,索引操作将停止工作。

详细了解 Azure AI 搜索中的服务限制

即将超过 50 MB 的存储配额。 创建基本或标准搜索服务

即将超过 50 MB 的存储配额。 创建基本或标准搜索服务。 超过存储配额时,索引操作将停止工作。

详细了解 Azure AI 搜索中的服务限制

即将超过可用存储配额。 如果需要更多存储,请添加更多分区

即将超过可用存储配额。 如果需要更多存储,请添加额外的分区。 超过存储配额后,仍可以进行查询,但索引操作将不再有效。

详细了解 Azure AI 搜索中的服务限制

此资源已超出配额

我们检测到你的资源已超出配额。 可以等待配额自动快速补充,或者马上取消阻止并再次使用资源,可以将其升级到付费 SKU。

详细了解 认知服务 - CognitiveServiceQuotaExceeded(超出此资源的配额)

升级应用程序以使用 Azure OpenAI 中的最新 API 版本

我们检测到你有一个 Azure OpenAI 资源,该资源正与较旧的 API 版本一起使用。 请使用最新的 REST API 版本来利用最新的特性和功能。

详细了解 认知服务 - CogSvcApiVersionOpenAI(升级应用程序以使用 Azure OpenAI 中的最新 API 版本)

升级应用程序以使用 Azure OpenAI 中的最新 API 版本

我们检测到你有一个 Azure OpenAI 资源,该资源正与较旧的 API 版本一起使用。 请使用最新的 REST API 版本来利用最新的特性和功能。

详细了解 认知服务 - API 版本:OpenAI(升级应用程序以使用 Azure OpenAI 中的最新 API 版本)

分析

运行 Ubuntu 16.04 的群集不受支持

我们检测到 HDInsight 群集仍在使用 Ubuntu 16.04 LTS。 已于 2022 年 11 月 30 日开始终止对 Ubuntu 16.04 LTS 上的 Azure HDInsight 群集的支持。 现有群集将在没有 Microsoft 支持的情况下按原样运行。 请考虑使用最新的映像重新生成群集。

详细了解 HDInsight 群集 - ubuntu1604HdiClusters(运行 Ubuntu 16.04 的群集不受支持)

升级 HDInsight 群集

我们检测到群集未使用最新映像。 我们建议客户使用最新版本的 HDInsight 映像,因为它们附带了最好的开放源代码更新、Azure 更新和安全修补程序。 HDInsight 版本每隔 30 到 60 天发布一次。 请考虑移动到最新版本。

详细了解 HDInsight 群集 - upgradeHDInsightCluster(升级 HDInsight 群集)

群集是在一年前创建的

我们检测到你的群集是在一年前创建的。 作为最佳做法的一部分,我们建议使用最新的 HDInsight 映像,因为它们附带了最好的开放源代码更新、Azure 更新和安全修补程序。 在六个月内(建议的最长间隔时间)升级群集。

详细了解 HDInsight 群集 - clusterOlderThanAYear(群集是一年前创建的)

Kafka 群集磁盘几乎已满

HDInsight 群集中供 Kafka 代理使用的数据磁盘几乎已满。 发生这种情况时,Apache Kafka 代理进程将因磁盘已满错误而无法启动并出现故障。 若要缓解此问题,请查找每个 Kafka 主题的保留时间,备份较旧的文件并重启代理。

详细了解 HDInsight 群集 - KafkaDiskSpaceFull(Kafka 群集磁盘几乎已满)

在自定义虚拟网络下创建群集需要更多权限

具有自定义虚拟网络的群集是在没有虚拟网络加入权限的情况下创建的。 确保执行创建操作的用户在 2023 年 9 月 30 日之前有权访问 Microsoft.Network/virtualNetworks/subnets/join 操作。

详细了解 HDInsight 群集 - EnforceVNetJoinPermissionCheck(在自定义 VNet 下创建群集需要更多权限)

弃用 HDInsight 4.0 Kafka 群集中的 Kafka 1.1

从 2020 年 7 月 1 日开始,你将无法使用 HDInsight 4.0 上的 Kafka 1.1 创建新的 Kafka 群集。 现有群集将在没有 Microsoft 支持的情况下按原样运行。 请考虑在 2020 年 6 月 30 日之前转移到 HDInsight 4.0 上的 Spark 2.1,避免出现潜在的系统/支持中断。

详细了解 HDInsight 群集 - KafkaVersionRetirement(在 HDInsight 4.0 Kafka 群集中弃用 Kafka 1.1)

弃用 HDInsight Spark 群集中较旧的 Spark 版本

从 2020 年 7 月 1 日开始,你将无法使用 HDInsight 3.6 上的 Spark 2.1 和 2.2 以及 HDInsight 4.0 上 的 Spark 2.3 创建新的 Spark 群集。 现有群集将在没有 Microsoft 支持的情况下按原样运行。

详细了解 HDInsight 群集 - SparkVersionRetirement(在 HDInsight Spark 群集中弃用较旧的 Spark 版本)

启用要应用于 HDInsight 群集的关键更新

HDInsight 服务正在将与重要证书相关的更新应用于群集。 但订阅中的一个或多个策略阻止 HDInsight 服务创建或修改与群集相关的网络资源,并阻止应用此更新。 在 2021 年 1 月 13 日下午 05:00 UTC 之前采取相关措施,以允许 HDInsight 服务创建或修改与群集相关的网络资源(如负载均衡器、网络接口和公共 IP 地址)。 HDInsight 团队在 2021 年 1 月 13 日下午 05:00 UTC 到 2021 年 1 月 16 日下午 05:00 UTC 之间进行更新。 未能应用此更新可能会导致群集运行不正常和不可用。

详细了解 HDInsight 群集 - GCSCertRotation(启用要应用于 HDInsight 群集的关键更新)

删除并重新创建 HDInsight 群集以应用关键更新

HDInsight 服务已尝试在所有正在运行的群集上应用关键证书更新。 但由于某些自定义配置更改,我们无法在你的某些群集上应用证书更新。

详细了解 HDInsight 群集 - GCSCertRotationRound2(删除并重新创建 HDInsight 群集以应用关键更新)

删除并重新创建 HDInsight 群集以应用关键更新

HDInsight 服务已尝试在所有正在运行的群集上应用关键证书更新。 但由于某些自定义配置更改,我们无法在你的某些群集上应用证书更新。 在 2021 年 1 月 25 日之前删除并重新创建群集,以防止群集运行不正常和无法使用。

详细了解 HDInsight 群集 - GCSCertRotationR3DropRecreate(删除并重新创建 HDInsight 群集以应用关键更新)

将关键更新应用于 HDInsight 群集

HDInsight 服务已尝试在所有正在运行的群集上应用关键证书更新。 但订阅中的一个或多个策略阻止 HDInsight 服务创建或修改与群集相关的网络资源,并阻止应用更新。 移除或更新策略分配,以允许 HDInsight 服务创建或修改与群集关联的网络资源。 当 HDInsight 团队在 2021 年 1 月 21 日下午 05:00 UTC 到 2021 年 1 月 23 日下午 05:00 UTC 之间进行更新时,在 2021 年 1 月 21 日下午 05:00 UTC 之前更改策略分配。 若要验证策略更新,可以尝试在群集所在的同一资源组和子网中创建网络资源。 未能应用此更新可能会导致群集运行不正常和不可用。 还可以在 2021 年 1 月 25 日之前删除并重新创建群集,以防止群集运行不正常和无法使用。 如果未能将更新应用到群集,HDInsight 服务将发送另一个通知。

详细了解 HDInsight 群集 - GCSCertRotationR3PlanPatch(将关键更新应用于 HDInsight 群集)

所需操作:在 2021 年 3 月 1 日前迁移 A8–A11 HDInsight 群集

你收到此通知是因为你有一个或多个活动的 A8、A9、A10 或 A11 HDInsight 群集。 A8-A11 虚拟机 (VM) 于 2021 年 3 月 1 日在所有区域停用。 在该日期之后,所有使用 A8-A11 的群集都已解除分配。 请在该日期之前将受影响的群集迁移到另一个 HDInsight 支持的 VM (https://azure.microsoft.com/pricing/details/hdinsight/)。 如需更多信息,请参阅“了解更多”链接或通过 askhdinsight@microsoft.com 与我们联系

详细了解 HDInsight 群集 - VM Deprecation(需要的操作:在 2021 年 3 月 1 日前,迁移 A8–A11 HDInsight 群集)

计算

云服务(经典)即将停用。 在 2024 年 8 月 31 日之前迁移

云服务(经典)即将停用。 在 2024 年 8 月 31 日之前迁移以避免数据丢失或影响业务连续性。

详细了解资源 - 云服务停用(云服务 (经典) 即将停用。在 2024 年 8 月 31 日之前迁移)

将附加到支持高级磁盘的 VM 的标准磁盘升级为高级磁盘

我们发现你在支持高级磁盘的虚拟机中使用标准磁盘。建议将标准磁盘升级到高级磁盘。 对于所有操作系统磁盘和数据磁盘都使用高级存储的单一实例虚拟机,我们保证虚拟机连接率至少达到 99.9%。 在做出升级决策时,请考虑这些因素。 第一个因素是,升级需要 VM 重启,此过程需要 3-5 分钟才能完成。 第二个因素是,如果列表中的 VM 是关键的生产 VM,则请对照高级磁盘的成本来评估改善的可用性。

详细了解 虚拟机 - MigrateStandardStorageAccountToPremium(将连接到支持高级的 VM 的标准磁盘升级为高级磁盘)

启用虚拟机复制,使应用程序免受区域性服务中断的影响

因未启用复制而不能复制到另一区域的虚拟机在出现区域性服务中断时无法复原。 进行虚拟机复制可以显著降低 Azure 区域中断期间的任何不利业务影响。 强烈建议为以下列表中所有业务关键型虚拟机启用复制,这样就可以在服务中断时快速启动偏远 Azure 区域中的虚拟机。 详细了解虚拟机 - ASRUnprotectedVMs(启用虚拟机复制以避免应用程序受到区域中断影响)

将 VM 从高级非托管磁盘升级到托管磁盘,无需额外付费

我们发现你的 VM 在使用高级非托管磁盘,这种磁盘可以迁移到托管磁盘,无需额外付费。 Azure 托管磁盘提供更高的复原能力、简化的服务管理、更高的缩放目标,以及更多可选的磁盘类型。 可以在不到 5 分钟的时间内通过门户完成此升级。

详细了解虚拟机 - UpgradeVMToManagedDisksWithoutAdditionalCost(将 VM 从高级非托管磁盘升级到托管磁盘,无需支付额外费用)

将出站连接协议更新为 Azure Site Recovery 的服务标记

使用基于 IP 地址的筛选已被认为是控制防火墙出站连接的一种易受攻击的方法。 建议使用服务标记作为控制连接的替代方法。 我们强烈建议使用服务标记,以允许连接到计算机的 Azure Site Recovery 服务。

详细了解虚拟机 - ASRUpdateOutboundConnectivityProtocolToServiceTags(将出站连接协议更新为 Azure Site Recovery 的服务标记)

更新防火墙配置以允许新的 RHUI 4 IP

虚拟机规模集将于 2023 年 10 月 12 日开始从 RHUI4 服务器接收包内容。 如果允许 RHUI 3 IP [https://aka.ms/rhui-server-list] 通过防火墙和代理,则允许新的 RHUI 4 IP [https://aka.ms/rhui-server-list] 继续接收 RHEL 包更新。

详细了解 虚拟机 - Rhui3ToRhui4MigrationV2(更新防火墙配置以允许新的 RHUI 4 IP)

订阅中的虚拟机在已计划弃用的映像上运行

订阅中的虚拟机在已计划弃用的映像上运行。 弃用映像后,无法从已弃用的映像创建新的 VM。 升级到映像的较新版本,以防止工作负载中断。

详细了解虚拟机 - VMRunningDeprecatedOfferLevelImage(订阅中的虚拟机在计划弃用的映像上运行)

订阅中的虚拟机在已计划弃用的映像上运行

订阅中的虚拟机在已计划弃用的映像上运行。 弃用映像后,无法从已弃用的映像创建新的 VM。 升级到映像的较新 SKU,以防止工作负载中断。

详细了解虚拟机 - VMRunningDeprecatedPlanLevelImage(订阅中的虚拟机在计划弃用的映像上运行)

订阅中的虚拟机在已计划弃用的映像上运行

订阅中的虚拟机在已计划弃用的映像上运行。 弃用映像后,无法从已弃用的映像创建新的 VM。 升级到映像的较新版本,以防止工作负载中断。

详细了解虚拟机 - VMRunningDeprecatedImage(订阅中的虚拟机在计划弃用的映像上运行)

使用可用性区域提高复原能力和可用性

数据中心发生故障时,Azure 中的可用性区域 (AZ) 可帮助保护应用程序和数据。 每个 AZ 由一个或多个数据中心组成,这些数据中心配置了独立电源、散热设备和网络。 通过设计使用区域性 VM 的解决方案,可以将 VM 与任何其他区域中的故障隔离开来。

详细了解 虚拟机 - AvailabilityZoneVM(使用可用性区域提高复原能力和可用性)

使用托管磁盘提高数据可靠性

具有共享存储帐户或存储缩放单元的磁盘的可用性集中的虚拟机在中断期间不可对单个存储规模单元故障进行复原。 迁移到 Azure 托管磁盘以确保可用性集中的不同 VM 的磁盘彼此完全独立,以避免单点故障。

详细了解可用性集 - ManagedDisksAvSet(使用托管磁盘来提高数据可靠性)

Azure 虚拟桌面环境缺少对必需的 URL 的访问权限

为使会话主机正确部署和注册到 Azure 虚拟桌面,需要将一组 URL 添加到允许列表,以防虚拟机在受限环境中运行。 访问“了解详细信息”链接后,你将看到成功部署和运行会话主机所需取消阻止的 URL 的最小列表。 对于允许列表中缺少的特定 URL,也可以在应用程序事件日志中搜索事件 3702。

详细了解虚拟机 - SessionHostNeedsAssistanceForUrlCheck(访问 Azure 虚拟桌面环境中缺少的必需 URL)

更新防火墙配置以允许新的 RHUI 4 IP

虚拟机规模集将于 2023 年 10 月 12 日开始从 RHUI4 服务器接收包内容。 如果允许 RHUI 3 IP [https://aka.ms/rhui-server-list] 通过防火墙和代理,则允许新的 RHUI 4 IP [https://aka.ms/rhui-server-list] 继续接收 RHEL 包更新。

详细了解 虚拟机规模集 - Rhui3ToRhui4MigrationVMSS(更新防火墙配置以允许新的 RHUI 4 IP)

订阅中的虚拟机规模集在已计划弃用的映像上运行

订阅中的虚拟机规模集在已计划弃用的映像上运行。 映像弃用后,虚拟机规模集工作负载将不再横向扩展。升级到映像的较新版本,以防止工作负载中断。

详细了解虚拟机规模集 - VMScaleSetRunningDeprecatedOfferImage(订阅中的虚拟机规模集在计划弃用的映像上运行)

订阅中的虚拟机规模集在已计划弃用的映像上运行

订阅中的虚拟机规模集在已计划弃用的映像上运行。 弃用映像后,虚拟机规模集工作负载将不再横向扩展。升级到映像的较新版本,以防止工作负载中断。

详细了解虚拟机规模集 - VMScaleSetRunningDeprecatedImage(订阅中的虚拟机规模集在计划弃用的映像上运行)

订阅中的虚拟机规模集在已计划弃用的映像上运行

订阅中的虚拟机规模集在已计划弃用的映像上运行。 映像弃用后,虚拟机规模集工作负载将不再横向扩展。升级到映像的较新计划,以防止工作负载中断。

详细了解虚拟机规模集 - VMScaleSetRunningDeprecatedPlanImage(订阅中的虚拟机规模集在计划弃用的映像上运行)

容器

增加容器应用的最小副本计数

我们检测到为容器应用设置的最小副本计数可能低于最佳值。 请考虑增加该最小副本计数,以提高可用性。

详细了解 Microsoft App Container App - ContainerAppMinimalReplicaCountTooLow(增加容器应用的最小副本数)

续订自定义域证书

我们检测到你上传的自定义域证书即将过期。 续订证书并为容器应用上传新证书。

详细了解 Microsoft App Container App - ContainerAppCustomDomainCertificateNearExpiration(续订自定义域证书)

Azure 容器应用环境中发现了潜在的网络问题,需要重新创建以避免 DNS 问题

Azure 容器应用环境中发现了潜在网络问题。 若要防止此潜在网络问题,请创建新的 Azure 容器应用环境,在新环境中重新创建容器应用,并删除旧的容器应用环境

详细了解 托管环境 - CreateNewContainerAppsEnvironment(容器应用环境中发现了一个潜在的网络问题,需要重新创建它以避免 DNS 问题)

续订应用服务证书需要域验证

你有一个当前处于“挂起的颁发”状态的 Azure 应用服务证书,需要域验证。 未能验证域所有权会导致证书颁发失败。 不会自动对 Azure 应用服务证书进行域验证,需要你的操作。

详细了解应用服务证书 - ASCDomainVerificationRequired(续订应用服务证书需要域验证)

群集有节点池使用不推荐的 B 系列

群集有一个或多个节点池使用不推荐的可突发 VM SKU。 使用可突发 VM 时,不保证 100% 的完整 vCPU 功能。 请确保 B 系列 VM 不在生产环境中使用。

详细了解 Kubernetes 服务 - ClustersUsingBSeriesVMs(具有节点池、使用非推荐的 B 系列的群集)

为任务关键型和生产群集升级到标准层

此群集有超过 10 个节点,并且未启用标准层。 免费层上 Kubernetes 控制平面的资源有限,不适用于生产用途,也不适用于具有 10 个或更多节点的任何群集。

详细了解 Kubernetes 服务 - UseStandardpricingtier(升级到任务关键型群集和生产群集的标准层)

建议使用 Pod 中断预算。 提高服务高可用性。

详细了解 Kubernetes 服务 - PodDisruptionBudgetsRecommended(建议的 Pod 中断预算)

升级到已启用 Azure Arc 的 Kubernetes 最新代理版本

升级到最新代理版本,获取已启用 Azure Arc 的 Kubernetes 的最佳体验、更卓越的稳定性和新功能。

详细了解 Kubernetes - Azure Arc - 启用 Arc 的 K8s 代理版本升级(升级到启用 Azure Arc 的 Kubernetes 的最新代理版本)

数据库

复制 - 向当前没有主键的表添加一个主键

根据我们的内部监视,我们观察到副本服务器上存在明显的复制延迟。 出现这种延迟的原因是是,副本服务器正在重播缺少主键的表上的中继日志。 若要确保副本可以与主服务器同步并跟上更改,请将主键添加到主服务器中的表。 添加主键后,重新创建副本服务器。

详细了解 Azure Database for MySQL 灵活服务器 - MySqlFlexibleServerReplicaMissingPKfb41(复制 - 将主键添加到当前没有主键的表)

高可用性 - 向当前没有主键的表添加一个主键

我们的内部监视系统已发现高可用性备用服务器上存在明显的复制滞后。 备用服务器在缺少主键的表上重播中继日志是滞后的主要原因。 若要解决此问题并遵循最佳做法,建议向所有表添加主键。 添加主键后,继续禁用,然后重新启用高可用性以缓解此问题。

详细了解 Azure Database for MySQL 灵活服务器 - MySqlFlexibleServerHAMissingPKcf38(高可用性 - 将主键添加到当前没有主键的表。)

可用性可能会受到高内存碎片的影响。 增加碎片内存预留来避免

碎片和内存压力可能会导致在故障转移或管理操作期间发生可用性事件。 在高内存压力下运行时,增加用于碎片的内存预留有助于减少缓存故障。 可以通过“高级设置”选项区域中提供的 maxfragmentationmemory-reserved 设置来增加用于碎片的内存。

详细了解 Redis 缓存服务器 - RedisCacheMemoryFragmentation(高内存碎片可能会影响可用性。增加碎片内存预留,以避免潜在影响。)

为虚拟机上的 SQL 启用 Azure 备份

使用 Azure 备份为虚拟机上的 SQL 数据库启用备份,并通过 SQL AG 集成实现零基础结构备份、时间点还原和集中管理的优势。

详细了解 SQL 虚拟机 - EnableAzBackupForSQL(在虚拟机上为 SQL 启用 Azure 备份)

通过删除非活动逻辑复制槽来提高 PostgreSQL 可用性

我们的内部系统表明你的 PostgreSQL 服务器可能具有非活动逻辑复制槽。 这需要立即注意。 由于 WAL 文件保留和快照文件的生成,非活动的逻辑复制可能会导致服务器性能下降和服务不可用。 为了提高性能和可用性,我们强烈建议立即采取措施。 删除非活动复制槽,或开始从这些槽中使用更改,以便槽的日志序列号 (LSN) 前进并接近服务器的当前 LSN。

详细了解 PostgreSQL 服务器 - OrcasPostgreSqlLogicalReplicationSlots(通过删除非活动逻辑复制槽来提高 PostgreSQL 可用性)

通过删除非活动逻辑复制槽来提高 PostgreSQL 可用性

我们的内部系统表明你的 PostgreSQL 灵活服务器可能具有非活动逻辑复制槽。 这需要立即注意。 由于 WAL 文件保留和快照文件的生成,非活动的逻辑复制槽可能会导致服务器性能下降和服务不可用。 为了提高性能和可用性,我们强烈建议立即采取措施。 删除非活动复制槽,或开始从这些槽中使用更改,以便槽的日志序列号 (LSN) 前进并接近服务器的当前 LSN。

详细了解 Azure Database for PostgreSQL 灵活服务器 - OrcasPostgreSqlFlexibleServerLogicalReplicationSlots(通过删除非活动逻辑复制槽来提高 PostgreSQL 可用性)

在 Azure Cosmos DB 容器上配置“一致”索引模式

我们注意到你的 Azure Cosmos DB 容器已配置为迟缓索引模式,这可能会影响查询结果的新鲜度。 建议切换到一致模式。

详细了解 Azure Cosmos DB 帐户 - CosmosDBLazyIndexing(在 Azure Cosmos DB 容器上配置一致的索引模式)

将旧版 Azure Cosmos DB SDK 升级到最新版本

Azure Cosmos DB 帐户使用的是旧版本的 SDK。 建议升级到最新版本,以获取最新修补程序、性能改进和新功能。

详细了解 Azure Cosmos DB 帐户 - CosmosDBUpgradeOldSDK(将旧的 Azure Cosmos DB SDK 升级为最新版本)

将过时的 Azure Cosmos DB SDK 升级到最新版本

Azure Cosmos DB 帐户使用的是过时的 SDK 版本。 建议升级到最新版本,以获取最新修补程序、性能改进和新功能。

详细了解 Azure Cosmos DB 帐户 - CosmosDBUpgradeOutdatedSDK(将过时的 Azure Cosmos DB SDK 升级为最新版本)

为 Azure Cosmos DB 容器配置分区键

Azure Cosmos DB 的非分区集合正在接近其预配的存储配额。 将这些集合迁移到具有分区键定义的新集合,以便服务可以自动横向扩展它们。

详细了解 Azure Cosmos DB 帐户 - CosmosDBFixedCollections(使用分区键配置 Azure Cosmos DB 容器)

将 Azure Cosmos DB for MongoDB 帐户升级到 v4.0 版本,以节省查询/存储成本并利用新功能

你的 Azure Cosmos DB for MongoDB 帐户符合升级到版本 4.0 的条件。 通过升级到 v4.0 新存储格式,将存储成本最多降低 55%,将查询成本最多降低 45%。 v4.0 还包括许多其他功能,例如多文档事务。

详细了解 Azure Cosmos DB 帐户 - CosmosDBMongoSelfServeUpgrade(将 Azure Cosmos DB for MongoDB 帐户升级为 v4.0 来节省查询/存储成本并利用新功能)

向 Azure Cosmos DB 上的生产工作负载再添加一个区域

根据其名称和配置,我们检测到列为可能用于生产工作负载的 Azure Cosmos DB 帐户。 这些帐户当前在一个 Azure 区域中运行。 将它们配置到至少两个 Azure 区域中,即可提高它们的可用性。

注意

额外的区域将产生额外的成本。

详细了解 Azure Cosmos DB 帐户 - CosmosDBSingleRegionProdAccounts(将第二个区域添加到 Azure Cosmos DB 上的生产工作负载)

在 Azure Cosmos DB for MongoDB 帐户上启用服务器端重试 (SSR)

我们观察到你的帐户正在引发 TooManyRequests 错误,错误代码为 16500。 启用服务器端重试 (SSR) 有助于缓解此问题。

详细了解 Azure Cosmos DB 帐户 - CosmosDBMongoServerSideRetries(在 Azure Cosmos DB for MongoDB 帐户上启用服务器端重试 [SSR])

将 Azure Cosmos DB for MongoDB 帐户迁移到 v4.0 版本,以节省查询/存储成本并利用新功能

将数据库帐户迁移到一个新的数据库帐户来使用 Azure Cosmos DB for MongoDB v4.0。 通过升级到 v4.0 新存储格式,将存储成本最多降低 55%,将查询成本最多降低 45%。 v4.0 还包括许多其他功能,例如多文档事务。 升级时,还必须将现有帐户中的数据迁移到使用版本 4.0 创建的新帐户中。 可借助 Azure 数据工厂或 Studio 3T 迁移数据。

详细了解 Azure Cosmos DB 帐户 - CosmosDBMongoMigrationUpgrade(将 Azure Cosmos DB for MongoDB 帐户迁移到 v4.0 来节省查询/存储成本并利用新功能)

你的 Azure Cosmos DB 帐户无法访问其链接的托管加密密钥的 Azure Key Vault

密钥保管库的配置似乎阻止 Azure Cosmos DB 帐户连接到密钥保管库来访问托管加密密钥。 如果最近执行了密钥轮换,请确保以前的密钥或密钥版本保持启用状态并且可用,直到 Azure Cosmos DB 完成轮换。 可以在 24 小时后禁用以前的密钥或密钥版本,也可以在 Azure Key Vault 审核日志不再显示该密钥或密钥版本 Azure Cosmos DB 中的活动之后禁用。

详细了解 Azure Cosmos DB 帐户 - CosmosDBKeyVaultWrap(你的 Azure Cosmos DB 帐户未能访问链接的托管加密密钥的 Azure Key Vault)

避免从元数据操作限制速率

我们发现,你帐户上的元数据操作次数过多。 Azure Cosmos DB 中的数据(包括有关数据库和集合的元数据)分布在多个分区中。 元数据操作具有系统保留的请求单位 (RU) 限制。 大量元数据操作可能会导致速率限制。 通过在代码中使用静态 Azure Cosmos DB 客户端实例并缓存数据库和集合的名称,可避免速率限制。

详细了解 Azure Cosmos DB 帐户 - CosmosDBHighMetadataOperations(避免因元数据操作而限制速率)

使用新的 3.6+ 终结点连接到升级后的 Azure Cosmos DB for MongoDB 帐户

我们发现,你的一些应用程序正在使用旧的 3.2 终结点 [accountname].documents.azure.com 连接到升级后的 Azure Cosmos DB for MongoDB 帐户。 请使用新的终结点 [accountname].mongo.cosmos.azure.com(或主权云、政府云或受限云中的等效终结点)。

详细了解 Azure Cosmos DB 帐户 - CosmosDBMongoNudge36AwayFrom32(使用新的 3.6+ 终结点连接到升级后的 Azure Cosmos DB for MongoDB 帐户)

升级到 2.6.14 版 Async Java SDK v2 以避免出现严重问题,或者升级到 Java SDK v4,因为 Async Java SDK v2 即将弃用

Azure Cosmos DB Async Java SDK v2 版本 2.6.13 及更低版本中存在一个严重 bug,当全局逻辑序列号 (LSN) 大于“最大整数”值时会导致错误。 在 Azure Cosmos DB 容器的生存期内发生大量事务后,会发生这些服务错误。 注意:Async Java SDK v2 存在一个关键修补程序,但我们仍强烈建议你迁移到 Java SDK v4

详细了解 Azure Cosmos DB 帐户 - CosmosDBMaxGlobalLSNReachedV2(升级到 2.6.14 版 Async Java SDK v2 以避免出现严重问题,或者升级到 Java SDK v4,因为 Async Java SDK v2 即将被弃用)

Azure Cosmos DB Java SDK v4 版本 4.15 及更低版本中存在一个严重 bug,当全局逻辑序列号 (LSN) 大于“最大整数”值时会导致错误。 在 Azure Cosmos DB 容器的生存期内发生大量事务后,会发生这些服务错误。

详细了解 Azure Cosmos DB 帐户 - CosmosDBMaxGlobalLSNReachedV4(升级到 Java SDK v4 的当前建议版本以避免出现严重问题)

集成

升级到最新的 FarmBeats API 版本

我们发现了对已计划弃用的 FarmBeats API 版本的调用。 建议切换到最新的 FarmBeats API 版本,以确保不间断地访问 FarmBeats、最新功能并改进性能。

详细了解 Azure FarmBeats - FarmBeatsApiVersion(对最新的 FarmBeats API 版本的更新)

升级到最新的 ADMA Java SDK 版本

我们发现了对计划弃用的适用于农业的 Azure 数据管理器 (ADMA) Java SDK 版本的调用。 建议切换到最新的 SDK 版本,以确保不间断地访问 ADMA、最新功能并改进性能。

详细了解 Azure FarmBeats - FarmBeatsJavaSdkVersion(对最新的 ADMA Java SDK 版本的更新)

升级到最新的 ADMA DotNet SDK 版本

我们发现了对已计划弃用的 ADMA DotNet SDK 版本的调用。 建议切换到最新的 SDK 版本,以确保不间断地访问 ADMA、最新功能并改进性能。

详细了解 Azure FarmBeats - FarmBeatsDotNetSdkVersion(对最新的 ADMA DotNet SDK 版本的更新)

升级到最新的 ADMA JavaScript SDK 版本

我们发现了对已计划弃用的 ADMA JavaScript SDK 版本的调用。 建议切换到最新的 SDK 版本,以确保不间断地访问 ADMA、最新功能并改进性能。

详细了解 Azure FarmBeats - FarmBeatsJavaScriptSdkVersion(对最新的 ADMA JavaScript SDK 版本的更新)

升级到最新的 ADMA Python SDK 版本

我们发现了对已计划弃用的 ADMA Python SDK 版本的调用。 建议切换到最新的 SDK 版本,以确保不间断地访问 ADMA、最新功能并改进性能。

详细了解 Azure FarmBeats - FarmBeatsPythonSdkVersion(对最新的 ADMA Python SDK 版本的更新)

SSL/TLS 重新协商受阻

SSL/TLS 重新协商尝试受阻。 当通过已建立的连接请求客户端证书时,会进行重新协商。 当重新协商受阻时,读取策略表达式中的“context.Request.Certificate”将返回“null”。 若要支持客户端证书身份验证方案,请对列出的主机名启用“协商客户端证书”。 对于基于浏览器的客户端,启用此选项可能会导致向客户端显示证书提示。

详细了解 API 管理 - TlsRenegotiationBlocked(已阻止 SSL/TLS 重新协商)

主机名证书轮换失败

API 管理服务未能从 Key Vault 刷新主机名证书。 确保 Key Vault 中存在证书且 API 管理服务标识具有机密读取访问权限。 否则,API 管理服务将无法从 Key Vault 检索证书更新,这可能会导致使用过时证书的服务和运行时 API 流量遭到阻止。

详细了解 API 管理 - HostnameCertRotationFail(主机名证书轮换失败)

物联网

将设备客户端 SDK 升级到 Iot 中心的受支持版本

部分或全部设备正在使用过时的 SDK,建议升级到受支持的 SDK 版本。 请参阅建议中的详细信息。

详细了解 IoT 中心 - UpgradeDeviceClientSdk(将设备客户端 SDK 升级为 IoT 中心支持的版本)

检测到 IoT 中心潜在设备风暴

当至少两个设备尝试使用相同的设备 ID 凭据连接到 Azure IoT 中心时,就可能发生设备风暴。 当第二个设备 (B) 进行连接时,会导致第一个设备 (A) 断开连接。 然后 (A) 尝试再次重新连接,这会导致 (B) 断开连接。

详细了解 IoT 中心 - IoTHubDeviceStorm(检测到 IoT 中心的潜在设备风暴)

将 Device Update for IoT Hub SDK 升级到受支持的版本

Device Update for IoT Hub 实例正在使用过时版本的 SDK。 建议升级到最新版本,以获取最新修补程序、性能改进和新功能。

详细了解 IoT 中心 - DU_SDK_Advisor_Recommendation(将 IoT 中心 SDK 的设备更新升级到受支持的版本)

检测到 IoT 中心超出配额

我们检测到你的 IoT 中心超出其每日消息配额。 若要防止 Azure IoT 中心将来超过其每日消息配额,请添加单位或增加 SKU 级别。

详细了解 IoT 中心 - IoTHubQuotaExceededAdvisor(检测到超出 IoT 中心配额)

将设备客户端 SDK 升级到 IoT 中心的受支持版本

部分或全部设备正在使用过时的 SDK,建议升级到受支持的 SDK 版本。 请参阅给定链接中的详细信息。

详细了解 IoT 中心 - UpgradeDeviceClientSdk(将设备客户端 SDK 升级为 IoT 中心支持的版本)

将 Microsoft Edge 设备运行时升级到受支持的 IoT 中心版本

部分或全部 Microsoft Edge 设备正在使用过时版本,建议升级到运行时的受支持的最新版本。 请参阅给定链接中的详细信息。

详细了解 IoT 中心 - UpgradeEdgeSdk(将 Microsoft Edge 设备运行时升级到受支持的 IoT 中心版本)

媒体

提高媒体服务的配额或限制,以确保服务的连续性

你的媒体帐户即将达到配额限制。 查看媒体帐户的资产的当前使用情况、内容密钥策略和流策略。 若要避免服务中断,请请求为接近配额限制的实体提高配额限制。 可以通过开具票证并向其添加相关详细信息来请求提高配额限制。 请不要创建额外 Azure 媒体帐户来提高配额上限。

详细了解媒体服务 - AccountQuotaLimit(提高媒体服务配额或上限以确保服务连续性。)

网络

Check Point 虚拟机可能会丢失网络连接

我们已确定,你的虚拟机正在运行的 Check Point 映像版本在平台服务操作期间可能会失去网络连接。 建议升级到较新版本的映像。 有关如何升级映像的详细说明,请联系 Check Point。

详细了解虚拟机 - CheckPointPlatformServicingKnownIssueA(检查点虚拟机可能丢失网络连接。)

升级到最新版的 Azure Connected Machine Agent

Azure Connected Machine Agent 会定期更新 bug 修补程序、稳定性增强功能和新功能。 将代理升级到最新版本,以获得最佳的 Azure Arc 体验。

详细了解 Connected Machine 代理 - Azure Arc - ArcServerAgentVersion(升级到 Azure Connected Machine 代理的最新版本)

将 Azure Front Door 客户证书的机密版本切换为“最新”

建议将 Azure Front Door (AFD) 客户证书机密配置为“最新”,以便 AFD 引用 Azure 密钥保管库中的最新机密版本,从而可以自动轮换机密。

详细了解 Front Door 配置文件 - SwitchVersionBYOC(将 Azure Front Door 客户证书的机密版本切换为“最新”)

通过将 DNS TXT 记录添加到 DNS 提供程序来验证域所有权。

通过将 DNS TXT 记录添加到 DNS 提供程序来验证域所有权。

详细了解 Front Door 配置文件 - ValidateDomainOwnership(通过将 DNS TXT 记录添加到 DNS 提供程序来验证域所有权。)

重新验证 Azure Front Door 托管证书续订的域所有权

Azure Front Door 无法自动续订托管证书,因为域不是映射到 AFD 终结点的 CNAME。 重新验证要自动续订的托管证书的域所有权。

详细了解 Front Door 配置文件 - RevalidateDomainOwnership(重新验证 Azure Front Door 托管证书续订的域所有权)

续订已到期的 Azure Front Door 客户证书以避免服务中断

Azure Front Door 标准版和高级版配置文件的某些客户证书已到期。 及时续订证书,以避免服务中断。

详细了解 Front Door 配置文件 - RenewExpiredBYOC(续订过期的 Azure Front Door 客户证书以避免服务中断。)

升级 SKU 或添加更多实例以确保容错

部署两个或更多中型或大型实例将在计划内或计划外维护导致服务中断时确保业务连续性。

详细了解如何使用 Azure 顾问提高应用程序的可靠性 - 确保应用程序网关容错

避免替代主机名以确保站点的完整性

在配置应用程序网关时,请尝试避免替代主机名。 如果在应用程序网关前端使用的域不同于访问后端所使用的域,可能会导致 Cookie 或重定向 URL 被破坏。 在所有情况下,不同的前端域不是问题,某些类别的后端(如 REST API)通常不太敏感。 确保后端能够应对域差异或更新应用程序网关配置,以便不需要在后端替代主机名。 在配合应用服务一起使用时,请将自定义域名附加到 Web 应用,并避免在后端使用 *.azurewebsites.net 主机名。

详细了解应用程序网关 - AppGatewayHostOverride(避免主机名替代以确保站点完整性)

Azure WAF RuleSet CRS 3.1/3.2 已使用 Log4j 2 漏洞规则进行更新

为了响应 Log4j 2 漏洞 (CVE-2021-44228),Azure Web 应用程序防火墙 (WAF) RuleSet CRS 3.1/3.2 已在应用程序网关上进行了更新,以帮助提供针对此漏洞的额外保护。 规则在规则 944240 下提供,无需执行任何操作即可启用它们。

详细了解应用程序网关 - AppGwLog4JCVEPatchNotification(Azure WAF RuleSet CRS 3.1/3.2 已更新 log4j2 漏洞规则)

用于缓解 Log4j 2 漏洞的额外保护 (CVE-2021-44228)

若要缓解 Log4j 2 漏洞产生的影响,建议执行以下步骤:

  1. 在后端服务器上将 Log4j 2 升级到版本 2.15.0。 如果无法升级,请按照提供的系统属性指导链接中的说明进行操作。
  2. 通过升级到 WAF SKU,利用 WAF 核心规则集 (CRS)。

详细了解应用程序网关 - AppGwLog4JCVEGenericNotification(用于缓解 Log4j2 漏洞的更多保护 (CVE-2021-44228))

更新应用程序网关用户的虚拟网络权限

若要提高安全性并在 Azure 中提供更一致的体验,所有用户都必须通过权限检查,然后才能在虚拟网络中创建或更新应用程序网关。 用户或服务主体必须至少包含 Microsoft.Network/virtualNetworks/subnets/join/action 权限。

详细了解应用程序网关 - AppGwLinkedAccessFailureRecmmendation(更新应用程序网关用户的 VNet 权限)

使用无版本密钥保管库机密标识符来引用证书

强烈建议使用无版本机密标识符,以允许应用程序网关资源在可用时总能自动检索新的证书版本。 示例: https://myvault.vault.azure.net/secrets/mysecret/

详细了解应用程序网关 - AppGwAdvisorRecommendationForCertificateUpdate(使用无版本密钥保管库机密标识符来引用证书)

在虚拟网络中实现多个 ExpressRoute 线路以确保跨界复原能力

我们检测到,你的 ExpressRoute 网关只有 1 条与之关联的 ExpressRoute 线路。 将一个或多个额外线路连接到网关,确保对等互连位置冗余和复原能力

详细了解虚拟网络网关 - ExpressRouteGatewayRedundancy(在虚拟网络中实现多个 ExpressRoute 线路以实现跨界复原)

在网络性能监视器上实现 ExpressRoute 监视器,以对 ExpressRoute 线路进行端到端监视

我们检测到,网络性能监视器上的 ExpressRoute 监视器当前未监视 ExpressRoute 线路。 ExpressRoute 监视器提供端到端监视功能,包括:从本地到 Azure 以及 Azure 到本地的丢失、延迟和性能

详细了解 ExpressRoute 线路- ExpressRouteGatewayE2EMonitoring(在网络性能监视器上实现 ExpressRoute 监视器以对 ExpressRoute 线路进行端到端监视)

使用 ExpressRoute Global Reach 改进灾难恢复的设计

你似乎在至少两个不同位置对等互连了 ExpressRoute 线路。 使用 ExpressRoute Global Reach 将它们相互连接,以允许流量在一个线路丢失连接的情况下继续在本地网络与 Azure 环境之间流动。 可以在同一地铁内或跨地铁的不同对等互连位置中的线路之间建立 Global Reach 连接。

详细了解 ExpressRoute 线路 - UseGlobalReachForDR(使用 ExpressRoute Global Reach 改进灾难恢复设计)

向配置文件再添加至少一个终结点(首选在另一 Azure 区域进行)

如果有一个终结点出现故障,则配置文件需要多个终结点以确保可用性。 我们还建议将终结点置于不同的区域。

详细了解流量管理器配置文件 - GeneralProfile(将至少一个终结点添加到配置文件,最好在另一个 Azure 区域)

将配置的终结点添加到“所有(全球)”

对于地理路线规划,流量将根据定义的区域路由到终结点。 当某个区域出现故障时,不会有任何预定义的故障转移。 如果某个终结点将区域分组配置为地理配置文件的“所有(世界)”,则可以避免流量黑洞,确保服务可用。

详细了解流量管理器配置文件 - GeographicProfile(添加一个配置为“所有(世界)”的终结点)

将一个终结点添加或移动到另一个 Azure 区域

与此邻近配置文件关联的所有终结点都位于同一区域。 尝试连接时,其他区域的用户可能会遇到长时间的延迟。 如果一个区域中的所有终结点都出现故障,则将一个终结点添加或移动到另一个区域可以提高邻近路由的整体性能并提供更好的可用性。

详细了解流量管理器配置文件 - ProximityProfile(添加一个终结点或将一个终结点移动到其他 Azure 区域)

从基本网关移到生产网关 SKU

VPN 网关基本 SKU 用于开发或测试场景。 如果出于生产目的使用 VPN 网关,请转到生产 SKU。 除了更高的稳定性和可用性,生产 SKU 还提供更多的隧道、BGP 支持、主动-主动、自定义 IPsec/IKE 策略。

详细了解虚拟网络网关 - BasicVPNGateway(从基本网关移动到生产网关 SKU)

使用用于出站连接的 NAT 网关

通过将 NAT 网关用于虚拟网络的出站流量,防止因 SNAT 端口耗尽而导致连接失败的风险。 NAT 网关会动态缩放,为发往 Internet 的流量提供安全连接。

详细了解虚拟网络 - natGateway(使用 NAT 网关进行出站连接)

更新应用程序网关用户的虚拟网络权限

若要提高安全性并在 Azure 中提供更一致的体验,所有用户都必须通过权限检查,然后才能在虚拟网络中创建或更新应用程序网关。 用户或服务主体必须至少包含 Microsoft.Network/virtualNetworks/subnets/join/action 权限。

详细了解应用程序网关 - AppGwLinkedAccessFailureRecmmendation(更新应用程序网关用户的 VNet 权限)

使用无版本密钥保管库机密标识符来引用证书

强烈建议使用无版本机密标识符,以允许应用程序网关资源在可用时总能自动检索新的证书版本。 示例: https://myvault.vault.azure.net/secrets/mysecret/

详细了解应用程序网关 - AppGwAdvisorRecommendationForCertificateUpdate(使用无版本密钥保管库机密标识符来引用证书)

启用主动-主动网关以确保冗余

在主动-主动配置中,VPN 网关的两个实例将建立连接到本地 VPN 设备的 S2S VPN 隧道。 当一个网关实例上发生计划内维护事件或计划外事件时,流量将自动切换到其他活动 IPsec 隧道。

详细了解虚拟网络网关 - VNetGatewayActiveActive(启用 Active-Active 网关以实现冗余)

使用托管 TLS 证书

由 Front Door 来管理 TLS 证书可降低运营成本,并帮助避免因忘记续订证书而导致代价高昂的中断。

了解有关使用托管 TLS 证书的详细信息。

当源组中只有一个源时禁用运行状况探测

如果只有单个源,则 Front Door 始终将流量路由到该源,即使其运行状况探测报告状态不正常。 运行状况探测的状态不会执行任何操作来更改 Front Door 的行为。 在此方案中,运行状况探测不提供权益,应禁用它们以减少源上的流量。

详细了解运行状况探测最佳做法

在 Azure Front Door 和源上使用同一域名

在 Web 应用程序的前面使用反向代理时,我们建议保留原始 HTTP 主机名。 在反向代理中使用与提供给后端应用程序服务器的主机名不同的主机名可能会导致 Cookie 或重定向 URL 无法正常工作。 例如,会话状态可能会丢失、身份验证可能失败,或者无意中将后端 URL 透露给最终用户。 可以通过保留初始请求的主机名来避免这些问题,以便应用程序服务器看到与 Web 浏览器相同的域。

了解有关在 Azure Front Door 和源上使用同一域名的详细信息。

适用于 Azure 的 SAP

在 SAP 工作负载的 ASCS HA 设置中启用 Pacemaker 配置中的“concurrent-fencing”参数

当 concurrent-fencing 参数设置为 true 时,允许并行执行隔离操作。 在 ASCS HA 设置的 pacemaker 群集配置中,将此参数设置为“true”。

详细了解中央服务器实例 - ConcurrentFencingHAASCSRH(在 SAP 工作负载的 ASCS HA 设置的 Pacemaker 配置中启用“concurrent-fencing”参数)

确保在 SAP 工作负载的 ASCS HA 设置中为 Pacemaker 配置启用 stonith

在 Pacemaker 群集中,使用 STONITH(“爆头”)资源实现节点级别隔离。 确保在 SAP 工作负载的 HA 群集配置中将“stonith-enable”设置为“true”。

详细了解中央服务器实例 - StonithEnabledHAASCSRH(确保为 SAP 工作负载中的 ASCS HA 设置中的 Pacemaker 配置启用 stonith)

在 SAP 工作负载的 ASCS HA 设置中,将群集配置的 stonith 超时设置为 144

根据关于 Azure 上的 SAP 的建议,将 HA 群集的 stonith 超时设置为 144。

详细了解中央服务器实例 - StonithTimeOutHAASCS(在 SAP 工作负载的 ASCS HA 设置中,将群集配置的 stonith 超时设置为 144)

将 Pacemaker 群集中的 corosync 令牌设置为 30000,以便在 SAP 工作负载中设置 ASCS HA

corosync 令牌设置确定在 HA 群集中直接使用或作为实际令牌超时计算基础的超时时间。 根据关于 Azure 上的 SAP 的建议将 corosync 令牌设置为 30000,以允许内存保留维护。

详细了解中央服务器实例 - CorosyncTokenHAASCSRH(对于 SAP 工作负载中的 ASCS HA 设置,将 Pacemaker 群集中的 corosync 令牌设置为 30000)

在 SAP 工作负载的 ASCS HA 设置中,将 Pacemaker 配置中的“预期投票”参数设置为 2

如果有两个节点 HA 群集,根据关于 Azure 上的 SAP 的建议,将仲裁投票设置为 2。

详细了解中央服务器实例 - ExpectedVotesHAASCSRH(在 SAP 工作负载的 ASCS HA 设置中,将 Pacemaker 配置中的“预期投票”参数设置为 2).

在 SAP 工作负载的 ASCS HA 设置中,将 Pacemaker 群集中的“token_retransmits_before_loss_const”设置为 10

corosync token_retransmits_before_loss_const 确定在 HA 群集中超时之前系统可以尝试重新传输令牌的次数。 根据 ASCS HA 设置的建议,将 totem.token_retransmits_before_loss_const 设置为 10。

详细了解中央服务器实例 - TokenRestransmitsHAASCSSLE(在 SAP 工作负载的 ASCS HA 设置中,将 Pacemaker 群集中的“token_retransmits_before_loss_const”设置为 10)

将 Pacemaker 群集中的 corosync 令牌设置为 30000,以便在 SAP 工作负载中设置 ASCS HA

corosync 令牌设置确定在 HA 群集中直接使用或作为实际令牌超时计算基础的超时时间。 根据关于 Azure 上的 SAP 的建议将 corosync 令牌设置为 30000,以允许内存保留维护。

详细了解中央服务器实例 - CorosyncTokenHAASCSSLE(对于 SAP 工作负载中的 ASCS HA 设置,将 Pacemaker 群集中的 corosync 令牌设置为 30000)

将 Pacemaker 群集中的“corosync max_messages”设置为 20,以便在 SAP 工作负荷中设置 ASCS HA

corosync max_messages 常数指定一个处理器在接收令牌时一次可以发送的最大消息数。 建议设置为 Pacemaker 群集配置中的 corosync 令牌参数的 20 倍。

详细了解中央服务器实例 - CorosyncMaxMessagesHAASCSSLE(对于 SAP 工作负载中的 ASCS HA 设置,将 Pacemaker 群集中的“corosync max_messages”令牌设置为 20)

将 Pacemaker 群集中的“corosync consensus”设置为 36000,以便在 SAP 工作负荷中设置 ASCS HA

corosync 参数“consensus”指定在启动群集配置中新一轮成员身份之前等待达成共识的时间(以毫秒为单位)。 建议设置为 ASCS HA 设置的 Pacemaker 群集配置中 corosync 令牌的 1.2 倍。

详细了解中央服务器实例 - CorosyncConsensusHAASCSSLE(对于 SAP 工作负载中的 ASCS HA 设置,将 Pacemaker 群集中的“corosync consensus”令牌设置为 36000)

在 SAP 工作负载的 ASCS HA 设置中,将群集配置中的“预期投票”参数设置为 2

在双节点 HA 群集中,根据 Azure 上的 SAP 建议将仲裁参数 expected_votes 设置为 2。

详细了解中央服务器实例 - ExpectedVotesHAASCSSLE(在 SAP 工作负载的 ASCS HA 设置中,将群集配置中的“预期投票”参数设置为 2)

在 SAP 工作负载的 ASCS HA 设置中,将群集配置中的“two_node”参数设置为 1

对于双节点 HA 群集,请根据 Azure 上的 SAP 建议将仲裁参数“two_node”设置为 1。

详细了解中央服务器实例 - TwoNodesParametersHAASCSSLE(在 SAP 工作负载的 ASCS HA 设置中,将群集配置中的 two_node 参数设置为 1)

将 Pacemaker 群集中的“corosync join”设置为 60,以便在 SAP 工作负荷中设置 ASCS HA

“corosync 加入超时”指定在成员身份协议中等待加入消息的时间(以毫秒为单位)。 建议在 ASCS HA 设置的 Pacemaker 群集配置中设置为 60。

详细了解中央服务器实例 - CorosyncJoinHAASCSSLE(对于 SAP 工作负载中的 ASCS HA 设置,将 Pacemaker 群集中的“corosync join”设置为 60)

确保在 SAP 工作负载的 ASCS HA 设置中为群集配置启用 stonith

在 Pacemaker 群集中,使用 STONITH(“爆头”)资源实现节点级别隔离。 确保在 HA 群集配置中将“stonith-enable”设置为“true”。

详细了解中央服务器实例 - StonithEnabledHAASCS(确保为 SAP 工作负载中的 ASCS HA 设置中的群集配置启用 stonith)

对于 ASCS HA 设置的 Azure 隔离代理,在 Pacemaker 配置将 stonth-timeout 设置为 900

将 stonith-timeout 设置为 900,以确保 ASCS HA 设置的 Pacemaker 功能可靠。 此 stonith-timeout 设置适用于通过托管标识或服务主体使用 Azure 隔离代理进行隔离的情况。

详细了解中央服务器实例 - StonithTimeOutHAASCSSLE(对于 ASCS HA 设置的 Azure 围栏代理,将 Pacemaker 配置中的 stonith-timeout 设置为 900)

在 SAP 工作负载的 ASCS HA 设置中启用 Pacemaker 配置中的“concurrent-fencing”参数

当 concurrent-fencing 参数设置为 true 时,允许并行执行隔离操作。 在 ASCS HA 设置的 pacemaker 群集配置中,将此参数设置为“true”。

详细了解中央服务器实例 - ConcurrentFencingHAASCSSLE(在 SAP 工作负载的 ASCS HA 设置的 Pacemaker 配置中启用“concurrent-fencing”参数)

在 Pacemaker 配置中为 SAP 工作负载中的 ASCS HA 设置创建 softdog 配置文件

softdog 计时器将作为内核模块加载到 linux OS 中。 如果此计时器检测到系统已挂起,则会触发系统重置。 确保在 Pacemaker 群集中为 ASCS HA 设置创建了 softdog 配置文件。

详细了解中央服务器实例 - SoftdogConfigHAASCSSLE(对于 SAP 工作负载中的 ASCS HA 设置,在 Pacemaker 配置中创建 softdog 配置文件)

确保在 SAP 工作负载中为 ASCS HA 设置中的 Pacemaler 加载 softdog 模块

softdog 计时器将作为内核模块加载到 linux OS 中。 如果此计时器检测到系统已挂起,则会触发系统重置。 首先确保已创建 softdog 配置文件,然后在 ASCS HA 设置的 Pacemaker 配置中加载 softdog 模块。

详细了解中央服务器实例 - softdogmoduleloadedHAASCSSLE(确保在 SAP 工作负载中的 ASCS HA 设置中,为 Pacemaker 加载了 softdog 模块)

确保在 ASCS HA 设置的 Pacemaker 配置中有一个 fence_azure_arm 实例

fence_azure_arm 是 Azure 资源管理器的 I/O 隔离代理。 确保在 ASCS HA 设置的 Pacemaker 配置中有一个 fence_azure_arm 实例。 该 fence_azure_arm 要求适用于通过托管标识或服务主体使用 Azure 隔离代理进行隔离的情况。

详细了解中央服务器实例 - FenceAzureArmHAASCSSLE(确保在 ASCS HA 设置的 Pacemaker 配置中,有一个 fence_azure_arm 实例)

在 Azure 负载均衡器中启用 HA 端口,以便在 SAP 工作负载中设置 ASCS HA

在负载均衡规则中启用 HA 端口,以便在 SAP 工作负载中进行 ASCS 实例的 HA 设置。 打开负载均衡器,选择“负载均衡规则”并添加/编辑规则以启用建议的设置。

详细了解中央服务器实例 - ASCSHAEnableLBPorts(在 SAP 工作负载中的 ASCS HA 设置中,在 Azure 负载均衡器中启用 HA 端口)

在 Azure 负载均衡器中启用浮动 IP,以便在 SAP 工作负载中设置 ASCS HA

在 Azure 负载均衡器的负载均衡规则中启用浮动 IP,以便在 SAP 工作负载中进行 ASCS 实例的 HA 设置。 打开负载均衡器,选择“负载均衡规则”并添加/编辑规则以启用建议的设置。

详细了解中央服务器实例 - ASCSHAEnableFloatingIpLB(在 SAP 工作负载中的 ASCS HA 设置中,在 Azure 负载均衡器中启用浮动 IP)

将 Azure 负载均衡器中的空闲超时设置为 30 分钟,以在 SAP 工作负载中设置 ASCS HA

若要防止负载均衡器超时,请确保所有 Azure 负载均衡规则中的“空闲超时(分钟)”设置为最大值 30 分钟。 打开负载均衡器,选择“负载均衡规则”并添加/编辑规则以启用建议的设置。

详细了解中央服务器实例 - ASCSHASetIdleTimeOutLB(对于 SAP 工作负载中的 ASCS HA 设置,将 Azure 负载均衡器中的空闲超时设置为 30 分钟)

在放置于 Azure 负载均衡器之后的 VM 上禁用 TCP 时间戳,以在 SAP 工作负载中设置 ASCS HA

在放置于 Azure 负载均衡器之后的 VM 上禁用 TCP 时间戳。 启用 TCP 的时间戳会导致运行状况探测因 VM 来宾 OS TCP 堆栈删除 TCP 数据包而失败。 删除的数据包会导致负载均衡器将终结点标记为停止。

详细了解中央服务器实例 - ASCSLBHADisableTCP(在 SAP 工作负载中的 ASCS HA 设置中,对放置于 Azure 负载均衡器后面的 VM 禁用 TCP 时间戳)

在已启用 HA 的 SAP 工作负载(用于具有 Redhat OS 的 VM)的群集配置中启用 stonith

在 Pacemaker 群集中,使用 STONITH(“爆头”)资源实现节点级别隔离。 确保在 SAP 工作负载的 HA 群集配置中将“stonith-enable”设置为“true”。

详细了解数据库实例 - StonithEnabledHARH(在已启用 HA 的 SAP 工作负载(用于具有 Redhat OS 的 VM)的群集配置中启用 stonith)

在已启用 HA 的 SAP 工作负载中,将群集配置的 stonith 超时设置为 144

根据关于 Azure 上的 SAP 的建议,将 HA 群集的 stonith 超时设置为 144。

详细了解 数据库实例 - StonithTimeoutHASLE(在已启用 HA 的 SAP 工作负载中,将群集配置的 stonith 超时设置为 144)

在已启用 HA 的 SAP 工作负载(用于具有 SUSE OS 的 VM)的群集配置中启用 stonith

在 Pacemaker 群集中,使用 STONITH(“爆头”)资源实现节点级别隔离。 确保在 HA 群集配置中将“stonith-enable”设置为“true”。

详细了解数据库实例 - StonithEnabledHASLE(在已启用 HA 的 SAP 工作负载(用于具有 SUSE OS 的 VM)的群集配置中启用 stonith)

在 Pacemaker 配置中使用 Azure 隔离代理将 stonth -timeout 设置为 900,以便进行 HANA DB HA 设置

将 stonith-timeout 设置为 900,以确保 HANA DB HA 设置的 Pacemaker 功能可靠。 此设置适用于通过托管标识或服务主体使用 Azure 隔离代理进行隔离的情况。

详细了解数据库实例 - StonithTimeOutSuseHDB(对于 HANA DB HA 设置的 Azure 围栏代理,将 Pacemaker 配置中的 stonith-timeout 设置为 900)

对于已启用 HA 的 HANA DB(用于具有 Redhat OS 的 VM),将 Pacemaker 群集中的 corosync 令牌设置为 30000

corosync 令牌设置确定在 HA 群集中直接使用或作为实际令牌超时计算基础的超时时间。 根据关于 Azure 上的 SAP 的建议将 corosync 令牌设置为 30000,以允许内存保留维护。

详细了解数据库实例 - CorosyncTokenHARH(对于已启用 HA 的 HANA DB(用于具有 Redhat OS 的 VM),将 Pacemaker 群集中的 corosync 令牌设置为 30000)

在已启用 HA 的 SAP 工作负载的群集配置中,将预期投票参数设置为 2

如果有两个节点 HA 群集,根据关于 Azure 上的 SAP 的建议,将仲裁投票设置为 2。

详细了解数据库实例 - ExpectedVotesParamtersHARH(在已启用 HA 的 SAP 工作负载的群集配置中,将预期投票参数设置为 2)

对于已启用 HA 的 HANA DB(用于具有 SUSE OS 的 VM),将 Pacemaker 群集中的 corosync 令牌设置为 30000

corosync 令牌设置确定在 HA 群集中直接使用或作为实际令牌超时计算基础的超时时间。 根据关于 Azure 上的 SAP 的建议将 corosync 令牌设置为 30000,以允许内存保留维护。

详细了解数据库实例 - CorosyncTokenHASLE(对于已启用 HA 的 HANA DB(用于具有 SUSE OS 的 VM),将 Pacemaker 群集中的 corosync 令牌设置为 30000)

在 HANA DB HA 设置的 Pacemaker 配置中将参数 PREFER_SITE_TAKEOVER 设置为“true”

SAP HANA 拓扑中的参数 PREFER_SITE_TAKEOVER 定义了 HANA SR 资源代理是否会优先接管辅助实例,而不是在本地重启失败的主实例。 将其设置为“true”,以确保 HANA DB HA 设置的功能可靠。

详细了解数据库实例 - PreferSiteTakeOverHARH(在 HANA DB HA 设置的 Pacemaker 配置中将参数 PREFER_SITE_TAKEOVER 设置为“true”)

在 Pacemaker 配置中为 HANA DB HA 设置启用“concurrent-fencing”参数

当 concurrent-fencing 参数设置为 true 时,允许并行执行隔离操作。 在 HANA DB HA 设置的 pacemaker 群集配置中,将此参数设置为“true”。

详细了解数据库实例 - ConcurrentFencingHARH(在 HANA DB HA 设置的 Pacemaker 配置中启用“concurrent-fencing”参数)

在已启用 HA 的 SAP 工作负荷的群集配置中,将参数 PREFER_SITE_TAKEOVER 设置为“true”

SAP HANA 拓扑中的参数 PREFER_SITE_TAKEOVER 定义了 HANA SR 资源代理是否会优先接管辅助实例,而不是在本地重启失败的主实例。 将其设置为“true”,以确保 HANA DB HA 设置的功能可靠。

详细了解数据库实例 - PreferSiteTakeoverHDB(在已启用 HA 的 SAP 工作负载的群集配置中,将参数 PREFER_SITE_TAKEOVER 设置为“true”)

在已启用 HA 的 SAP 工作负载的 Pacemaker 群集中将“token_retransmits_before_loss_const”设置为 10

corosync token_retransmits_before_loss_const 确定在 HA 群集中的超时之前尝试重新传输的令牌数。 根据 HANA DB HA 设置的建议,将 totem.token_retransmits_before_loss_const 设置为 10。

详细了解数据库实例 - TokenRetransmitsHDB(在已启用 HA 的 SAP 工作负载的 Pacemaker 群集中,将“token_retransmits_before_loss_const”设置为 10)

在已启用 HA 的 SAP 工作负载的群集配置中,将 two_node 参数设置为 1

对于双节点 HA 群集,请根据 Azure 上的 SAP 建议将仲裁参数“two_node”设置为 1。

详细了解数据库实例 - ExpectedVotesSuseHDB(在已启用 HA 的 SAP 工作负载的群集配置中,将 two_node 参数设置为 1)

在已启用 HA 的 SAP 工作负载的群集配置中启用“concurrent-fencing”参数

当 concurrent-fencing 参数设置为 true 时,允许并行执行隔离操作。 在 HANA DB HA 设置的 pacemaker 群集配置中,将此参数设置为“true”。

详细了解数据库实例 - ConcurrentFencingSuseHDB(在已启用 HA 的 SAP 工作负载的群集配置中启用“concurrent-fencing”参数)

对于 SAP 工作负载中已启用 HA 的 HANA DB,将 Pacemaker 群集中的“corosync join”设置为 60

“corosync 加入超时”指定在成员身份协议中等待加入消息的时间(以毫秒为单位)。 建议在 HANA DB HA 设置的 Pacemaker 群集配置中设置为 60。

详细了解数据库实例 - CorosyncHDB(对于 SAP 工作负载中已启用 HA 的 HANA DB,将 Pacemaker 群集中的“corosync join”设置为 60)

对于 SAP 工作负载中已启用 HA 的 HANA DB,将 Pacemaker 群集中的“corosync max_messages”设置为 20

corosync max_messages 常数指定一个处理器在接收令牌时一次可以发送的最大消息数。 建议设置为 Pacemaker 群集配置中的 corosync 令牌参数的 20 倍。

详细了解数据库实例 - CorosyncMaxMessageHDB(对于 SAP 工作负载中已启用 HA 的 HANA DB,将 Pacemaker 群集中的“corosync max_messages”设置为 20)

对于 SAP 工作负荷中已启用 HA 的 HANA DB,请将 Pacemaker 群集中的“corosync consensus”设置为 36000

corosync 参数“consensus”指定在启动群集配置中新一轮成员身份之前等待达成共识的时间(以毫秒为单位)。 建议设置为 HANA DB HA 设置的 Pacemaker 群集配置中 corosync 令牌的 1.2 倍。

详细了解数据库实例 - CorosyncConsensusHDB(对于 SAP 工作负载中已启用 HA 的 HANA DB,将 Pacemaker 群集中的“corosync consensus”设置为 36000)

在 Pacemaker 配置中创建 softdog 配置文件以便 HA 在 SAP 工作负载中启用 HANA DB

softdog 计时器将作为内核模块加载到 linux OS 中。 如果此计时器检测到系统已挂起,则会触发系统重置。 确保在 Pacemaker 群集中为 HANA DB HA 设置创建了 softdog 配置文件。

详细了解数据库实例 - SoftdogConfigSuseHDB(对于 SAP 工作负载中已启用 HA 的 HANA DB,在 Pacemaker 配置中创建 softdog 配置文件)

确保在 HANA DB HA 设置的 Pacemaker 配置中有一个 fence_azure_arm 实例

fence_azure_arm 是 Azure 资源管理器的 I/O 隔离代理。 确保在 HANA DB HA 设置的 Pacemaker 配置中有一个 fence_azure_arm 实例。 该 fence_azure-arm 实例要求适用于通过托管标识或服务主体使用 Azure 隔离代理进行隔离的情况。

详细了解数据库实例 - FenceAzureArmSuseHDB(确保在 HANA DB HA 设置的 Pacemaker 配置中,有一个 fence_azure_arm 实例)

确保在 SAP 工作负载中为已启用 HA 的 HANA DB 中的 Pacemaler 加载 softdog 模块

softdog 计时器将作为内核模块加载到 linux OS 中。 如果此计时器检测到系统已挂起,则会触发系统重置。 首先确保已创建 softdog 配置文件,然后在 HANA DB HA 设置的 Pacemaker 配置中加载 softdog 模块。

详细了解数据库实例 - SoftdogModuleSuseHDB(确保在 SAP 工作负载中已启用 HA 的 HANA DB 中,为 Pacemaker 加载了 softdog 模块)

将 Azure 负载均衡器中的空闲超时设置为 30 分钟,以在 SAP 工作负载中设置 HANA DB HA

若要防止负载均衡器超时,请确保所有 Azure 负载均衡规则中的“空闲超时(分钟)”设置为最大值 30 分钟。 打开负载均衡器,选择“负载均衡规则”并添加/编辑规则以启用建议的设置。

详细了解数据库实例 - DBHASetIdleTimeOutLB(对于 SAP 工作负载中的 HANA DB HA 设置,将 Azure 负载均衡器中的空闲超时设置为 30 分钟)

在 Azure 负载均衡器中启用浮动 IP,以便在 SAP 工作负载中设置 HANA DB HA

在 Azure 负载均衡器的负载均衡规则中启用浮动 IP,以便在 SAP 工作负载中进行 HANA DB 实例的 HA 设置。 打开负载均衡器,选择“负载均衡规则”并添加/编辑规则以启用建议的设置。

详细了解数据库实例 - DBHAEnableFloatingIpLB(对于 SAP 工作负载中的 HANA DB HA 设置,在 Azure 负载均衡器中启用浮动 IP)

在 Azure 负载均衡器中启用 HA 端口,以便在 SAP 工作负载中设置 HANA DB HA

在负载均衡规则中启用 HA 端口,以便在 SAP 工作负载中进行 HANA DB 实例的 HA 设置。 打开负载均衡器,选择“负载均衡规则”并添加/编辑规则以启用建议的设置。

详细了解数据库实例 - DBHAEnableLBPorts(对于 SAP 工作负载中的 HANA DB HA 设置,在 Azure 负载均衡器中启用 HA 端口)

在放置于 Azure 负载均衡器之后的 VM 上禁用 TCP 时间戳,以在 SAP 工作负载中设置 HANA DB HA

在放置于 Azure 负载均衡器之后的 VM 上禁用 TCP 时间戳。 启用 TCP 的时间戳会导致运行状况探测因 VM 来宾 OS TCP 堆栈删除 TCP 数据包而失败。 删除的数据包会导致负载均衡器将终结点标记为停止。

详细了解数据库实例 - DBLBHADisableTCP(在 SAP 工作负载中的 HANA DB HA 设置中,对放置于 Azure 负载均衡器后面的 VM 禁用 TCP 时间戳)

在 HANA DB HA 设置的 Pacemaker 配置中应该有一个 fence_azure_arm 实例

fence_azure_arm 是 Azure 资源管理器的 I/O 隔离代理。 确保在 HANA DB HA 设置的 Pacemaker 配置中有一个 fence_azure_arm 实例。 如果要通过托管标识或服务主体使用 Azure 隔离代理进行隔离,则需要 fence_azure_arm。

详细了解数据库实例 - FenceAzureArmSuseHDB(HANA DB HA 设置的 Pacemaker 配置中应有一个 fence_azure_arm 实例)

存储

为恢复服务保管库启用软删除

软删除选项有助于在删除数据后,将备份数据保留在恢复服务保管库中额外一段时间。 额外持续时间使你有机会在数据永久删除之前检索数据。

详细了解恢复服务保管库 - AB-SoftDeleteRsv(为恢复服务保管库启用软删除)

为恢复服务保管库启用跨区域还原

为异地冗余保管库启用跨区域还原。

详细了解恢复服务保管库 - 启用 CRR(为恢复服务保管库启用跨区域还原)

在虚拟机上启用备份

为虚拟机启用备份并保护数据。

详细了解 虚拟机(经典)- EnableBackup(在虚拟机上启用备份)

配置 Blob 备份

配置 blob 备份。

详细了解存储帐户 - ConfigureBlobBackup(配置 blob 备份)

启用 Azure 备份,为数据提供简单、可靠且经济高效的保护

通过 Azure 上强大的一键式备份,确保你的信息和应用程序安全。 激活 Azure 备份,为各种工作负荷(包括 VM、SQL 数据库、应用程序和文件共享)提供经济高效的保护。

详细了解订阅 - AzureBackupService(启用 Azure 备份,为数据提供简单、可靠且经济高效的保护)

你有需要迁移到 ADLS Gen2 的 ADLS Gen1 帐户

如之前宣布的那样,Azure Data Lake Storage Gen1 将于 2024 年 2 月 29 日停用。 强烈建议将数据湖迁移到 Azure Data Lake Storage Gen2。 Azure Data Lake Storage Gen2 提供专为大数据分析而设计的高级功能,基于 Azure Blob 存储构建。

详细了解 Data lake store 帐户 - ADLSGen1_Deprecation(ADLS Gen1 帐户需要迁移到 ADLS Gen2)

你有需要迁移到 ADLS Gen2 的 ADLS Gen1 帐户

如之前宣布的那样,Azure Data Lake Storage Gen1 将于 2024 年 2 月 29 日停用。 强烈建议将数据湖迁移到 Azure Data Lake Storage Gen2,它提供为大数据分析设计的高级功能。 Azure Data Lake Storage Gen2 是在 Azure Blob 存储的基础之上生成的。

详细了解 Data lake store 帐户 - ADLSGen1_Deprecation(ADLS Gen1 帐户需要迁移到 ADLS Gen2)

启用软删除以保护 Blob 数据

启用软删除选项后,被删除的数据会转换为软删除状态,而不会被永久删除。 覆盖数据时,会生成软删除快照以保存被覆盖数据的状态。 可配置软删除数据永久失效前的保持时间。

详细了解存储帐户 - StorageSoftDelete(启用软删除以保护 blob 数据)

对达到容量限制的存储帐户使用托管磁盘

我们已确定你在即将达到高级存储容量限制的存储帐户中使用高级 SSD 非托管磁盘。 为了避免达到此限制后出现的故障,建议迁移到没有帐户容量限制的托管磁盘。 可以在不到 5 分钟的时间内通过门户完成此迁移。

详细了解存储帐户 - StoragePremiumBlobQuotaLimit(将托管磁盘用于达到容量限制的存储帐户)

将 Azure 磁盘与区域冗余存储配合使用,以提高复原能力和可用性

具有 ZRS 的 Azure 磁盘在一个区域中的三个可用性区域中提供数据同步复制,使磁盘能够容忍区域性故障,而不会对应用程序造成中断。 将磁盘从 LRS 迁移到 ZRS,以提高复原能力和可用性。

详细了解如何更改 Azure 托管磁盘的磁盘类型

使用托管磁盘提高数据可靠性

具有共享存储帐户或存储缩放单元的磁盘的可用性集中的虚拟机在中断期间不可对单个存储规模单元故障进行复原。 迁移到 Azure 托管磁盘以确保可用性集中的不同 VM 的磁盘彼此完全独立,以避免单点故障。

详细了解可用性集 - ManagedDisksAvSet(使用托管磁盘来提高数据可靠性)

实现面向 Azure NetApp 文件资源的灾难恢复策略

要避免发生区域性灾难时数据或功能丢失,请为 Azure NetApp 文件卷实施常见的灾难恢复技术,例如跨区域复制

详细了解卷 - ANFCRRCZRRecommendation(为 Azure NetApp 文件资源实施灾难恢复策略)

Azure NetApp 文件为 SMB 卷启用连续可用性

建议启用 SMB 卷的连续可用性。

详细了解卷 - anfcaenablement(Azure NetApp 文件为 SMB 卷启用连续可用性)

查看 SAP 配置,了解与 Azure NetApp 文件搭配使用的超时值

在与 Azure NetApp 文件一起使用时,SAP 的高可用性依靠设置适当的超时值来防止应用程序中断。 请查看文档,确保配置符合文档中所述的超时值。

详细了解卷 - SAPTimeoutsANF(查看 SAP 配置,了解与 Azure NetApp 文件搭配使用的超时值)

Web

考虑横向扩展应用服务计划以避免 CPU 耗尽

应用在过去几天达到 >90% 的 CPU。 CPU 使用率过高可能导致应用出现运行时问题。若要解决此问题,可以横向扩展应用。

详细了解应用服务 - AppServiceCPUExhaustion(考虑横向扩展应用服务计划以避免 CPU 耗尽)

修复应用服务资源的备份数据库设置

应用的备份因 DB 配置无效而持续失败。可以在备份历史记录中找到更多详细信息。

详细了解应用服务 - AppServiceFixBackupDatabaseSettings(修复应用服务资源的备份数据库设置)

考虑纵向扩展应用服务计划 SKU 以避免内存耗尽

包含应用的应用服务计划已经耗用 >85% 的已分配内存。 内存耗用过高可能导致应用出现运行时问题。 调查应用服务计划中的哪个应用在耗尽内存,并根据需要纵向扩展到包含更多内存资源的更高级计划。

详细了解应用服务 - AppServiceMemoryExhaustion(考虑纵向扩展应用服务计划 SKU 以避免内存耗尽)

纵向扩展应用服务资源以去除配额限制

应用是共享应用服务计划的一部分,已多次达到其配额。 达到配额后,Web 应用不能接受传入请求。 若要去除配额,请升级到标准计划。

详细了解应用服务 - AppServiceRemoveQuota(纵向扩展应用服务资源以移除配额限制)

对应用服务资源使用部署槽

你在上一周多次部署应用程序。 部署槽位可用于管理所做的更改并减少对生产 Web 应用的部署影响。

详细了解应用服务 - AppServiceUseDeploymentSlots(将部署槽位用于应用服务资源)

修复应用服务资源的备份存储设置

应用的备份因存储设置无效而持续失败。可以在备份历史记录中找到更多详细信息。

详细了解应用服务 - AppServiceFixBackupStorageSettings(修复应用服务资源的备份存储设置)

将应用服务资源移到标准或更高层级并使用部署槽

你在上一周多次部署应用程序。 部署槽位可用于管理所做的更改并减少对生产 Web 应用的部署影响。

详细了解应用服务 - AppServiceStandardOrHigher(将应用服务资源移动到标准或更高级别,并使用部署槽位)

请考虑横向扩展应用服务计划,以优化用户体验和可用性

请考虑将应用服务计划横向扩展到至少两个实例,以在日常维护期间避免冷启动延迟和服务中断。

详细了解应用服务计划 - AppServiceNumberOfInstances(考虑横向扩展应用服务计划以优化用户体验和可用性。)

应用程序代码需要在工作进程因未经处理的异常而发生故障时进行修复

我们发现以下线程导致应用出现未经处理的异常,必须修复应用程序代码以防止对应用程序可用性造成影响。 当代码中的异常终止进程时,会发生故障。

详细了解应用服务 - AppServiceProactiveCrashMonitoring(由于未处理异常导致工作进程崩溃,因此必须修复应用程序代码)

考虑将应用服务配置更改为 64 位

发现应用程序正以 32 位运行,且内存达到 2 GB 限制。 可考虑切换为 64 位进程,以便可以利用 Web 辅助角色中可用的额外内存。 此操作触发 Web 应用重启,因此请相应地进行计划。

详细了解应用服务 32 位限制

升级 Azure Fluid Relay 客户端库

你最近使用旧的客户端库调用了 Azure Fluid Relay 服务。 必须立即将 Azure Fluid Relay 客户端库升级到最新版本,以确保应用程序保持正常运行。 升级提供了最新的功能,并且增强了性能和稳定性。 有关可供使用的最新版本以及如何升级的信息,请参阅以下文章。

详细了解 FluidRelay 服务器 - UpgradeClientLibrary(升级 Azure Fluid Relay 客户端库)

请考虑将此订阅中的 Static Web App(s) 托管计划升级到标准 SKU

此订阅中所有免费 SKU Static Web Apps 使用的组合带宽超出了每月 100 GB 的限制。 请考虑将这些应用升级到标准 SKU 以避免限制。

详细了解静态 Web 应用 - StaticWebAppsUpgradeToStandardSKU(考虑将此订阅中静态 Web 应用的托管计划升级为标准 SKU。)

后续步骤

详细了解可靠性 - Microsoft Azure 构架良好的框架