你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
本文介绍如何成功管理和监视 Azure 虚拟机登陆区域加速器上的 Oracle。 此企业规模方案概述了环境设计的重要建议。 有关更多信息,请参阅 Azure 环境的管理。
本文介绍了有关如何在虚拟机登陆区域加速器上管理 Oracle 工作负载部署的关键设计注意事项和最佳做法。 由于 Oracle 是任务关键型高性能工作负载,因此应在规划中包括有关 Azure 登陆区域设计领域的指南。 为了确保任务关键型工作负载的运行状况,监控虚拟机上的 Oracle 工作负载是否存在故障和异常至关重要。
监视虚拟机上的 Oracle 数据库登陆区域加速器
监控的第一步是设置常规 Azure 虚拟机 (VM) 监控并定义关键指标的阈值。 配置常规 VM 和托管磁盘监控后,下一步是设置针对您的环境量身定制的 Oracle 监控。
Azure Monitor 的日志监控
若要监视虚拟机登陆区域加速器上的 Oracle 工作负载,需要监视 VM、附加的托管磁盘或应用的存储帐户,例如 Azure NetApp 文件和虚拟机上的 Oracle 数据库。 Azure Monitor 提供了多种方法来监视 Oracle 工作负载的 VM 日志和托管磁盘。
第一步是设置常规 VM 和托管磁盘监控。
启用 VM 见解。
部署 Azure Monitor 代理并配置 数据收集规则。
收集 自定义日志。
监控托管磁盘指标。
如果将 Oracle 数据库文件存储在 Azure 托管磁盘中,请监视托管磁盘的性能相关指标。 适合 Oracle 数据库的托管磁盘 SKU 是高级 SSD、高级 SSD v2 和超级磁盘。
数据磁盘性能指标非常重要,因为 Oracle 数据库文件存储在托管磁盘上。 使用磁盘条带化技术(如 Oracle Automatic Storage Management 或 Linux Logical Volume Manager)时,请考虑数据磁盘的每秒累积输入/输出作数 (IOPS) 和数据磁盘吞吐量。
注释
当您的工作负载需要时,您可以选择基于 Non-Volatile Memory Express (NVMe) 的存储。 NVMe 是一种专为闪存存储设计的高性能存储协议,可提供低延迟和高吞吐量。 对于使用托管在具有 NVMe 存储的计算节点上的 Oracle Database 的大多数工作负载,我们建议块大小为 128K。
数据块大小是指在单个输入/输出 (I/O)作中读取或写入的数据量。 它在如何确定存储性能、吞吐量和延迟方面起着至关重要的作用。 请记住,您可以配置的最大吞吐量取决于您预置的数据大小和磁盘类型。
Azure VM 和托管磁盘指标
下表列出了 Oracle 管理员应监控的性能指标。
名称 | 阈值 (严重性) |
---|---|
CPU > 百分比 95% | 95 (1) |
CPU >百分比 = 85% | 85 (1) |
CPU >百分比 = 75% | 75 (2) |
VmAvailabilityMetric < 1 | < 1 (0) |
作系统磁盘带宽消耗百分比 > 95% | 95 (1) |
作系统磁盘带宽消耗百分比 > 90% | 90 (1) |
可用内存字节数 < 500,000,000 | < 500,000,000 (1) |
VM 缓存带宽消耗百分比 > 95% | 95 (1) |
VM 缓存带宽消耗百分比 > 85% | 85 (2) |
VM 缓存带宽消耗百分比 > 75% | 75 (2) |
VM 未缓存带宽消耗百分比 > 95% | 95 (1) |
VM 未缓存带宽消耗百分比 > 85% | 85 (2) |
VM 未缓存带宽消耗百分比 > 75% | 75 (2) |
数据磁盘 IOPS 消耗百分比 > 95% | 95 (1) |
数据磁盘 IOPS 消耗百分比 > 85% | 85 (2) |
数据磁盘 IOPS 消耗百分比 > 75% | 75 (2) |
数据盘读取字节数 > 95 | 95 (1) |
数据磁盘读取字节 > 数 85 | 85 (2) |
数据磁盘读取字节数 > 75 | 75 (2) |
数据磁盘写入字节 > 数 95 | 95 (1) |
数据磁盘写入字节 > 数 85 | 85 (2) |
数据磁盘写入字节 > 数 75 | 75 (2) |
注释
在 Severity (严重性 ) 类别中, 0 的严重性最高, 2 的严重性最低。
监控磁盘指标时,请务必确保不超过数据库 VM 限制。 每个 VM SKU 的技术规范中详细介绍了托管磁盘的具体限制。 有关详细信息,请参阅 Azure 中 VM 的大小。 选择适当的 VM SKU 时,请参阅 最大未缓存磁盘吞吐量:IOPS/MB/s 表和列,了解附加到 VM 的多个托管磁盘如何累积提供更高的组合 IOPS 和吞吐量。 如果峰值负载期间的数据库 I/O 要求超过 VM 的最大非缓存磁盘吞吐量,则 VM 的 I/O作可能会受到限制。 如果每个磁盘的 IOPS 或存储吞吐量不足,则可能会在 VM 和磁盘级别发生限制。
有关更多信息,请参阅 磁盘指标。
监控 Azure NetApp Files 指标
如果数据库文件存储在 Azure NetApp Files 卷中,请监控 Azure NetApp Files 分配的存储、存储使用情况、卷 IOPS、吞吐量和延迟。 有关如何监控 Azure NetApp Files 和相关性能指标的更多信息,请参阅 监控 Azure NetApp Files 的方法和 Azure NetApp Files 的指标。
在监视 Azure NetApp 文件指标时,监视 VM 的网络带宽以确保未超出其限制也很重要。 由于 Azure NetApp 文件卷是使用网络文件系统 (NFS) 协议通过网络装载的,因此它们不受任何 VM 实例类型的累积 I/O 吞吐量限制的限制。 相反,Azure NetApp 文件仅受数据库 VM 系列的网络带宽限制。 名为 Max network bandwidth (MB/s) 的列中详细介绍了挂载 NFS 的存储的具体限制。 关于云主机系列的技术规格,请参见 Edv5 和 Edsv5 系列。
配置 Azure VM 指标的警报
Azure Monitor 中的警报可帮助你识别运行状况不佳的资源。 创建新 VM 时,可以为常见指标启用一组建议的警报规则。 此初始集包括 CPU 百分比和可用内存等指标。 有关更多信息,请参阅 为 VM 启用建议的警报规则。 如果需要情况监控,您还可以配置 高级指标警报规则 。
请考虑使用 Azure Monitor 基线警报,它用作 Azure 登陆区域中通常部署的资源的最佳做法警报集合。
您应该监控与托管磁盘相关的指标。 如果超出阈值,则应发出警报。
监视相关的 Azure 服务
下表列出了应以某种容量进行监控的其他典型解决方案组件。
Azure 服务 | 说明 | 详细信息 |
---|---|---|
Azure 虚拟网络 | 虚拟机上的 Oracle 数据库登陆区域加速器使用 Oracle Data Guard 和 GoldenGate 将虚拟网络用于可用性集、可用性区域、高可用性以及业务连续性和灾难恢复 (BCDR)。 |
-
虚拟网络概述 - 监视 Azure 虚拟网络数据参考 |
Azure 备份服务 | 监控 Backup 并设置警报。 监控数据库 VM 上的 Oracle 数据库警报日志文件中是否有以下格式开头的行: status – AzBackup – script – version: message 其中: - 状态 = “INFO”、“WARN” 或 “FAIL” - AzBackup(样板文本) - script = “前脚本” 或 “后脚本” - 版本 = 十进制格式的版本号 - message = 自由格式的文本 示例: INFO - AzBackup pre-script v1.02: BEGIN BACKUP |
使用 Azure Monitor 日志进行大规模监视 |
VM 上的 Oracle 数据库 | 数据库警报日志文件和 OS 控制台消息文件。 - 数据库警报日志文件通常位于数据库 VM 上的子目录中 $ORACLE_BASE/diag/rdbms/$ORA_DBNAME/$ORACLE_SID/trace 。 -作系统控制台日志位于 /var/log/messages 。 |
在 Azure VM 上创建 Oracle 数据库 |
通过 Oracle Enterprise Manager Cloud Control 监视 Oracle 工作负载
Oracle Enterprise Manager 是 Oracle 集成的企业管理产品。 它提供对与目标 Oracle 工作负载相关的事件、事件和指标的监控。
Azure Monitor 和警报
使用 Azure Monitor 收集遥测数据,并深入了解 Azure 资源的运行状况、性能和可用性。 您可以将 Oracle Enterprise Manager 部署在单独的 VM 上,以监视、维护和管理 Oracle 环境。 您可以将 Oracle Enterprise Manager 文本日志加载到 Log Analytics,并将其与 Azure Monitor 一起使用,以便可以在一个位置监视所有这些指标。
Oracle 诊断工具
方法和选项 | DESCRIPTION | 详细信息 |
---|---|---|
自动工作负载存储库 (AWR) | AWR 具有监控功能,用于收集、处理和维护性能统计数据,以便进行问题检测和自我调整。 这些功能有助于历史分析和问题识别。 | 收集数据库统计信息 |
统计包 | Statspack 即使在未运行 AWR 和自动数据库诊断监视器的环境中也能收集 Oracle 数据库实例统计信息。 Statspack 包括数据库统计信息、等待事件和系统统计信息的摘要和详细信息。 |
使用 Statspack 进行性能优化,第 I 部分 使用 Statspack 进行性能调优,第 II 部分 |
Oracle Enterprise Manager 诊断和调优 | Oracle Diagnostics Pack 提供自动性能诊断和高级系统监视功能。 Oracle 调优包为数据库管理员提供了针对 Oracle 环境的专家级性能管理,包括 SQL 调优和存储优化。 | 诊断和调整包 |