다음을 통해 공유


Azure Managed Redis 모니터링 데이터 참조

이 문서에는 이 서비스에 대한 모든 모니터링 참조 정보가 포함되어 있습니다.

지표

이 섹션에는 이 서비스에 대해 자동으로 모은 플랫폼 메트릭이 모두 나열되어 있습니다. 이러한 메트릭은 Azure Monitor에서 지원되는 모든 플랫폼 메트릭의 전역 목록의 일부이기도 합니다.

메트릭 보존에 관한 자세한 내용은 Azure Monitor 메트릭 개요를 참조하세요.

Microsoft.Cache/redisEnterprise에 대해 지원되는 메트릭에 대한 자세한 내용 및 정보는 다음 섹션을 참조하세요.

Microsoft.Cache/redisEnterprise에 대해 지원되는 메트릭

다음 표에서는 Microsoft.Cache/redisEnterprise 리소스 종류에 사용할 수 있는 메트릭을 나열합니다.

  • 모든 테이블에 모든 열이 있는 것은 아닙니다.
  • 일부 열은 페이지의 보기 영역 밖에 있을 수 있습니다. 사용 가능한 모든 열을 보려면 테이블 확장을 선택합니다.

테이블 제목

  • 범주 - 메트릭 그룹 또는 분류입니다.
  • 메트릭 - Azure Portal에 표시되는 메트릭 표시 이름입니다.
  • REST API의 이름 - REST API에서 참조되는 메트릭 이름입니다.
  • 단위 - 측정 단위입니다.
  • 집계 - 기본 집계 형식입니다. 유효한 값은 평균(Avg), 최소(Min), 최대(Max), 합계(Sum), 개수입니다.
  • 크기 - 해당 메트릭에 사용할 수 있는 크기입니다.
  • 시간 조직 - 메트릭이 샘플링되는 간격입니다. 예를 들어, PT1M은 메트릭이 1분마다, PT30M은 30분마다, PT1H는 1시간마다 샘플링됨을 나타냅니다.
  • DS 내보내기- 진단 설정을 통해 메트릭을 Azure Monitor 로그로 내보낼 수 있는지 여부를 나타냅니다. 메트릭 내보내기에 대한 자세한 내용은 Azure Monitor의 진단 설정 생성을 참조하세요.
측정단위 REST API의 이름 단위 집계 치수 시간 입자 DS 데이터 내보내기
캐시 적중 수

성공한 키 조회의 수. 자세한 내용은 https://aka.ms/redis/enterprise/metrics를 참조하세요.
cachehits 수량 합계(총합) <없음> PT5M, PT1H
캐시 대기 시간 마이크로초(미리 보기)

캐시 대기 시간(마이크로초)입니다. 자세한 내용은 https://aka.ms/redis/enterprise/metrics를 참조하세요.
cacheLatency 수량 평균 InstanceId PT5M, PT1H
캐시 누락

실패한 키 조회의 수. 자세한 내용은 https://aka.ms/redis/enterprise/metrics를 참조하세요.
cachemisses 수량 합계(총합) <없음> PT5M, PT1H
캐시 읽기

캐시에서 읽은 초당 메가바이트(MB/s) 단위의 데이터 양. 자세한 내용은 https://aka.ms/redis/enterprise/metrics를 참조하세요.
cacheRead 초당 바이트 최대 InstanceId PT5M, PT1H
캐시 쓰기

캐시에 기록된 데이터의 양(초당 메가바이트)(MB/s)입니다. 자세한 내용은 https://aka.ms/redis/enterprise/metrics를 참조하세요.
cacheWrite 초당 바이트 최대 InstanceId PT5M, PT1H
연결된 클라이언트

캐시에 대한 클라이언트 연결 수입니다. 자세한 내용은 https://aka.ms/redis/enterprise/metrics를 참조하세요.
connectedclients 수량 최대 InstanceId PT5M, PT1H
제거된 키

캐시에서 제거된 항목 수입니다. 자세한 내용은 https://aka.ms/redis/enterprise/metrics를 참조하세요.
evictedkeys 수량 합계(총합) <없음> PT5M, PT1H
만료된 키

캐시에서 만료된 항목 수. 자세한 내용은 https://aka.ms/redis/enterprise/metrics를 참조하세요.
expiredkeys 수량 합계(총합) <없음> PT5M, PT1H
지리적 복제 상태 양호

활성 지역 복제 그룹의 지역 복제 상태입니다. 0은 비정상이고 1은 정상을 나타냅니다. 자세한 내용은 https://aka.ms/redis/enterprise/metrics를 참조하세요.
geoReplicationHealthy 수량 최대 <없음> PT5M, PT1H
가져오기

캐시에서의 가져오기 작업 수. 자세한 내용은 https://aka.ms/redis/enterprise/metrics를 참조하세요.
getcommands 수량 합계(총합) <없음> PT5M, PT1H
초당 작업

캐시에서 실행되는 초당 즉각적인 작업 수입니다. 자세한 내용은 https://aka.ms/redis/enterprise/metrics를 참조하세요.
operationsPerSecond 수량 최대 <없음> PT5M, PT1H
중앙 처리 장치(CPU)

Azure Redis Cache 서버의 CPU 사용률(백분율)입니다. 자세한 내용은 https://aka.ms/redis/enterprise/metrics를 참조하세요.
percentProcessorTime 백분율 최대 InstanceId PT5M, PT1H
서버 부하

Redis 서버가 메시지를 유휴 상태로 기다리지 않고 처리 중인 주기의 비율을 나타냅니다. 자세한 내용은 https://aka.ms/redis/enterprise/metrics를 참조하세요.
serverLoad 백분율 최대 <없음> PT5M, PT1H
설정

캐시에 대한 설정 작업의 수입니다. 자세한 내용은 https://aka.ms/redis/enterprise/metrics를 참조하세요.
setcommands 수량 합계(총합) <없음> PT5M, PT1H
총 작업

캐시 서버에서 처리한 총 명령 수입니다. 자세한 내용은 https://aka.ms/redis/enterprise/metrics를 참조하세요.
totalcommandsprocessed 수량 합계(총합) <없음> PT5M, PT1H
총 키

캐시의 총 항목 수입니다. 자세한 내용은 https://aka.ms/redis/enterprise/metrics를 참조하세요.
totalkeys 수량 최대 <없음> PT5M, PT1H
사용된 메모리

캐시의 키/값 쌍에 사용되는 캐시 메모리 양(MB)입니다. 자세한 내용은 https://aka.ms/redis/enterprise/metrics를 참조하세요.
usedmemory 바이트 최대 <없음> PT5M, PT1H
사용된 메모리 비율

키/값 쌍에 사용되는 캐시 메모리의 백분율입니다. 자세한 내용은 https://aka.ms/redis/enterprise/metrics를 참조하세요.
usedmemorypercentage 백분율 최대 <없음> PT5M, PT1H

Azure Managed Redis 메트릭에 대한 세부 정보

다음 목록에서는 Microsoft.Cache/redisEnterprise에 대해 지원되는 Azure Monitor 메트릭에 대한 세부 정보 및 자세한 정보를 제공합니다.

측정단위 세부 정보
캐시 대기 시간(미리 보기) 지정된 보고 간격 동안 캐시 노드의 엔드포인트에서 처리되는 요청의 평균 대기 시간입니다. 이 메트릭은 밀리초 단위로 측정되며 Prometheus 메트릭에서 node_avg_latency 가져옵니다. 이 메트릭은 캐시에 활성 트래픽이 있는 경우에만 보고됩니다.
캐시 적수 지정된 보고 간격 동안 성공한 키 조회 수입니다. 이 값은 Prometheus 메트릭에서 bdb_read_hits 가져옵니다.
캐시 누락 지정한 보고 간격 동안 실패한 키 조회 수입니다. 이 값은 Prometheus 메트릭에서 bdb_read_misses_max 가져옵니다. 캐시 누락이 반드시 캐시에 문제가 있음을 의미하는 것은 아닙니다. 예를 들어 캐시 배제 프로그래밍 패턴을 사용하는 경우 애플리케이션은 먼저 캐시에서 항목을 찾습니다. 항목이 캐시에 없으면(캐시 누락) 데이터베이스에서 항목을 검색하고 다음 검색을 위해 캐시에 항목을 추가합니다. 캐시 누락은 캐시 배제 프로그래밍 패턴의 일반적인 동작입니다. 캐시 누락 수가 예상보다 높은 경우 캐시를 채우고 캐시에서 읽는 애플리케이션 논리를 검사합니다. 메모리 압력으로 인해 캐시에서 항목이 제거되는 경우 일부 캐시 누락이 있을 수 있지만 메모리 압력을 모니터링하는 더 나은 메트릭이 될 수 있습니다 Used Memory or Evicted Keys.
캐시 읽기 지정된 보고 간격 동안 캐시 노드로 들어오는 네트워크 트래픽의 속도(초당 바이트)입니다. 이 값은 Prometheus 메트릭에서 node_ingress_bytes_max 가져옵니다. 서버 쪽 네트워크 대역폭 제한에 대한 경고를 설정하려면 이 캐시 읽기 카운터를 사용하여 만듭니다. 다양한 캐시 가격 책정 계층 및 크기에 대해 관찰된 대역폭 제한은 이 테이블을 참조하세요.
캐시 쓰기 지정된 보고 간격 동안 캐시 노드에서 나가는 네트워크 트래픽의 속도(초당 바이트)입니다. 이 값은 Prometheus 메트릭에서 node_egress_bytes_max 가져옵니다.
연결된 클라이언트 지정한 보고 간격 동안 캐시에 설정된 클라이언트 연결 수입니다. 이 값은 노드의 엔드포인트에 node_conns 연결된 클라이언트 수를 계산하는 Prometheus 메트릭에서 가져옵니다. 연결 제한에 도달하면 나중에 캐시에 연결하려고 시도하면 실패합니다. 활성 클라이언트 애플리케이션이 없는 경우에도 내부 프로세스 및 연결로 인해 연결된 클라이언트 인스턴스가 여전히 몇 개 있을 수 있습니다.
CPU (중앙 처리 장치) 지정된 보고 간격 동안의 백분율로 Azure Managed Redis 서버의 CPU 사용률입니다. 이 값은 간격 중에 관찰된 가장 낮은 CPU 유휴 시간 부분을 나타내는 Prometheus 메트릭에서 node_cpu_idle_min 파생되며 CPU 사용 시간을 반영하도록 반전됩니다. CPU 메트릭에는 엄격하게 Redis 서버 프로세스가 아닌 맬웨어 방지와 같은 백그라운드 프로세스가 포함되어 있으므로 Redis 워크로드와 독립적으로 급증할 수 있습니다. 모니터링을 위해 서버 부하 를 통해 이 메트릭을 사용하는 것이 좋습니다. 인스턴스 ID로 분할하여 인스턴스 수준 드릴다운을 지원하므로 어떤 노드가 압력을 받고 있는지 보다 세분화할 수 있습니다.
제거된 키 지정된 보고 간격 동안 캐시에서 제거된 키 수입니다. 이 값은 Prometheus 메트릭에서 bdb_evicted_objects 가져옵니다.
만료된 키 지정된 보고 간격 동안 캐시에서 만료된 키 수입니다. 이 값은 Prometheus 메트릭에서 bdb_expired_objects 가져옵니다.
지리적 복제 정상 Active Geo-Replication 그룹의 캐시 간에 지역 복제 링크의 상태를 나타냅니다. 메트릭은 다음 두 값 중 하나를 보고합니다.

0 – 연결이 끊어지거나 비정상
1 - 정상

메트릭은 지역에서 복제를 사용하도록 설정된 메모리 최적화, 분산 및 컴퓨팅 최적화 계층 캐시에서 사용할 수 있습니다. 0 값은 지역 복제의 데이터가 손실되었음을 의미하지 않습니다. 지역 기본과 지역 보조 간의 연결이 비정상임을 의미합니다.

이 메트릭은 월별 패치, 호스트 OS 업데이트, 네트워크 잘못된 구성 또는 실패한 지역 복제 링크 프로비저닝을 비롯한 여러 가지 이유로 연결이 끊어지거나 비정상 복제 상태를 나타낼 수 있습니다. Azure Managed Redis 서비스는 최신 플랫폼 기능 및 향상된 기능으로 캐시를 주기적으로 패치합니다. 이러한 업데이트 중에는 각 캐시 노드가 오프라인으로 전환되어 지역 복제 링크를 일시적으로 사용하지 않도록 설정합니다. 지역 복제 링크가 비정상인 경우 포털의 리소스 메뉴에서 진단 및 해결 문제를 사용하여 지역 주 또는 지역 보조 캐시의 패치 이벤트로 인해 발생했는지 확인합니다. 캐시의 데이터 양에 따라 패칭으로 인한 가동 중지 시간은 몇 분에서 1시간까지 걸릴 수 있습니다. 지역 복제 링크가 1시간 넘게 비정상 상태이면 지원 요청을 제출합니다.
가져오기 지정된 보고 간격 동안 캐시에 대한 읽기 요청 수입니다. 이 값은 데이터베이스에 bdb_read_req 대한 모든 읽기 요청의 속도를 나타내는 Prometheus 메트릭에서 생성되며 보고 간격 동안 캐시 적중 및 누락의 합계와 동일합니다.
초당 작업 지정된 보고 간격 동안 캐시의 모든 분할된 데이터베이스에서 초당 처리되는 총 요청 수입니다. 이 값은 Prometheus 메트릭에서 bdb_instantaneous_ops_per_sec 가져옵니다.
서버 부하 서버 부하 메트릭은 전체 부하에 대한 Redis 서버의 자체 평가를 반영하며 CPU 메트릭과 유사하지만 인스턴스당이 아닌 클러스터 수준에서 측정됩니다. 이 값은 Prometheus 메트릭에서 node_cpu_idle_min 파생되고 서버 사용 시간을 반영하도록 반전됩니다. 이 카운터가 100이 되면 Redis 서버가 성능 한계에 도달하여 CPU가 더 빨리 작업을 처리할 수 없습니다. 큰 대기 시간 효과를 기대할 수 있습니다. 서버 부하가 지속적으로 높은 경우 캐시를 확장하거나 여러 캐시에서 데이터를 분할하는 것이 좋습니다. 서버 로드가 50~80%와 같이 적당히 높은 경우 평균 대기 시간은 일반적으로 낮게 유지되며, 시간 제한 예외는 서버 대기 시간이 긴 것 이외의 다른 원인이 있을 수 있습니다.

서버 로드는 클러스터 수준에서 측정되므로 개별 인스턴스로 드릴다운할 수 없습니다. 인스턴스 수준 분석을 위해 인스턴스 ID로 분할을 지원하므로 CPU 메트릭을 대신 사용하는 것이 좋습니다.

주의:서버 부하 메트릭은 Azure Managed Redis 캐시에 대한 잘못된 데이터를 표시할 수 있습니다. 때로는 서버 로드가 100을 초과하는 것으로 표시됩니다. 현재 이 문제를 조사하고 있습니다. 대신 CPU 메트릭을 사용하는 것이 좋습니다.
설정 지정된 보고 간격 동안 캐시에 대한 쓰기 요청 수입니다. 이 값은 데이터베이스에 대한 bdb_write_req 모든 쓰기 요청의 속도를 나타내는 Prometheus 메트릭에서 가져옵니다.
총 키 지정된 보고 간격 동안 캐시의 키 수입니다. 이 값은 Prometheus 메트릭에서 bdb_no_of_keys 가져옵니다.

중요: 클러스터링을 사용하도록 설정된 캐시에 대한 기본 메트릭 시스템의 제한으로 인해 총 키는 보고 간격 동안 최대 키 수를 가진 분할된 데이터베이스의 최대 키 수를 반환합니다.
총 작업 지정된 보고 간격 동안 캐시에서 처리된 총 요청 수입니다. 이 값은 Prometheus 메트릭에서 bdb_total_req 가져옵니다.
사용된 메모리 지정된 보고 간격 동안 데이터베이스에서 사용하는 캐시 메모리의 양(바이트)입니다. 이 값은 Prometheus 메트릭에서 bdb_used_memory 가져옵니다. 플래시 최적화 계층 캐시에서 이 값에는 RAM 및 플래시 메모리 사용량이 모두 포함됩니다. 이 값은 조각화를 포함하지 않습니다.

고가용성을 사용하도록 설정하면 사용된 메모리 값에 주 노드와 복제본 노드의 메모리가 모두 포함됩니다. 이렇게 하면 메트릭이 예상보다 두 배 더 크게 표시될 수 있습니다.
사용된 메모리 비율 지정된 보고 간격 동안 현재 사용 중인 구성된 메모리 제한의 백분율입니다. 이 값은 Redis Enterprise Prometheus 메트릭의 bdb_used_memorybdb_memory_limit 비율로 계산됩니다. 이 값은 조각화를 포함하지 않습니다.

리소스 로그

이 섹션에는 이 서비스에 대해 모을 수 있는 리소스 로그 유형이 나열되어 있습니다. 이 섹션은 Azure Monitor에서 지원되는 모든 리소스 로그 범주 유형 목록에서 가져옵니다.

Microsoft.Cache/redisEnterprise/데이터베이스에 대해 지원되는 리소스 로그

카테고리 범주 표시 이름 로그 테이블 기본 로그 계획을 지원합니다 인제션 시 변환 지원 예제 쿼리 내보낼 비용
ConnectionEvents 연결 이벤트(새 연결/인증/연결 끊기) REDConnectionEvents

클라이언트가 Redis 엔터프라이즈 데이터베이스에 연결할 때 연결 이벤트를 기록합니다.

쿼리

Azure Monitor 로그 테이블

이 섹션은 이 서비스와 관련이 있고 Kusto 쿼리를 사용하는 Log Analytics의 쿼리에 사용할 수 있는 Azure Monitor 로그 테이블을 나열합니다. 테이블에는 리소스 로그 데이터가 포함되며 수집 및 라우팅되는 항목에 따라 더 많은 데이터가 포함될 수 있습니다.

Azure 관리형 Redis

Microsoft.Cache/redisEnterprise

활동 로그

연결된 테이블에는 이 서비스의 활동 로그에 기록할 수 있는 작업이 나열되어 있습니다. 이 작업은 활동 로그에서 가능한 모든 리소스 공급자 작업의 하위 집합입니다.

활동 로그 항목의 스키마에 대한 자세한 내용은 활동 로그 스키마를 참조하세요.