Azure Cosmos DB 통합 캐시 - 개요

적용 대상: ✅ NoSQL

Azure Cosmos DB 통합 캐시는 요청 볼륨이 증가할 때 비용을 관리하고 짧은 대기 시간을 보장하는 데 도움이 되는 메모리 내 캐시입니다. 통합 캐시는 쉽게 설정할 수 있으며 캐시 무효화를 위한 사용자 지정 코드를 작성하거나 백 엔드 인프라를 관리하는 데 시간을 낭비할 필요가 없습니다.

통합 캐시는 Azure Cosmos DB 계정 내에서 전용 게이트웨이를 사용합니다. 전용 게이트웨이를 프로비전할 때 워크로드에 필요한 코어 수와 메모리에 따라 노드 수와 노드 크기를 선택할 수 있습니다. 각 전용 게이트웨이 노드에는 서로 다른 별도의 통합 캐시가 있습니다.

통합 캐시는 전용 게이트웨이 내에서 자동으로 구성됩니다. 통합 캐시는 다음과 같은 두 부분으로 나뉩니다.

지점 읽기를 위한 항목 캐시
쿼리를 위한 쿼리 캐시

통합 캐시는 최근에 가장 적게 사용된(LRU) 항목 제거 정책을 사용하는 읽기 통과 및 쓰기 통과 캐시입니다. 항목 캐시와 쿼리 캐시는 통합 캐시 내에서 동일한 용량을 공유하며 LRU 제거 정책은 두 쿼리에 모두 적용됩니다. 데이터는 지점 읽기인지 쿼리인지에 관계없이 가장 최근에 사용되지 않은 항목을 기준으로 엄격하게 캐시에서 제거됩니다. 각 노드 내에 캐시된 데이터는 특정 노드를 통해 최근에 쓰거나 읽은 데이터에 따라 달라집니다. 항목이나 쿼리가 하나의 노드에 캐시되는 경우 다른 노드에 캐시될 필요는 없습니다.

참고

통합 캐시에 관한 피드백이 있나요? 많은 의견 부탁드립니다. 언제든지 자유롭게 Azure Cosmos DB 엔지니어링 팀(cosmoscachefeedback@microsoft.com)과 피드백을 직접 공유해 주세요.

통합 캐시의 이점을 활용할 수 있는 워크로드

통합 캐시의 주요 목표는 읽기 작업이 많은 워크로드 비용을 절감하는 것입니다. Azure Cosmos DB는 이미 캐싱 없이 빠르기 때문에 짧은 대기 시간은 좋기는 하지만 통합 캐시의 주요 이점은 아닙니다.

통합 캐시에 도달한 지점 읽기 및 쿼리에는 RU(요청 단위) 요금이 0입니다. 캐시 적중 시 백 엔드 데이터베이스에서 읽는 것보다 작업당 비용이 훨씬 낮습니다.

다음 특징에 해당하는 워크로드는 통합 캐시가 비용 절감에 도움이 되는지 평가해야 합니다.

읽기 작업이 많은 워크로드
많은 항목에서 지점 읽기가 반복
반복되는 높은 RU 쿼리가 많음
읽기의 핫 파티션 키

예상 절감액을 좌우하는 가장 큰 요인은 읽기가 반복되는 정도입니다. 워크로드에서 짧은 시간 동안 동일한 지점 읽기 또는 쿼리를 지속적으로 실행하는 경우 통합 캐시를 사용하면 매우 좋습니다. 반복되는 읽기에 통합 캐시를 사용하면 첫 번째 읽기에만 RU 기능이 사용됩니다. 동일한 전용 게이트웨이 노드(MaxIntegratedCacheStaleness 창 내부 및 데이터를 제거하지 않은 경우)를 통해 라우팅되는 후속 읽기는 처리량을 사용하지 않습니다.

다음과 같은 일부 워크로드는 통합 캐시를 사용하지 않는 것이 좋습니다.

쓰기 작업이 많은 워크로드
가끔 반복되는 지점 읽기 또는 쿼리
변경 피드를 읽는 워크로드

항목 캐시

항목 캐시는 지점 읽기(항목 ID 및 파티션 키에 따라 키/값 조회)에 사용됩니다.

항목 캐시 채우기

새 쓰기, 업데이트 및 삭제는 요청이 라우팅되는 노드의 항목 캐시에 자동으로 채워집니다.
요청이 라우팅되는 노드의 캐시(캐시 누락)에 항목이 아직 없는 지점 읽기 요청의 항목이 항목 캐시에 추가됩니다.
여러 항목에 대한 읽기 요청(예: ReadMany)은 항목 캐시에 개별 항목으로 저장하는 대신 쿼리 캐시에 집합으로 저장합니다.
트랜잭션 일괄 처리 또는 대량 모드의 일부인 요청은 항목 캐시를 채우지 않습니다.

항목 캐시 무효화 및 제거

각 노드에는 독립적인 캐시가 있으므로 항목이 무효화되거나 다른 노드가 아닌 한 노드의 캐시에서 제거될 수 있습니다. 지정된 노드의 캐시에 있는 항목은 다음 조건에 따라 무효화되고 제거됩니다.

항목 업데이트 또는 삭제
LRU(Least Recently Used, 가장 최근에 덜 사용된 항목)
캐시 보존 시간(즉, MaxIntegratedCacheStaleness)

쿼리 캐시

쿼리 캐시를 사용하여 쿼리를 캐시할 수 있습니다. 쿼리 캐시는 쿼리를 키/값 조회로 변환합니다. 여기서 키는 쿼리 텍스트이고 값은 쿼리 결과입니다. 통합 캐시에는 쿼리 엔진이 없습니다. 각 쿼리에 대한 키/값 조회만 저장합니다. 쿼리 결과는 집합으로 저장되며 캐시는 개별 항목을 추적하지 않습니다. 지정된 항목이 여러 쿼리의 결과 집합에 표시되는 경우 쿼리 캐시에 여러 번 저장할 수 있습니다. 기본 항목에 대한 업데이트는 쿼리에 대한 최대 통합 캐시 부실에 도달하고 쿼리가 백 엔드 데이터베이스에서 처리되지 않는 한, 쿼리 결과에 반영되지 않습니다.

쿼리 캐시 채우기

캐시가 라우팅된 노드에 해당 쿼리에 대한 결과가 없으면(캐시 누락) 쿼리가 백 엔드로 전송됩니다. 쿼리를 실행한 후 캐시는 해당 쿼리에 대한 결과를 저장합니다.
셰이프가 같지만 매개 변수가 다르거나 결과에 영향을 주는 요청 옵션(예: 최대 항목 수)이 있는 쿼리는 고유한 키/값 쌍으로 저장됩니다.
ReadMany과(와) 같은 여러 항목에 대한 읽기 요청이 쿼리 캐시를 채웁니다. ReadMany 결과는 집합으로 저장되고 입력이 다른 요청은 고유한 키/값 쌍으로 저장됩니다.

쿼리 캐시 제거

쿼리 캐시 제거는 요청이 라우팅된 노드를 기반으로 합니다. 다른 노드가 아닌 한 노드에서 쿼리를 제거하거나 새로 고칠 수 있습니다.

LRU(Least Recently Used, 가장 최근에 덜 사용된 항목)
캐시 보존 시간(즉, MaxIntegratedCacheStaleness)

쿼리 캐시 작업

쿼리의 결과 페이지가 여러 개 있더라도 쿼리 캐시를 작업할 때 특수 코드가 필요하지 않습니다. 쿼리가 통합 캐시에 도달하든 백 엔드 쿼리 엔진에서 실행되든, 쿼리 페이지 지정에 대한 모범 사례와 코드는 동일합니다.

쿼리 캐시는 해당하는 경우 쿼리 연속 토큰을 자동으로 캐시합니다. 결과의 여러 페이지가 있는 쿼리가 있는 경우 통합 캐시에 저장된 모든 페이지에는 RU 요금이 0입니다. 쿼리 결과의 후속 페이지에 백 엔드 실행이 필요한 경우 이전 페이지의 연속 토큰이 있으므로 이전 작업이 중복되지 않도록 할 수 있습니다.

중요한

서로 다른 전용 게이트웨이 노드에 있는 통합 캐시 인스턴스의 캐시는 서로 독립적입니다. 데이터가 한 노드 내에 캐시되는 경우 다른 노드에서 반드시 캐시되지는 않습니다. 동일한 쿼리의 여러 페이지가 동일한 전용 게이트웨이 노드로 라우팅되지는 않습니다.

통합 캐시 일관성

통합 캐시는 세션 및 최종 일관성이 있는 읽기 요청만 지원합니다. 읽기에 일관적인 접두사, 제한된 부실 또는 강력한 일관성이 있는 경우 읽기는 통합 캐시를 무시하고 백 엔드에서 제공됩니다.

모든 읽기에 대해 세션 또는 최종 일관성을 구성하는 가장 쉬운 방법은 계정 수준에서 설정하는 것입니다. 그러나 일부 읽기만 특정 일관성을 유지하려면 요청 수준에서 일관성을 구성할 수도 있습니다.

참고

다른 일관성이 있는 쓰기 요청은 여전히 캐시를 채우지만 캐시에서 읽으려면 요청에 세션 또는 최종 일관성이 있어야 합니다.

세션 일관성

세션 일관성은 단일 지역과 전역으로 배포되는 Azure Cosmos DB 계정에 모두 가장 널리 사용되는 일관성 수준입니다. 세션 일관성을 사용하는 경우 단일 클라이언트 세션은 자체가 기록한 데이터를 읽을 수 있습니다. 세션 토큰이 일치하지 않는 세션 일관성을 유지한 모든 읽기는 RU 요금이 부과됩니다. 여기에는 클라이언트 애플리케이션이 시작되거나 다시 시작될 때 지정된 항목 또는 쿼리에 대한 첫 번째 요청이 포함됩니다(유효한 세션 토큰을 명시적으로 전달하지 않은 경우). 쓰기를 수행하는 세션 외부의 클라이언트는 통합 캐시를 사용할 때 최종 일관성을 볼 수 있습니다.

최대 통합 캐시 무효 시간

MaxIntegratedCacheStaleness는 선택한 일관성에 관계없이 캐시된 지점 읽기 및 쿼리에 대해 허용되는 최대 부실성입니다. MaxIntegratedCacheStaleness는 요청 수준에서 구성할 수 있습니다. 예를 들어 2시간을 MaxIntegratedCacheStaleness 설정하면 데이터가 2시간 미만인 경우에만 요청이 캐시된 데이터만 반환됩니다. 통합 캐시를 사용하여 반복 읽기의 가능성을 높이려면 MaxIntegratedCacheStaleness를 비즈니스 요구 사항에서 허용하는 만큼 높게 설정해야 합니다.

MaxIntegratedCacheStaleness는 최종적으로 캐시를 채우는 요청에서 구성된 경우 요청이 캐시되는 기간에 영향을 주지 않습니다. MaxIntegratedCacheStaleness는 캐시된 데이터를 읽으려고 할 때 일관성을 적용합니다. 전역 TTL 또는 캐시 보존 설정이 없으므로 통합 캐시가 가득 찼거나 새 읽기가 현재 캐시된 항목의 보존 기간보다 낮은 MaxIntegratedCacheStaleness를 사용하여 실행되는 경우에만 캐시에서 데이터가 제거됩니다.

이는 대부분의 캐시가 작동하는 방식에서 향상된 기능이며 다음과 같은 다른 사용자 지정을 허용합니다.

각 지점 읽기 또는 쿼리마다 서로 다른 신선도 요건을 설정할 수 있습니다.
서로 다른 클라이언트는 동일한 지점 읽기나 쿼리를 실행하는 경우에도 서로 다른 MaxIntegratedCacheStaleness 값을 구성할 수 있습니다.
캐시된 데이터의 읽기 일관성을 수정하려고 한 경우 MaxIntegratedCacheStaleness를 변경하면 읽기 일관성에 즉시 영향을 줍니다.

참고

최소 MaxIntegratedCacheStaleness 값은 0이고 최댓값은 10년입니다. 명시적으로 구성되지 않은 경우 MaxIntegratedCacheStaleness는 기본적으로 5분으로 설정됩니다.

MaxIntegratedCacheStaleness 매개 변수를 더 잘 이해하려면 다음 예제를 고려합니다.

Time	요청	응답
t = 0초	MaxIntegratedCacheStaleness = 30초를 사용하여 쿼리 A 실행	백 엔드 데이터베이스에서 결과 반환(일반 RU 요금) 및 캐시 채우기
t = 0초	MaxIntegratedCacheStaleness = 60초를 사용하여 쿼리 B 실행	백 엔드 데이터베이스에서 결과 반환(일반 RU 요금) 및 캐시 채우기
t = 20초	MaxIntegratedCacheStaleness = 30초를 사용하여 쿼리 A 실행	통합 캐시에서 결과 반환(0 RU 요금)
t = 20초	MaxIntegratedCacheStaleness = 60초를 사용하여 쿼리 B 실행	통합 캐시에서 결과 반환(0 RU 요금)
t = 40초	MaxIntegratedCacheStaleness = 30초를 사용하여 쿼리 A 실행	백 엔드 데이터베이스에서 결과 반환(일반 RU 요금) 및 캐시 새로 고침
t = 40초	MaxIntegratedCacheStaleness = 60초를 사용하여 쿼리 B 실행	통합 캐시에서 결과 반환(0 RU 요금)
t = 50초	MaxIntegratedCacheStaleness = 20초를 사용하여 쿼리 B 실행	백 엔드 데이터베이스에서 결과 반환(일반 RU 요금) 및 캐시 새로 고침

구성하는 MaxIntegratedCacheStaleness방법을 알아보려면 MaxIntegratedCacheStaleness 조정을 참조하세요.

통합 캐시 무시

통합 캐시에는 프로비전된 전용 게이트웨이 SKU에 의해 결정되는 제한된 스토리지 용량이 있습니다. 기본적으로 전용 게이트웨이 연결 문자열로 구성된 클라이언트의 모든 요청은 통합 캐시를 통과하고 캐시 공간을 차지합니다. 통합 캐시 요청 무시 옵션을 사용하면 캐시되는 항목과 쿼리를 제어할 수 있습니다. 이 요청 옵션은 자주 반복되지 않을 항목 쓰기 또는 읽기 요청에 유용합니다.

자주 액세스하지 않는 항목에 대한 통합 캐시를 무시하면 반복이 더 많은 항목에 대한 캐시 공간이 절약되어 RU 절약 가능성이 증가하고 제거가 줄어듭니다. 캐시를 무시하는 요청은 여전히 전용 게이트웨이를 통해 라우팅됩니다. 이러한 요청은 백엔드에서 처리되며, 처리에는 RU 비용이 발생합니다.

통합 캐시를 바이패스하는 방법을 알아보려면 통합 캐시 무시를 참조하세요.

측정지표

통합 캐시의 경우 몇 가지 주요 DedicatedGateway 및 IntegratedCache 메트릭을 모니터링하면 도움이 됩니다. 이러한 메트릭에 대해 알아보려면 Microsoft.DocumentDB/DatabaseAccounts에 대해 지원되는 메트릭을 참조하세요.

모든 기존 메트릭은 기본적으로 메트릭 클래식이 아닌 Azure Portal의 메트릭에서 사용할 수 있습니다.

통합 캐시 메트릭의 위치를 보여 주는 Azure Portal의 스크린샷

메트릭은 모든 전용 게이트웨이 노드에서 평균, 최댓값 또는 합계입니다. 예를 들어, 노드가 5개인 전용 게이트웨이 클러스터를 프로비저닝하는 경우 메트릭은 모든 5개 노드에서 집계된 값을 반영합니다. 각 개별 노드에 대한 메트릭 값은 확인할 수 없습니다.

일반 문제 해결

다음 예제에서는 몇 가지 일반적인 시나리오를 디버그하는 방법을 보여 줍니다.

애플리케이션에서 전용 게이트웨이를 사용하고 있는지 알 수 없습니다.

DedicatedGatewayRequests를 확인합니다. 이 메트릭은 요청이 통합 캐시에 도달했는지 여부에 관계없이 전용 게이트웨이를 사용하는 모든 요청을 포함합니다. 애플리케이션에서 원래 연결 문자열과 함께 표준 게이트웨이 또는 직접 모드를 사용하는 경우 오류 메시지가 표시되지 않지만 DedicatedGatewayRequests 0입니다. 애플리케이션이 전용 게이트웨이 연결 문자열에서 직접 모드를 사용하는 경우 여전히 몇 가지 DedicatedGatewayRequests가 표시될 수 있습니다.

요청이 통합 캐시에 도달하는지 알 수 없습니다.

IntegratedCacheItemHitRate 및 IntegratedCacheQueryHitRate를 확인합니다. 두 값이 모두 0이면 요청이 통합 캐시를 적중하지 않습니다. 전용 게이트웨이 연결 문자열을 사용 중이고, 게이트웨이 모드로 연결 중이며, 세션 또는 최종 일관성을 사용하는지 확인합니다.

전용 게이트웨이가 너무 작은지 알아보려 합니다.

IntegratedCacheItemHitRate 및 IntegratedCacheQueryHitRate를 확인합니다. 높은 값(예: 0.7-0.8 이전)은 전용 게이트웨이가 충분히 크다는 좋은 신호입니다.

IntegratedCacheItemHitRate 또는 IntegratedCacheQueryHitRate가 작으면 IntegratedCacheEvictedEntriesSize를 확인합니다. IntegratedCacheEvictedEntriesSize 높은 경우 더 큰 전용 게이트웨이 크기가 도움이 될 수 있습니다. 전용 게이트웨이 크기를 늘리고 새 IntegratedCacheItemHitRate 및 IntegratedCacheQueryHitRate를 비교하여 실험할 수 있습니다. 전용 게이트웨이가 더 커도 IntegratedCacheItemHitRate 또는 IntegratedCacheQueryHitRate가 개선되지 않는 경우에는 통합 캐시가 영향을 줄 만큼 읽기가 충분히 반복되지 않는 것일 수 있습니다.

전용 게이트웨이가 너무 큰지 알아보려 합니다.

전용 게이트웨이가 너무 작은 경우 측정하는 것보다 전용 게이트웨이가 너무 큰 경우 측정하는 것이 더 어렵습니다. 일반적으로 작게 시작하고 IntegratedCacheItemHitRate 및 IntegratedCacheQueryHitRate가 더 이상 향상되지 않을 때까지 전용 게이트웨이 크기를 서서히 늘려야 합니다. 경우에 따라 두 캐시 적중 메트릭 중 하나만 중요하며 둘 다 중요하지 않습니다. 예를 들어, 워크로드가 주로 지점 읽기가 아닌 쿼리인 경우 IntegratedCacheQueryHitRate가 IntegratedCacheItemHitRate보다 훨씬 더 중요합니다.

대부분의 데이터가 LRU가 아닌 MaxIntegratedCacheStaleness를 초과하여 캐시에서 제거되는 경우 캐시가 필요 이상으로 큰 것일 수 있습니다. 결합된 IntegratedCacheItemExpirationCount 및 IntegratedCacheQueryExpirationCount가 거의 IntegratedCacheEvictedEntriesSize만큼 큰 경우 더 작은 전용 게이트웨이 크기로 실험하고 성능을 비교할 수 있습니다.

전용 게이트웨이 노드를 더 추가해야 하는지 알아보려고 합니다.

경우에 따라 대기 시간이 예기치 않게 높은 경우 더 큰 노드가 아닌 전용 게이트웨이 노드가 더 필요할 수 있습니다. DedicatedGatewayCPUUsage 및 DedicatedGatewayMemoryUsage를 확인하여 전용 게이트웨이 노드를 더 추가하면 대기 시간이 감소하는지 확인합니다. 통합 캐시의 모든 인스턴스가 서로 독립적이므로 전용 게이트웨이 노드를 더 추가해도 IntegratedCacheEvictedEntriesSize가 감소하지 않는다는 점을 기억하는 것이 좋습니다. 그러나 노드를 더 추가하면 전용 게이트웨이 클러스터에서 처리할 수 있는 요청 볼륨이 향상됩니다.

다음 단계

Azure Cosmos DB 통합 캐시 질문과 대답
Azure Cosmos DB 통합 캐시를 구성하는 방법
Azure Cosmos DB 전용 게이트웨이 - 개요
Azure Cosmos DB로 마이그레이션하기 위한 용량 계획을 수행하려고 하시나요? 용량 계획을 위해 기존 데이터베이스 클러스터에 대한 정보를 사용할 수 있습니다.
- 기존 데이터베이스 클러스터의 vCore 및 서버 수만 알고 있는 경우 비관계형 데이터베이스의 vCore 또는 vCPU 수를 Azure Cosmos DB RU/s로 변환을 참조하세요.
- 현재 데이터베이스 워크로드에 대한 일반적인 요청 속도를 알고 있는 경우 Azure Cosmos DB 용량 플래너를 사용하여 RU 예측/s를 참조하세요.

피드백

이 페이지가 도움이 되었나요?

Last updated on 2025-06-30