Azure Cosmos DB 統合キャッシュ - 概要

適用対象: ✅ NoSQL

Azure Cosmos DB 統合キャッシュはインメモリキャッシュで、要求のボリュームが拡大するのに伴い、コストを管理しやすくし、低遅延を実現するのに役立ちます。統合キャッシュは簡単に設定できるため、キャッシュの無効化やバックエンドインフラストラクチャの管理のためのカスタムコードの作成に時間を費やす必要はありません。

統合キャッシュでは、Azure Cosmos DB アカウント内の専用ゲートウェイが使用されます。専用ゲートウェイをプロビジョニングする場合は、ワークロードに必要なコアとメモリの数に基づいて、ノードの数とノードサイズを選択できます。各専用ゲートウェイノードには、他のノードとは別の統合キャッシュがあります。

統合キャッシュは、専用ゲートウェイ内で自動的に構成されます。統合キャッシュには、次の 2 つの部分があります。

ポイント読み取り用の項目キャッシュ
クエリ用のクエリキャッシュ

統合キャッシュは、最も使われていない (LRU) 削除ポリシーを備えた、リードスルーとライトスルーのキャッシュです。項目キャッシュとクエリキャッシュは統合キャッシュ内で同じ容量を共有し、LRU 削除ポリシーが両方に適用されます。データは、ポイント読み取りとクエリのどちらであるかに関係なく、最後に使用された日時に厳密に基づいてキャッシュから削除されます。各ノード内のキャッシュされたデータは、その特定のノードから最近書き込まれたか読み取られたデータによって異なります。項目またはクエリが 1 つのノードにキャッシュされている場合、必ずしも他のノードにキャッシュされているとは限りません。

注意

統合キャッシュについてフィードバックはありますか? ご意見をお待ちしています。ぜひ、Azure Cosmos DB エンジニアリングチーム (cosmoscachefeedback@microsoft.com) まで直接お寄せください。

統合キャッシュから利点を得られるワークロード

統合キャッシュの主な目的は、読み取り負荷の高いワークロードのコストを削減することです。 Azure Cosmos DB ならキャッシュなしでも既に高速であるため、低遅延であることは、便利ではありますが統合キャッシュの主な利点ではありません。

統合キャッシュにヒットしたポイント読み取りとクエリの要求ユニット (RU) の料金は 0 です。バックエンドデータベースからの読み取りに比べて、キャッシュヒットでは操作あたりのコストがはるかに低くなります。

次の特性に一致するワークロードでは、統合キャッシュがコストの削減に役立つかどうかを評価する必要があります。

読み取り負荷の高いワークロード
大きな項目に対して繰り返される多数のポイント読み取り
繰り返される多数の高 RU クエリ
読み取り用のホットパーティションキー

期待される削減効果の中でも最大の要素は、読み取りが繰り返される度合いです。ワークロードで、同じポイント読み取りまたはクエリが短時間で絶えず実行される場合は、統合キャッシュの候補として最適です。繰り返される読み取りに統合キャッシュを使用する場合は、最初の読み取りに RU を使用するだけです。同じ専用ゲートウェイノードを介してルーティングされる後続の読み取り (MaxIntegratedCacheStaleness 期間内にあり、データが削除されていない場合) では、スループットは使用されません。

次のような一部のワークロードでは、統合キャッシュを考慮すべきではありません。

書き込み負荷の高いワークロード
めったに繰り返されないポイント読み取りまたはクエリ
変更フィードを読み取るワークロード

項目キャッシュ

項目キャッシュは、ポイント読み取り (項目 ID とパーティションキーに基づくキー/値の検索) に使用されます。

キャッシュに項目を追加する

新しい書き込み、更新、および削除は、要求がルーティングされるノードの項目キャッシュに自動的に設定されます。
要求がルーティングされるノードのキャッシュ (キャッシュミス) に項目がまだ存在しないポイント読み取り要求の項目は、項目キャッシュに追加されます。
ReadManyなどの複数のアイテムに対する読み取り要求は、個別のアイテムとしてではなく、セットとしてクエリキャッシュにデータが追加されます。
トランザクションバッチの一部または一括モードの要求では、項目キャッシュは設定されません。

項目キャッシュの無効化と削除

各ノードには独立したキャッシュがあるため、他のノードではなく、1 つのノードのキャッシュで項目が無効化または削除される可能性があります。特定のノードのキャッシュ内の項目は、次の条件に基づいて無効になり、削除されます。

項目の更新または削除
最も使われていない (LRU)
キャッシュの保有時間 (つまり MaxIntegratedCacheStaleness )

クエリキャッシュ

クエリキャッシュは、クエリをキャッシュするために使用されます。クエリキャッシュにより、クエリはキーと値の参照に変換されます。この場合、キーはクエリテキスト、値はクエリ結果になります。統合キャッシュにはクエリエンジンがありません。各クエリのキー/値参照のみが格納されます。クエリ結果はセットとして保存され、キャッシュは個々の項目を追跡しません。指定された項目は、複数のクエリの結果セットに表示される場合、クエリキャッシュに複数回保存できます。クエリの統合キャッシュの最大古さに達し、クエリがバックエンドデータベースから処理される場合を除き、基になる項目の更新はクエリ結果に反映されません。

クエリキャッシュを更新する

ルーティングされたノードで、キャッシュにそのクエリの結果がない場合 (キャッシュミス)、そのクエリはバックエンドに送信されます。クエリが実行されると、そのクエリの結果がキャッシュに格納されます。
図形が同じでも、結果に影響するパラメーターや要求オプションが異なるクエリ (最大項目数など) は、独自のキーと値のペアとして格納されます。
ReadManyなど、複数の項目に対する要求を読み取り、クエリキャッシュに入力します。 ReadMany 結果はセットとして格納され、異なる入力を持つ要求は独自のキーと値のペアとして格納されます。

クエリキャッシュの削除

クエリキャッシュの削除は、要求がルーティングされたノードに基づいています。クエリは、他のノードではなく、1 つのノードで削除または更新される可能性があります。

最も使われていない (LRU)
キャッシュの保有時間 (つまり MaxIntegratedCacheStaleness )

クエリキャッシュの操作

クエリの結果が複数のページにわたる場合でも、クエリキャッシュを操作する際に特別なコードは不要です。クエリが統合キャッシュにヒットするか、バックエンドのクエリエンジンで実行されているかにかかわらず、クエリの改ページのベストプラクティスとコードは同じです。

クエリキャッシュでは、クエリの後続トークンが自動的にキャッシュされます (該当する場合)。複数ページの結果を含むクエリがある場合、統合キャッシュに格納されているページの RU 料金は 0 になります。クエリ結果の後続のページでバックエンドの実行が必要な場合は、前のページからの継続トークンが取得されるため、前の作業の重複を回避できます。

重要

異なる専用ゲートウェイノード内の統合キャッシュインスタンスには、互いに独立したキャッシュが備わっています。データが 1 つのノード内にキャッシュされている場合、必ずしも他のノードにキャッシュされるとは限りません。同じクエリの複数のページが、同じ専用ゲートウェイノードにルーティングされるとは限りません。

統合キャッシュの一貫性

統合キャッシュでは、セッションと最終的な整合性による読み取り要求のみがサポートされます。一貫したプレフィックス、有界整合性制約、厳密な一貫性が設定されている読み取りの場合、統合キャッシュはバイパスされ、バックエンドで処理されます。

すべての読み取りのセッションまたは最終的な整合性のいずれかを構成する最も簡単な方法は、アカウントレベルでこれを設定することです。ただし、一部の読み取りにのみ特定の整合性を設定する場合は、要求レベルで整合性を構成することもできます。

注意

他の整合レベルを持つ書き込み要求もキャッシュに含まれますが、キャッシュから読み取るには、要求がセッション整合性または最終的な整合性を持っている必要があります。

セッション整合性

セッション整合性は、1 つのリージョンのアプリケーションと世界中に分散された Azure Cosmos DB アカウントの両方で最も広く使用されている整合性レベルです。セッションの整合性を使用して、単一のクライアントセッションで独自の書き込みを読み取ることができます。一致するセッショントークンがない場合のセッション整合性を持つ読み取りは、RU 料金が発生します。これには、有効なセッショントークンを明示的に渡さない限り、クライアントアプリケーションの起動時または再起動時の特定の項目またはクエリに対する最初の要求が含まれます。書き込みを実行するセッション外のクライアントは、統合キャッシュを使用すると最終的な整合性を確認します。

MaxIntegratedCacheStaleness

MaxIntegratedCacheStaleness は、選択した整合性に関係なく、キャッシュされたポイントの読み取りとクエリに対して許容される最大の staleness です。 MaxIntegratedCacheStaleness は、要求レベルで構成できます。たとえば、 MaxIntegratedCacheStaleness を 2 時間に設定した場合、要求は、データが 2 時間未満の場合にのみキャッシュされたデータを返します。繰り返し読み取りで統合キャッシュを使用する可能性を高めるには、MaxIntegratedCacheStaleness を、ビジネス要件で許容される限り最大の長さに設定する必要があります。

MaxIntegratedCacheStaleness は、最終的にキャッシュにデータを取り込む要求で構成されている場合、その要求がキャッシュされる期間には影響しません。 MaxIntegratedCacheStaleness は、キャッシュされたデータを読み取ろうとするときに整合性を確保します。グローバル TTL またはキャッシュリテンション期間設定がないため、統合キャッシュがいっぱいであるか、現在キャッシュされているエントリの経過時間よりも短い MaxIntegratedCacheStaleness で新しい読み取りが実行された場合にのみ、データがキャッシュから削除されます。

これは、ほとんどのキャッシュの動作方法と比べて改善された点であり、次の他のカスタマイズが可能になります。

ポイント読み取りまたはクエリごとに異なる失効期限要件を設定できます。
同じポイント読み取りまたはクエリを実行する場合でも、異なるクライアントは、異なる MaxIntegratedCacheStaleness 値を構成できます。
キャッシュされたデータの読み取りの整合性を変更した場合、MaxIntegratedCacheStaleness を変更すると読み取りの整合性に即座に影響します。

注意

最小の MaxIntegratedCacheStaleness の値は 0 で、最大値は 10 年です。明示的に構成されない場合、MaxIntegratedCacheStaleness の既定値は 5 分です。

MaxIntegratedCacheStaleness パラメーターをより深く理解するために、次の例について考えてみましょう。

時間	リクエスト	返信
t = 0 秒	MaxIntegratedCacheStaleness = 30 秒でクエリ A を実行する	バックエンドデータベースから結果 (通常の RU 料金) が返され、キャッシュに設定される
t = 0 秒	MaxIntegratedCacheStaleness = 60 秒でクエリ B を実行する	バックエンドデータベースから結果 (通常の RU 料金) が返され、キャッシュに設定される
t = 20 秒	MaxIntegratedCacheStaleness = 30 秒でクエリ A を実行する	統合キャッシュから結果 (0 RU 料金) が返される
t = 20 秒	MaxIntegratedCacheStaleness = 60 秒でクエリ B を実行する	統合キャッシュから結果 (0 RU 料金) が返される
t = 40 秒	MaxIntegratedCacheStaleness = 30 秒でクエリ A を実行する	バックエンドデータベースから結果 (通常の RU 料金) が返され、キャッシュが更新される
t = 40 秒	MaxIntegratedCacheStaleness = 60 秒でクエリ B を実行する	統合キャッシュから結果 (0 RU 料金) が返される
t = 50 秒	MaxIntegratedCacheStaleness = 20 秒でクエリ B を実行する	バックエンドデータベースから結果 (通常の RU 料金) が返され、キャッシュが更新される

MaxIntegratedCacheStalenessを構成する方法については、「MaxIntegratedCacheStaleness の調整」を参照してください。

統合キャッシュをバイパスする

統合キャッシュには、プロビジョニングされた専用ゲートウェイ SKU によって決まる制限されたストレージ容量があります。既定では、専用ゲートウェイ接続文字列を使って構成されたクライアントからのすべての要求は統合キャッシュを通過し、キャッシュ領域を占有します。統合キャッシュ要求のバイパスオプションを使って、キャッシュされる項目とクエリを制御できます。この要求オプションは、項目の書き込みまたは読み取り要求の頻繁な繰り返しが予期されない場合に役立ちます。

アクセス頻度が低い項目の統合キャッシュをバイパスすると、繰り返しが多い項目のためのキャッシュ領域を節約し、RU 節約の可能性を高め、立ち退きを減らすことができます。キャッシュをバイパスする要求は、引き続き専用ゲートウェイを介してルーティングされます。これらの要求はバックエンドから処理され、RU コストが含まれます。

統合キャッシュをバイパスする方法については、「統合キャッシュをバイパスする」を参照してください。

メトリック

統合キャッシュについていくつかの主要な DedicatedGateway および IntegratedCache メトリックを監視することは有用です。これらのメトリックの詳細については、「サポート対象の Microsoft.DocumentDB/DatabaseAccounts のメトリック」を参照してください。

既定では、Azure portal の ([メトリック (クラシック)] ではなく) [メトリック] から、既存のすべてのメトリックを使用できます。

統合キャッシュメトリックの場所を示す Azure portal のスクリーンショット。

メトリックは、すべての専用ゲートウェイノード全体の平均、最大、または合計のいずれかです。たとえば、5 つのノードが含まれる専用ゲートウェイクラスターをプロビジョニングする場合、メトリックには 5 つのすべてのノード全体の集計値が反映されます。個々のノードのメトリック値を特定することはできません。

一般的な問題のトラブルシューティング

次の例は、一般的なシナリオをデバッグする方法を示しています。

アプリケーションが専用ゲートウェイを使用しているかどうかを判断できない

DedicatedGatewayRequests を確認します。このメトリックには、統合キャッシュにヒットするかどうかに関係なく、専用ゲートウェイを使用するすべての要求が含まれています。アプリケーションで元の接続文字列で標準ゲートウェイまたはダイレクトモードを使用している場合、エラーメッセージは表示されませんが、 DedicatedGatewayRequests は 0 です。アプリケーションで専用ゲートウェイ接続文字列と共に直接モードを使用している場合でも、いくつかの DedicatedGatewayRequestsが表示されることがあります。

要求が統合キャッシュにヒットしているどうかを判断できない

IntegratedCacheItemHitRate と IntegratedCacheQueryHitRate を確認します。これらの値が両方とも 0 の場合、要求は統合キャッシュにヒットしていません。専用のゲートウェイ接続文字列を使っていること、ゲートウェイモードで接続していること、セッションまたは最終的な整合性を使っていることを確認します。

専用ゲートウェイが小さすぎるかどうかを確認したい

IntegratedCacheItemHitRate と IntegratedCacheQueryHitRate を確認します。高い値 (0.7 から 0.8 より前など) は、専用ゲートウェイが十分な大きさであることを示す良い兆候です。

IntegratedCacheItemHitRate または IntegratedCacheQueryHitRate が小さい場合は、IntegratedCacheEvictedEntriesSize を確認します。 IntegratedCacheEvictedEntriesSizeが大きい場合は、より大きな専用ゲートウェイサイズが役立つ可能性があります。実験するには、専用ゲートウェイのサイズを増やし、新しい IntegratedCacheItemHitRate および IntegratedCacheQueryHitRate を比較します。専用ゲートウェイのサイズを大きくしても、IntegratedCacheItemHitRate または IntegratedCacheQueryHitRate が改善されない場合、統合キャッシュが効果を発揮するのに十分な回数、読み取りが繰り返されないことがあります。

専用ゲートウェイが大きすぎるかどうかを確認したい

専用ゲートウェイが大きすぎるかどうかを測定するのは、専用ゲートウェイが小さすぎるかどうかを測定するよりも困難です。一般に、専用ゲートウェイのサイズは、小さい状態から始めて、IntegratedCacheItemHitRate および IntegratedCacheQueryHitRate が改善されなくなるまで徐々に大きくしていきます。場合によっては、2 つのキャッシュヒットメトリックのうちの 1 つだけが重要であり、両方ではありません。たとえば、ワークロードがポイント読み取りではなく主にクエリである場合、IntegratedCacheQueryHitRate の方が IntegratedCacheItemHitRate よりもはるかに重要です。

LRU ではなく MaxIntegratedCacheStaleness を超過したことが原因でほとんどのデータがキャッシュから削除される場合は、キャッシュが必要以上に大きい可能性があります。 IntegratedCacheItemExpirationCount および IntegratedCacheQueryExpirationCount の合計が IntegratedCacheEvictedEntriesSize とほぼ同じ大きさの場合は、専用ゲートウェイのサイズを小さくして実験を行い、パフォーマンスを比較できます。

専用ゲートウェイノードを追加する必要があるかどうかを知りたい

場合によっては、待機時間が予期せず長い場合は、より大きなノードではなく、より多くの専用ゲートウェイノードが必要になることがあります。 DedicatedGatewayCPUUsage と DedicatedGatewayMemoryUsage を調べて、専用ゲートウェイノードを追加すると、待機時間が短縮されるかどうかを確認します。統合キャッシュのすべてのインスタンスは互いに独立しているため、専用ゲートウェイノードを追加しても IntegratedCacheEvictedEntriesSize は減少しないことに留意してください。ただし、ノードを追加すると、専用ゲートウェイクラスターで処理できる要求ボリュームが向上します。

次の手順

Azure Cosmos DB 統合キャッシュに関してよく寄せられる質問
Azure Cosmos DB 統合キャッシュを構成する方法
Azure Cosmos DB 専用ゲートウェイ - 概要
Azure Cosmos DB への移行のための容量計画を実行しようとしていますか? 容量計画のために、既存のデータベースクラスターに関する情報を使用できます。
- 既存のデータベースクラスター内の仮想コアとサーバーの数がわかっている場合は、「非リレーショナルデータベース内の仮想コアまたは仮想 CPU の数を Azure Cosmos DB RU/秒に変換する」を参照してください。
- 現在のデータベースワークロードの一般的な要求レートがわかっている場合は、「Azure Cosmos DB Capacity Planner を使用した RU/秒の見積もり」を参照してください

フィードバック

このページはお役に立ちましたか?

Last updated on 2025-06-30