自動スケーリングのスループットを利用した Azure Cosmos DB コンテナーとデータベースを作成する

適用対象: NoSQL MongoDB Cassandra Gremlin Table

Azure Cosmos DB では、データベースとコンテナーに対して標準 (手動) または自動スケーリングのプロビジョニング スループットを構成できます。 Azure Cosmos DB で自動スケーリング プロビジョニング スループットを使用すると、お使いのデータベースまたはコンテナーのスループット (RU/秒) を自動的かつ即座にスケーリングできます。 ワークロードの可用性、待機時間、スループット、またはパフォーマンスに影響を与えずに、使用量に基づいてスループットがスケーリングされます。

自動スケーリングのプロビジョニング スループットは、トラフィック パターンが変動し予測できないミッション クリティカルなワークロードに最適であり、ハイ パフォーマンスとスケーリングに対する SLA を必要とします。 この記事では、自動スケーリングのプロビジョニング スループットの利点とユース ケースについて説明します。

自動スケールの利点

自動スケーリングのプロビジョニング スループットが構成された Azure Cosmos DB データベースとコンテナーには、次の利点があります。

  • Simple の場合: 自動スケーリングを利用すると、カスタム スクリプトの作成や手動による容量のスケーリングに伴う RU/秒の管理の複雑さが解消されます。

  • スケーラブル: データベースとコンテナーでは、必要に応じて、プロビジョニング スループットが自動的にスケーリングされます。 クライアント接続やアプリケーションは中断されず、また、Azure Cosmos DB SLA への影響はありません。

  • コスト効率: 自動スケーリングを利用すると、使用されていないときにスケールダウンすることで、RU/秒の使用率とコストの使用状況を最適化できます。 ワークロードで必要とされるリソースに対してのみ、時間単位で料金を支払います。 自動スケーリングの最大 RU/秒 (Tmax) を設定しており、1 か月の全時間数のうち、全 Tmax 量を使用している時間が 66% 以下の場合、自動スケーリングによって節約されます。 詳細については、「標準 (手動) および自動スケーリングのプロビジョニング スループットから選択する方法」を参照してください。

  • 高可用性: 自動スケーリングを使用するデータベースおよびコンテナーでは、グローバルに分散されたフォールト トレラントで可用性の高い同一の Azure Cosmos DB バックエンドが使用され、データの持続性と高可用性が保証されます。

自動スケーリングのユース ケース

自動スケーリングのユース ケースを以下に示します。

  • 変動する予測不可能なワークロード: ワークロードの使用率が変動したり、急増を予測できなかったりする場合には、自動スケーリングを利用して、使用状況に基づいて自動的にスケールアップおよびスケールダウンすることができます。 例としては、小売の Web サイトで季節性に応じてトラフィック パターンが異なる場合、IOT ワークロードが 1 日のさまざまな時間に急増する場合、基幹業務アプリケーションにおいて 1 か月や 1 年に数回、ピーク時の使用率が見られる場合などがあります。 自動スケーリングを利用すると、ピーク時または平均の容量に対して手動でプロビジョニングする必要がなくなります。

  • 新しいアプリケーション: 新しいアプリケーションを開発していて、必要なスループット (RU/秒) がわからない場合は、自動スケーリングを利用して簡単に始めることができます。 自動スケーリングのエントリ ポイントである 100 から 1000 RU/秒で開始し、使用状況を監視して、時間の経過と共に適切な RU/秒を判断することができます。

  • 使用頻度の低いアプリケーション: 1 日、1 週間、または 1 か月に何度か、数時間だけ使用されるアプリケーション (小規模なアプリケーション/Web/ブログ サイトなど) がある場合は、自動スケーリングを利用すると、ピーク時の使用率に対応するように容量が調整され、その期間が終了するとスケールダウンされます。

  • 開発およびテストのワークロード: 自身やチームで Azure Cosmos DB データベースとコンテナーを業務時間中は使うが、夜間や週末には必要ない場合、自動スケーリングにより、使っていないときに最小にスケールダウンすることで、コストを節約できます。

  • スケジュールされた運用ワークロード/クエリ: アイドル期間中に実行することを検討しているスケジュールされた一連の要求、操作、またはクエリがある場合には、自動スケーリングを利用して簡単に実行できます。 ワークロードを実行する必要がある場合、スループットは必要な値まで自動的にスケーリングされ、その後スケールダウンされます。

これらの問題に対処するカスタム ソリューションを構築する場合、膨大な時間を必要とするだけでなく、アプリケーションの構成やコードが複雑になります。 自動スケーリングを利用すれば、上述したシナリオをすぐに実現でき、容量をカスタムまたは手動でスケーリングする必要がなくなります。

自動スケーリングのプロビジョニング スループットのしくみ

コンテナーとデータベースを自動スケーリングに構成するときは、必要な最大スループット Tmax を指定します。 Azure Cosmos DB では、0.1*Tmax <= T <= Tmax のように、スループット T がスケーリングされます。 たとえば、最大スループットを 20,000 RU/秒に設定すると、スループットは 2,000 から 20,000 RU/秒の間でスケーリングされます。 スケーリングは自動的かつ瞬時に行われるため、どの時点でも、プロビジョニングされた Tmax まで遅延なく使用できます。

料金は、1 時間の枠内でシステムがスケーリングされた最大スループット T に対して、時間単位で請求されます。

自動スケーリングの最大スループット Tmax のエントリ ポイントは 1000 RU/秒で開始され、100 から 1000 RU/秒の間でスケーリングされます。 Tmax は 1000 RU/秒の増分で設定でき、値はいつでも変更できます。

既存のリソースに対して自動スケーリングを有効にする

Azure portalCLI、または PowerShell を使用して、既存のデータベースまたはコンテナーで自動スケーリングを有効にできます。 自動スケーリングと標準 (手動) のプロビジョニング スループット間の切り替えは、いつでも行うことができます。 詳細については、こちらのドキュメントを参照してください。

自動スケーリングのスループットとストレージ制限

Tmax の値に応じて、データベースまたはコンテナーでは合計 0.1 * Tmax GB を保存できます。 このストレージ容量に達すると、アプリケーションに影響を与えることなく、新しいストレージ値に基づいて最大 RU/秒が自動的に増やされます。

たとえば、50,000 RU/秒の最大 RU/秒で開始した場合 (5000 から 50,000 RU/秒の間でスケーリングされます)、最大で 5000 GB のデータを格納できます。 5,000 GB を超えると (現在、ストレージが 6,000 GB になっているなど)、新しい最大 RU/秒は 60,000 RU/秒になります (6,000 から 60,000 RU/秒の間でスケーリングされます)。

自動スケーリングによるデータベース レベルのスループットを使用する場合は、100 GB のストレージを超えない限り、最初の 25 個のコンテナーによって、自動スケーリングの最大の 1000 RU/秒 (100 から 1000 RU/秒の間でスケーリングされます) を共有できます。 詳細については、こちらのドキュメントを参照してください。

比較 – 手動または自動スケーリングのスループットで構成されたコンテナー

標準 (手動) および自動スケーリングのスループットから選択する方法の詳細については、こちらのドキュメントを参照してください。

標準 (手動) のスループットを利用したコンテナー 自動スケーリングのスループットを利用したコンテナー
プロビジョニング スループット (RU/秒) 手動でプロビジョニングします。 ワークロードの使用パターンに基づいて、自動的に瞬時にスケーリングされます。
要求/操作のレート制限 (429) 使用量がプロビジョニング済みの容量を超えた場合、発生する可能性があります。 構成した自動スケーリングのスループットの範囲内で RU/秒を使用する場合は、発生しません。
容量計画 容量計画を行い、必要とされる正確なスループットをプロビジョニングする必要があります。 容量計画と容量管理は、システムによって自動的に行われます。
料金 1 時間あたりの標準 (手動) の RU/秒レートを使用して、手動でプロビジョニングされた RU/秒に対して、時間単位で料金を支払います。 システムによって 1 時間の枠内でスケールアップされた最大 RU/秒に対して、時間単位で料金を支払います。

単一の書き込みリージョンのアカウントの場合、1 時間あたりの自動スケーリングの RU/秒レートを使用して、使用された RU/秒に対して時間単位で料金を支払います。

書き込みリージョンが複数あるアカウントの場合、自動スケーリングに対する追加料金は発生しません。 同じ 1 時間あたりの複数リージョン書き込み RU/秒レートを使用して、使用されたスループットに対して時間単位で料金を支払います。
最適なワークロードの種類 予測可能で安定したワークロード 予測不可能で変動するワークロード

次のステップ