Azure Cosmos DB for Apache Cassandra アカウントをエラスティックにスケーリングする

2024-08-15

適用対象: カサンドラ

Azure Cosmos DB for Apache Cassandra のエラスティック特性を調べるためのさまざまなオプションがあります。 Azure Cosmos DB で効果的にスケールする方法を理解するには、システムのパフォーマンス要求を考慮して適切な量の要求ユニット (RU/秒) をプロビジョニングする方法を理解することが重要です。要求ユニットの詳細については、要求ユニットに関する記事を参照してください。

Cassandra 用 API では、.NET および Java SDK を使用して、個々のクエリの要求ユニットの料金を確認できます。これは、サービスでプロビジョニングする必要がある RU/秒の量を決定するのに役立ちます。

データベース操作による要求ユニットの消費

レート制限の処理 (429 エラー)

クライアントがプロビジョニングされた量よりも多くのリソースを消費する (RU/秒) と、Azure Cosmos DB によってレート制限 (429) エラーが返されます。 Azure Cosmos DB の Cassandra 用 API は、このような例外を Cassandra のネイティブプロトコルの過負荷エラーに変換します。

システムが待機時間の影響を受けない場合は、再試行を使用してスループットのレート制限を処理するだけで十分な場合があります。レート制限を透過的に処理する方法については、Apache Cassandra Java ドライバーの Java コードサンプル (バージョン 3 およびバージョン 4) を参照してください。これらのサンプルでは、Java で既定の Cassandra 再試行ポリシーのカスタムバージョンが実装されます。 Spark 拡張機能を使用して、レート制限を処理することもできます。 Spark の使用時、「Spark コネクタのスループット構成を最適化する」ガイダンスに従ってください。

スケーリングの管理

待機時間を最小限に抑える必要がある場合は、Cassandra 用 API でスケールとプロビジョニングのスループット (RU) を管理するためのさまざまなオプションがあります。

Azure portal を使用して手動で
コントロールプレーン機能を使用してプログラムで
特定の SDK で CQL コマンドを使用してプログラムで
自動スケーリングを使用して動的に

以降のセクションでは、それぞれの方法の長所と短所について説明します。その後、ご使用のシステムのスケーリングニーズ、全体的なコスト、およびソリューションの効率のニーズのバランスを取るための最適な方法を決定できるようになります。

Azure ポータルの使用

Azure portal を使用して Azure Cosmos DB for Apache Cassandra アカウントのリソースをスケーリングできます。詳細については、「コンテナーとデータベースのスループットのプロビジョニング」を参照してください。この記事では、Azure portal でデータベースまたはコンテナーのいずれかのレベルでスループットを設定することによる相対的利点が説明されています。これらの記事で言及されている "データベース" と "コンテナー" という用語は、それぞれ Cassandra 用 API の "keyspace" と "table" に対応します。

この方法の利点は、データベースのスループット容量を簡単かつすばやく管理できることです。ただし、欠点は、多くの場合、スケーリングの方法には、コスト効率と高いパフォーマンスの両方を実現するために、ある程度の自動化が必要になる場合があることです。以降のセクションでは、関連するシナリオと方法について説明します。

コントロールプレーンを使用する

Azure Cosmos DB の Cassandra 用 API には、さまざまなコントロールプレーン機能を使用して、プログラムでスループットを調整する機能が用意されています。ガイダンスとサンプルについては、Azure Resource Manager、Powershell、および Azure CLI に関する記事を参照してください。

この方法の利点は、ピーク時のアクティビティ、またはアクティビティの少ない時間帯を考慮して、タイマーに基づいてリソースのスケールアップまたはスケールダウンを自動化できることです。 Azure Functions と PowerShell を使用してこれを実現する方法については、こちらのサンプルをご覧ください。

この方法の欠点は、スケールのニーズの予測不能な変化にリアルタイムで対応できないことです。代わりに、クライアントまたは SDK レベルで、または自動スケーリングを使用して、システム内のアプリケーションコンテキストを利用することが必要になる場合があります。

特定の SDK で CQL クエリを使用する

指定されたデータベースまたはコンテナーに対して CQL ALTER コマンドを実行することで、コードを使用してシステムを動的にスケールできます。

この方法の利点は、スケールのニーズに動的に対応でき、しかもご利用のアプリケーションに適したカスタムの方法で対応できることです。この方法でも、標準 RU/秒の課金とレートを引き続き利用できます。システムのスケールニーズがほぼ予測可能 (約 70% 以上) な場合は、CQL で SDK を使用する方が、自動スケーリングを使用した場合よりも自動スケールのコスト効率が高くなる可能性があります。この方法の欠点は、再試行を実装するのが非常に複雑になる上に、レート制限によって待機時間が長くなる可能性があることです。

自動スケーリングでプロビジョニングされたスループットを使用する

標準 (手動) またはプログラムによるスループットのプロビジョニングの方法に加えて、自動スケーリングでプロビジョニングされたスループットでも、Azure Cosmos DB のコンテナーを構成することができます。自動スケーリングでは、SLA を損なうことなく、消費ニーズに合わせて、指定された RU 範囲内で自動的かつ即座にスケールが行われます。詳細については、自動スケーリングで Azure Cosmos DB のコンテナーとデータベースを作成する方法に関する記事を参照してください。

この方法の利点は、これがシステムのスケーリングニーズを管理する最も簡単な方法だということです。これによりレート制限が構成された RU 範囲内に適用されません。欠点は、システムのスケーリングニーズが予測可能な場合、自動スケーリングは、スケーリングニーズを処理する方法としては、前述のカスタムのコントロールプレーンまたは SDK レベルのアプローチを使用するよりもコスト効率に劣る可能性があることです。

CQL を使用して自動スケーリングの最大スループット (RU) を設定または変更するには、次を使用します (キースペース/テーブル名を適宜置き換えてください)。

# to set max throughput (RUs) for autoscale at keyspace level:
create keyspace <keyspace name> WITH cosmosdb_autoscale_max_throughput=5000;

# to alter max throughput (RUs) for autoscale at keyspace level:
alter keyspace <keyspace name> WITH cosmosdb_autoscale_max_throughput=4000;

# to set max throughput (RUs) for autoscale at table level:
create table <keyspace name>.<table name> (pk int PRIMARY KEY, ck int) WITH cosmosdb_autoscale_max_throughput=5000;

# to alter max throughput (RUs) for autoscale at table level:
alter table <keyspace name>.<table name> WITH cosmosdb_autoscale_max_throughput=4000;

次のステップ

Java アプリケーションを使用した Cassandra 用 API アカウント、データベースおよびテーブルを作成してみる

次の方法で共有