SQL ウェアハウスのサイズ設定、スケーリング、およびキューの動作

この記事では、パフォーマンスとコストを最適化するために、Databricks SQL ウェアハウスのクエリキューのサイズ設定、スケーリング、管理を行う方法について説明します。 Databricks では、ほとんどのワークロードでサーバーレス SQL ウェアハウスを使用することをお勧めします。サーバーレス SQL ウェアハウスは、クエリのリソースを動的に管理することで、最高のパフォーマンスと効率を実現します。

サーバーレス SQL ウェアハウスの管理

サーバーレス SQL ウェアハウスでは、 インテリジェントワークロード管理 (IWM) を使用してクエリワークロードを自動的に管理します。 IWM は、インフラストラクチャの管理を必要とせずにクエリを迅速かつコスト効率よく処理する、AI を利用した一連の機能です。

インテリジェントなワークロード管理と自動スケール

IWM では、機械学習モデルを使用してコンピューティングリソースを動的に管理します。

新しいクエリが到着すると、IWM はそのリソース要件を予測し、使用可能な容量を確認します。
- 容量が存在する場合、クエリはすぐに開始されます。
- そうでない場合、クエリはキューに配置されます。
IWM はキューを継続的に監視します。待機時間が長くなる場合、自動スケーラーはキューに登録されたクエリを処理するために、より多くのクラスターをすばやくプロビジョニングします。
需要が減少すると、IWM はリソースをスケールダウンしてコストを削減しながら、最近のピーク時の負荷を処理するのに十分な容量を維持します。

このアプローチでは、次の機能が提供されます。

クエリ待ち時間を短く維持するための迅速なアップスケール。
ハードウェアが使用可能になるとすぐにクエリを許可することで、高スループットを実現します。
低需要時にコストを節約するための迅速な縮小。

サーバーレス SQL ウェアハウスのサイズ設定

クラスターサイズ (X-Small、Medium、Large など) は、1 つのクラスターで使用できるコンピューティングリソースを決定します。自動スケーラーは、必要に応じてそのサイズのクラスターを追加または削除します。

適切なサイズを選択するには、次のガイドラインを使用します。

1 つの大規模なウェアハウスから開始し、サーバーレス機能でコンカレンシーとパフォーマンスを管理できるようにします。通常、小さく始めてスケールアップするよりも、必要に応じてサイズを下げる方が効率的です。
クエリがディスクにスピルしている場合は、クラスターのサイズを大きくします。クエリプロファイルにスピルがあるかどうかを確認します。
同時実行クエリが多数あるワークロードの場合は、ピーク時の負荷を処理するのに十分な最大数のクラスターを構成します。ウェアハウス監視ページで『ピークキュークエリ』のメトリックを監視してください。

注

サーバーレス SQL ウェアハウスの場合、クラスターのサイズは、場合によっては、同等のクラスターサイズに対してプロおよびクラシック SQL ウェアハウスのドキュメントに記載されているものとは異なるインスタンスの種類を使用する場合があります。一般に、サーバーレス SQL ウェアハウスのクラスターサイズの価格/パフォーマンス比は、プロおよびクラシック SQL ウェアハウスのものと同様です。

倉庫のパフォーマンスの監視

これらのツールを使用して、任意の SQL ウェアハウスを監視および適切なサイズに設定できます。ウェアハウスのすべての種類におけるキュー内の問い合わせの最大数は1,000です。

[監視] ページ: [SQL ウェアハウスの監視] タブで、キューに入ったクエリのピークをチェックします。 0 を超える一貫性のある値は、より大きなクラスターサイズ以上のクラスターが必要になる可能性があることを示します。
クエリ履歴: 過去のクエリパフォーマンスを確認してボトルネックを特定します。
クエリプロファイル: 実行プランで、 ディスクにスピルされたバイト数などのメトリックを調べます。これは、ウェアハウスのサイズが小さすぎる可能性があることを示します。

クラシック型およびプロ型の SQL ウェアハウス

クラシックウェアハウスと Pro ウェアハウスでは、クラスターの数を構成する手動スケーリングモデルが使用されます。

サイズ設定とクラスターのプロビジョニング

Important

現在、5X-Large クラスターサイズは、プロおよびサーバーレス SQL ウェアハウスのベータ版です。ワークスペース管理者は、[ プレビュー] ページからこの機能へのアクセスを制御できます。 Azure Databricks プレビューの管理を参照してください。

クラシックまたはプロのウェアハウスを作成する場合は、クラスターサイズを選択し、クラスターの最小数と最大数を設定します。これらの SKU には、10 個の同時実行クエリごとに 1 つのクラスターの固定制限があります。

クラスターサイズ	ドライバーインスタンスの種類	ワーカー数
2 倍小	Standard_E8ds_v4	1 x Standard_E8ds_v4
特小サイズ	Standard_E8ds_v4	2 x Standard_E8ds_v4
小さい	Standard_E16ds_v4	4 × Standard_E8ds_v4
ミディアム	Standard_E32ds_v4	8 x Standard_E8ds_v4
大きい	Standard_E32ds_v4	16 x Standard_E8ds_v4
X-Large	Standard_E64ds_v4	32 x Standard_E8ds_v4
2 倍大	Standard_E64ds_v4	64 x Standard_E8ds_v4
3 倍大	Standard_E64ds_v4	128 x Standard_E8ds_v4
4 倍大	Standard_E64ds_v4	256 x Standard_E8ds_v4 （256 x 標準的なE8ds_v4）
5Xラージサイズ	Standard_E64ds_v4	512 x Standard_E8ds_v4

すべてのワーカーのインスタンスサイズは Standard_E8ds_v4 です。

各ドライバーとワーカーには、256 GB の Premium SSD LRS マネージドディスクが 1 つ接続されています。接続されたディスクは 1 時間ごとに課金されます。

クラシックおよびプロ SQL ウェアハウスに必要な Azure vCPU クォータ

クラシックまたはプロ SQL ウェアハウスを開始するには、Azure アカウントの Standard_E8ds_v4 インスタンスに十分な Azure vCPU クォータが必要です。次のガイドラインを使用して、必要な vCPU クォータを決定します。

SQL ウェアハウスが 1 つまたは 2 つしかない場合は、クラスター内のコアごとに 8 つの Azure vCPU が使用可能であることを確認します。これにより、ウェアハウスの再プロビジョニングを可能にする適切な Azure vCPU が確保されます。これは約 24 時間ごとに行われます。 SQL ウェアハウスで自動スケーリングまたはマルチクラスター負荷分散を使用する場合は、乗数を増やす必要がある場合があります。

SQL ウェアハウスの数が増えるにつれて、クラスター内の各コアに対して 4 個から 8 個の Azure vCPU を使用できるようになります。 Databricks は、より多くの個数で始め、安定性のために監視することをお勧めします。
SQL ウェアハウスで使用される Azure vCPU は、Data Science & Engineering または Databricks 以外のワークロードによって使用されるクラスターによって使用される Azure vCPU に加えて使用されます。

追加の Azure vCPU クォータを要求するには、Azure ドキュメントの「標準クォータ: VM シリーズでの制限の引き上げ」を参照してください。

注

この表の情報は、製品またはリージョンの可用性とワークスペースの種類によって異なる場合があります。

キューと自動スケールのロジック

クラシックウェアハウスとプロウェアハウスの場合、自動スケールでは、実行中のクエリとキューに登録されているすべてのクエリを処理するための推定時間に基づいてクラスターが追加されます。

クエリ読み込みの 2 分から 6 分: 1 つのクラスターを追加します。
6 ~ 12 分: 2 つのクラスターを追加します。
12 ~ 22 分: 3 つのクラスターを追加します。
22 分以上: 負荷がさらに15分増えるごとに、当初の3つのクラスターに加えて、1つのクラスターを追加します。

追加規則：

クエリがキューで5分間待機すると、ウェアハウスはスケールアップします。
15 分間連続して負荷が低いままの場合、倉庫は、その期間のピーク負荷を処理するために必要な最小値にスケールダウンします。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-02-26