[アーティクル]
10/25/2012

ハッシュ結合について

ハッシュ結合には、ビルド入力とプローブ入力という 2 つの入力があります。クエリオプティマイザでは、2 つの入力のうち小さい方がビルド入力になるように、ロールを割り当てます。

ハッシュ結合は多種多様な集合の照合操作に使用されます。ハッシュ結合を使用できるのは、Inner Join、Left Outer Join、Right Outer Join、Full Outer Join、Left Semi Join、Right Semi Join、Intersect、Union、Diff です。また、ハッシュ結合の派生形では、重複の削除やグループ化を行うことができます (SUM(salary) GROUP BY department など)。このような変更では、ビルドとプローブの両方のロールに 1 つの入力しか使用しません。

ここでは、インメモリハッシュ結合、猶予ハッシュ結合、再帰的ハッシュ結合など、さまざまなハッシュ結合について説明します。

インメモリハッシュ結合

このハッシュ結合では、まずビルド入力全体がスキャンまたは計算され、メモリ内にハッシュテーブルが作成されます。各行はハッシュキー用に計算されたハッシュ値に従ってハッシュバケットに挿入されます。ビルド入力全体が使用可能なメモリを超えない場合、すべての行をハッシュテーブルに挿入できます。このビルドフェーズの後、プローブフェーズになります。プローブ入力全体が 1 回に 1 行ずつスキャンまたは計算されます。プローブ行ごとにハッシュキーの値が計算され、対応するハッシュバケットがスキャンされて、照合が行われます。

猶予ハッシュ結合

ビルド入力がメモリに入りきらない場合、ハッシュ結合が複数のステップで進められます。これを、猶予ハッシュ結合と呼びます。各ステップにはビルドフェーズとプローブフェーズがあります。まず、ビルド入力とプローブ入力全体が使用され、複数のファイルにパーティション分割されます (ハッシュキーにハッシュ関数を使用)。ハッシュキーにハッシュ関数を使用すると、2 つの結合レコードが同じファイルの組に含まれることが保証されます。したがって、2 つの大規模な入力を結合する作業は、小規模な同一作業の複数のインスタンスになります。その後、ハッシュ結合がパーティション分割されたファイルの組それぞれに適用されます。

再帰的ハッシュ結合

ビルド入力が大規模なので、標準の外部マージの入力に複数のマージレベルが必要な場合、複数のパーティション分割ステップと複数のパーティション分割レベルが必要です。パーティションの一部だけが大規模な場合、その特定のパーティションだけに使用するパーティション分割ステップが追加されます。すべてのパーティション分割ステップをできるだけ高速にするには、大規模な非同期 I/O 操作を使用し、1 つのスレッドで複数のディスクドライブを集中的に使用できるようにします。

注
ビルド入力がわずかに使用可能なメモリを超える場合は、インメモリハッシュ結合と猶予ハッシュ結合の要素が 1 つのステップに組み合わされ、ハイブリッドハッシュ結合が作成されます。

最適化時にどのハッシュ結合を使用するかを、常に決定できるわけではありません。このため SQL Server では、始めにインメモリハッシュ結合が使用され、ビルド入力のサイズに従って、徐々に猶予ハッシュ結合と再帰的ハッシュ結合に移行します。

オプティマイザが、2 つの入力のうち、ビルド入力になるべき小さい方を誤って予想した場合、ビルドロールとプローブロールは動的に逆転されます。ハッシュ結合では、必ず小さい方のオーバーフローファイルをビルド入力として使用します。この技法はロール逆転と呼ばれます。ロール逆転は、ディスクへの書き込みが少なくとも 1 回行われた後にハッシュ結合の内部で行われます。

注
ロール逆転は、クエリヒントやクエリの構造とは無関係に行われます。ロール逆転はクエリプランには示されません。ロール逆転が行われてもユーザーには認識されません。

ハッシュの保留

猶予ハッシュ結合または再帰的ハッシュ結合を説明するために、ハッシュの保留という用語が使用されることがあります。

注
再帰的ハッシュ結合またはハッシュの保留により、サーバーのパフォーマンスが低下します。トレース内に多数の Hash Warning イベントを確認した場合は、結合対象の列の統計を更新します。

ハッシュの保留の詳細については、「Hash Warning イベントクラス」を参照してください。

次の方法で共有

ハッシュ結合について

インメモリハッシュ結合

猶予ハッシュ結合

再帰的ハッシュ結合

ハッシュの保留

関連項目

参照

概念

その他の技術情報

その他のリソース

次の方法で共有

ハッシュ結合について

インメモリ ハッシュ結合

猶予ハッシュ結合

再帰的ハッシュ結合

ハッシュの保留

関連項目

参照

概念

その他の技術情報

その他のリソース

インメモリハッシュ結合