Important
ブルーム フィルター インデックスは使用しないでください。 Azure Databricksは、この機能を非推奨としており、テーブルから既存のブルーム フィルター インデックスを削除することをお勧めします。
ブルーム フィルター インデックスは、レガシーなデータ スキップ メカニズムであり、Azure Databricksは現在、どのワークロードにも推奨していません。 書き込みのオーバーヘッドが増え、チューニングが困難になり、より効果的な代替手段に置き換えられます。
推奨される代替手段
代わりに、次の機能を使用します。
- 予測 I/O: Databricks Runtime 12.2 以降を使用した Photon 対応コンピューティングでは、予測 I/O はすべての列で自動的にファイル スキップを実行します。 これは、Photon が有効になっている場合にのみ書き込みオーバーヘッドを追加するブルーム フィルター インデックスに完全に置き換えられます。
- 液体クラスタリング: Databricks Runtime 13.3 以降では、液体クラスタリングでは、頻繁にフィルター処理される列に基づいてデータを整理することで、データのスキップが改善されます。
既存のブルーム フィルター インデックスを削除する
テーブルに既存の Bloom フィルター インデックスがある場合は、不要な書き込みオーバーヘッドを排除するために削除します。
DROP BLOOMFILTER INDEX ON TABLE table_name
構文の詳細については、DROP BLOOM FILTER INDEXを参照してください。
すべてのブルーム フィルター インデックスを削除した後、 VACUUM を実行して、 _delta_index ディレクトリ内の基になるインデックス ファイルをクリーンアップします。