Indexes de filtres Bloom (déconseillés)

Important

N’utilisez pas d’index de filtre Bloom. Azure Databricks a déprécié cette fonctionnalité et recommande de supprimer les index de filtre Bloom existants de vos tables.

Les index de filtre Bloom sont un mécanisme de saut de données obsolète que Azure Databricks ne recommande plus pour aucune charge de travail. Ils ajoutent une surcharge d'écriture, sont difficiles à optimiser et sont remplacés par des alternatives plus efficaces.

Utilisez les fonctionnalités suivantes à la place :

  • E/S prédictives : sur le calcul photon avec Databricks Runtime 12.2 et versions ultérieures, les E/S prédictives effectuent automatiquement un saut de fichier sur toutes les colonnes. Il remplace entièrement les index de filtre Bloom, ce qui ajoute uniquement une surcharge d’écriture lorsque Photon est activé.
  • Clustering liquide : dans Databricks Runtime 13.3 et versions ultérieures, le clustering liquide améliore le saut de données en organisant les données en fonction des colonnes fréquemment filtrées.

Supprimer les index de filtre Bloom existants

Si vous disposez d’index de filtre Bloom existants sur vos tables, supprimez-les pour éliminer la surcharge d’écriture inutile :

DROP BLOOMFILTER INDEX ON TABLE table_name

Pour plus d’informations sur la syntaxe, consultez DROP BLOOM FILTER INDEX.

Après avoir supprimé tous les index de filtre Bloom, exécutez VACUUM pour nettoyer les fichiers d’index sous-jacents dans le _delta_index répertoire.