Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Important
N’utilisez pas d’index de filtre Bloom. Azure Databricks a déprécié cette fonctionnalité et recommande de supprimer les index de filtre Bloom existants de vos tables.
Les index de filtre Bloom sont un mécanisme de saut de données obsolète que Azure Databricks ne recommande plus pour aucune charge de travail. Ils ajoutent une surcharge d'écriture, sont difficiles à optimiser et sont remplacés par des alternatives plus efficaces.
Alternatives recommandées
Utilisez les fonctionnalités suivantes à la place :
- E/S prédictives : sur le calcul photon avec Databricks Runtime 12.2 et versions ultérieures, les E/S prédictives effectuent automatiquement un saut de fichier sur toutes les colonnes. Il remplace entièrement les index de filtre Bloom, ce qui ajoute uniquement une surcharge d’écriture lorsque Photon est activé.
- Clustering liquide : dans Databricks Runtime 13.3 et versions ultérieures, le clustering liquide améliore le saut de données en organisant les données en fonction des colonnes fréquemment filtrées.
Supprimer les index de filtre Bloom existants
Si vous disposez d’index de filtre Bloom existants sur vos tables, supprimez-les pour éliminer la surcharge d’écriture inutile :
DROP BLOOMFILTER INDEX ON TABLE table_name
Pour plus d’informations sur la syntaxe, consultez DROP BLOOM FILTER INDEX.
Après avoir supprimé tous les index de filtre Bloom, exécutez VACUUM pour nettoyer les fichiers d’index sous-jacents dans le _delta_index répertoire.