Udostępnij za pośrednictwem


Indeksy filtrów Blooma (przestarzałe)

Important

Nie używaj indeksów filtrów Bloom. Azure Databricks wycofał tę funkcję i zaleca usunięcie wszystkich istniejących indeksów Bloom filters z tabel.

Indeksy filtru Bloom są starszym mechanizmem pomijania danych, którego Azure Databricks nie zaleca już dla żadnych obciążeń. Dodają obciążenie związane z zapisem, są trudne do konfiguracji i są zastępowane przez bardziej efektywne alternatywy.

Zamiast tego użyj następujących funkcji:

  • Predictive I/O: W przypadku obliczeń z włączonym Photonem przy użyciu środowiska Databricks Runtime 12.2 lub nowszego, Predictive I/O automatycznie pomija pliki we wszystkich kolumnach. W pełni zastępuje indeksy filtrów Bloom, które dodają tylko obciążenie zapisu po włączeniu funkcji Photon.
  • Klastrowanie płynne: W środowisku Databricks Runtime 13.3 i nowszych, klastrowanie płynne poprawia pomijanie danych przez organizowanie informacji według często filtrowanych kolumn.

Usuwanie istniejących indeksów filtrów Bloom

Jeśli masz istniejące indeksy filtrów Bloom w tabelach, upuść je, aby wyeliminować niepotrzebne obciążenie zapisu:

DROP BLOOMFILTER INDEX ON TABLE table_name

Aby uzyskać szczegółowe informacje o składni, zobacz DROP BLOOM FILTER INDEX.

Po usunięciu wszystkich indeksów filtru Bloom uruchom polecenie VACUUM , aby wyczyścić bazowe pliki indeksów w _delta_index katalogu.