Indeksy filtrów Blooma (przestarzałe)

Important

Nie używaj indeksów filtrów Bloom. Azure Databricks wycofał tę funkcję i zaleca usunięcie wszystkich istniejących indeksów Bloom filters z tabel.

Indeksy filtru Bloom są starszym mechanizmem pomijania danych, którego Azure Databricks nie zaleca już dla żadnych obciążeń. Dodają obciążenie związane z zapisem, są trudne do konfiguracji i są zastępowane przez bardziej efektywne alternatywy.

Zalecane alternatywy

Zamiast tego użyj następujących funkcji:

Predictive I/O: W przypadku obliczeń z włączonym Photonem przy użyciu środowiska Databricks Runtime 12.2 lub nowszego, Predictive I/O automatycznie pomija pliki we wszystkich kolumnach. W pełni zastępuje indeksy filtrów Bloom, które dodają tylko obciążenie zapisu po włączeniu funkcji Photon.
Klastrowanie płynne: W środowisku Databricks Runtime 13.3 i nowszych, klastrowanie płynne poprawia pomijanie danych przez organizowanie informacji według często filtrowanych kolumn.

Usuwanie istniejących indeksów filtrów Bloom

Jeśli masz istniejące indeksy filtrów Bloom w tabelach, upuść je, aby wyeliminować niepotrzebne obciążenie zapisu:

DROP BLOOMFILTER INDEX ON TABLE table_name

Aby uzyskać szczegółowe informacje o składni, zobacz DROP BLOOM FILTER INDEX.

Po usunięciu wszystkich indeksów filtru Bloom uruchom polecenie VACUUM , aby wyczyścić bazowe pliki indeksów w _delta_index katalogu.

Opinia

Czy ta strona była pomocna?

Last updated on 2026-04-11

Udostępnij za pośrednictwem

Indeksy filtrów Blooma (przestarzałe)

Zalecane alternatywy

Usuwanie istniejących indeksów filtrów Bloom

Opinia

Dodatkowe zasoby