Notatka
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Important
Nie używaj indeksów filtrów Bloom. Azure Databricks wycofał tę funkcję i zaleca usunięcie wszystkich istniejących indeksów Bloom filters z tabel.
Indeksy filtru Bloom są starszym mechanizmem pomijania danych, którego Azure Databricks nie zaleca już dla żadnych obciążeń. Dodają obciążenie związane z zapisem, są trudne do konfiguracji i są zastępowane przez bardziej efektywne alternatywy.
Zalecane alternatywy
Zamiast tego użyj następujących funkcji:
- Predictive I/O: W przypadku obliczeń z włączonym Photonem przy użyciu środowiska Databricks Runtime 12.2 lub nowszego, Predictive I/O automatycznie pomija pliki we wszystkich kolumnach. W pełni zastępuje indeksy filtrów Bloom, które dodają tylko obciążenie zapisu po włączeniu funkcji Photon.
- Klastrowanie płynne: W środowisku Databricks Runtime 13.3 i nowszych, klastrowanie płynne poprawia pomijanie danych przez organizowanie informacji według często filtrowanych kolumn.
Usuwanie istniejących indeksów filtrów Bloom
Jeśli masz istniejące indeksy filtrów Bloom w tabelach, upuść je, aby wyeliminować niepotrzebne obciążenie zapisu:
DROP BLOOMFILTER INDEX ON TABLE table_name
Aby uzyskać szczegółowe informacje o składni, zobacz DROP BLOOM FILTER INDEX.
Po usunięciu wszystkich indeksów filtru Bloom uruchom polecenie VACUUM , aby wyczyścić bazowe pliki indeksów w _delta_index katalogu.