Indexy Bloomova filtru (zastaralé)

Important

Nepoužívejte indexy filtru Bloom. Azure Databricks tuto funkci přestal používat a doporučuje odebrat z tabulek všechny existující indexy filtru Bloom.

Indexy filtru Bloom jsou starší mechanismus přeskakování dat, který Azure Databricks už nedoporučuje pro žádné úlohy. Přidávají režijní zápisové náklady, jsou obtížné ladit a jsou nahrazeny efektivnějšími alternativami.

Místo toho použijte následující funkce:

  • Prediktivní I/O: Na Photonem podporovaných výpočetních platformách s Databricks Runtime verze 12.2 a novější, prediktivní I/O automaticky provádí přeskočení souborů na základě všech sloupců. Plně nahrazuje indexy filtru Bloom, které přidávají režii při zápisu pouze při povolení Photon.
  • Dynamické clusterování: Ve službě Databricks Runtime 13.3 a novějších zlepšuje dynamické clusterování vynechání dat uspořádáním dat na základě často filtrovaných sloupců.

Odebrání existujících indexů filtru Bloom

Pokud máte v tabulkách existující indexy filtrů Bloom, odstraňte je, abyste eliminovali zbytečné režijní náklady na zápis:

DROP BLOOMFILTER INDEX ON TABLE table_name

Podrobnosti o syntaxi najdete v sekci DROP BLOOM FILTER INDEX.

Po vyřazení všech indexů filtru Bloom spusťte VACUUM ke ​​vyčištění podkladových indexových souborů v adresáři _delta_index.