Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Important
Nepoužívejte indexy filtru Bloom. Azure Databricks tuto funkci přestal používat a doporučuje odebrat z tabulek všechny existující indexy filtru Bloom.
Indexy filtru Bloom jsou starší mechanismus přeskakování dat, který Azure Databricks už nedoporučuje pro žádné úlohy. Přidávají režijní zápisové náklady, jsou obtížné ladit a jsou nahrazeny efektivnějšími alternativami.
Doporučené alternativy
Místo toho použijte následující funkce:
- Prediktivní I/O: Na Photonem podporovaných výpočetních platformách s Databricks Runtime verze 12.2 a novější, prediktivní I/O automaticky provádí přeskočení souborů na základě všech sloupců. Plně nahrazuje indexy filtru Bloom, které přidávají režii při zápisu pouze při povolení Photon.
- Dynamické clusterování: Ve službě Databricks Runtime 13.3 a novějších zlepšuje dynamické clusterování vynechání dat uspořádáním dat na základě často filtrovaných sloupců.
Odebrání existujících indexů filtru Bloom
Pokud máte v tabulkách existující indexy filtrů Bloom, odstraňte je, abyste eliminovali zbytečné režijní náklady na zápis:
DROP BLOOMFILTER INDEX ON TABLE table_name
Podrobnosti o syntaxi najdete v sekci DROP BLOOM FILTER INDEX.
Po vyřazení všech indexů filtru Bloom spusťte VACUUM ke vyčištění podkladových indexových souborů v adresáři _delta_index.