tabulky Azure Databricks

Azure Databricks podporuje více typů tabulek a formátů úložiště, aby splňovaly různé potřeby správy dat. Přehled typů tabulek, formátů úložiště a integrace katalogu Unity najdete v tématu Azure Databricks koncepty tabulek.

Typy tabulek

Prozkoumejte různé typy tabulek a jejich možnosti pro různé scénáře správy dat.

Typ tabulky Description
spravované tabulky katalogu Unity Catalog v Azure Databricks pro Delta Lake a Apache Iceberg Azure Databricks spravuje metadata a datové soubory pro nové tabulky, které vyžadují optimalizovaný výkon.
Dočasné tabulky Spravované tabulky katalogu Unity s oborem relace pro zprostředkující data Pouze sklady SQL.
Práce s externími tabulkami Data uložená v externích systémech. Katalog Unity spravuje pouze metadata.
Práce s cizími tabulkami Přístup k datům jen pro čtení v externích systémech připojených prostřednictvím federace Lakehouse

Formáty úložiště

Pracujte s otevřenými formáty tabulek, které podporují pokročilé možnosti správy dat.

Formát Description
Delta Lake Výchozí formát úložiště s transakcemi ACID, časovým cestováním a vynuceným schématem pro spravované a externí tabulky.
Apache Iceberg Otevřený formát tabulky pro integraci s ekosystémem Iceberg, který podporuje pokročilou správu metadat.

Správa tabulek

Konfigurace a optimalizace chování, struktury a výkonu tabulek

Vlastnost Description
Omezení tabulky Definujte a vynucujte pravidla kvality dat s omezeními kontroly a ne omezeními null.
Vynucení schématu Určuje, jak Azure Databricks zpracovává změny schématu a vynucení datového typu během zápisu.
Dělení tabulek Uspořádejte data podle klíčů oddílů za účelem zlepšení výkonu dotazů a správy dat.
Monitorování velikosti tabulky Monitorujte a analyzujte vzorce využití a růstu úložiště tabulek.
Převod externího na spravované Migrace externích tabulek do spravovaných tabulek pro lepší výkon a správu
Zjišťování externích oddílů Automatické zjišťování a registrace particí v externích tabulkách uložených v cloudovém úložišti