Sdílet prostřednictvím


Tabulky Azure Databricks

Azure Databricks poskytuje několik typů tabulek a formátů úložiště, které vyhovují různým potřebám správy dat. Tato část se zabývá spravovanými, externími a cizími tabulkami spolu s formáty úložiště Delta Lake a Apache Iceberg, které poskytují pokročilé funkce, jako jsou atomicita, konzistence, izolace a stálost (ACID) transakce a časové cestování.

Klíčové koncepty

Seznamte se se základy typů tabulek, formátů úložiště a integrace katalogu Unity.

Téma Description
Koncepty tabulek Základní koncepty a základní informace o typech tabulek, formátech úložiště a integraci katalogu Unity

Typy tabulek

Prozkoumejte různé typy tabulek a jejich možnosti pro různé scénáře správy dat.

Typ tabulky Description
Spravované tabulky Tabulky, ve kterých Azure Databricks spravuje metadata i datové soubory. Doporučuje se pro nové tabulky s optimalizovaným výkonem a úložištěm.
externí tabulky Tabulky, které odkazují na data uložená v externích systémech úložiště při správě metadat v katalogu Unity
Cizí tabulky Tabulky jen pro čtení představující data v externích systémech připojených přes Lakehouse Federation.

Formáty úložiště

Pracujte s otevřenými formáty tabulek, které poskytují pokročilé možnosti správy dat.

Formát Description
Delta Lake Výchozí formát úložiště poskytující transakce ACID, historii verzí a vynucení schématu pro externí a spravované tabulky.
Apache Iceberg Otevřený formát tabulky pro integraci s ekosystémem Iceberg, který podporuje pokročilou správu metadat.

Správa tabulek

Konfigurace a optimalizace chování, struktury a výkonu tabulek

Vlastnost Description
Omezení tabulky Definujte a vynucujte pravidla kvality dat s omezeními kontroly a ne omezeními null.
Vynucení schématu Řízení způsobu, jakým Azure Databricks zpracovává změny schématu a vynucení datového typu během zápisu
Dělení tabulek Uspořádejte data podle klíčů oddílů za účelem zlepšení výkonu dotazů a správy dat.
Monitorování velikosti tabulky Monitorujte a analyzujte vzorce využití a růstu úložiště tabulek.
Převod externího na spravované Migrace externích tabulek do spravovaných tabulek pro lepší výkon a správu
Zjišťování externích oddílů Automatické zjišťování a registrace particí v externích tabulkách uložených v cloudovém úložišti