Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Azure Databricks poskytuje několik typů tabulek a formátů úložiště, které vyhovují různým potřebám správy dat. Tato část se zabývá spravovanými, externími a cizími tabulkami spolu s formáty úložiště Delta Lake a Apache Iceberg, které poskytují pokročilé funkce, jako jsou atomicita, konzistence, izolace a stálost (ACID) transakce a časové cestování.
Klíčové koncepty
Seznamte se se základy typů tabulek, formátů úložiště a integrace katalogu Unity.
| Téma | Description |
|---|---|
| Koncepty tabulek | Základní koncepty a základní informace o typech tabulek, formátech úložiště a integraci katalogu Unity |
Typy tabulek
Prozkoumejte různé typy tabulek a jejich možnosti pro různé scénáře správy dat.
| Typ tabulky | Description |
|---|---|
| Spravované tabulky | Tabulky, ve kterých Azure Databricks spravuje metadata i datové soubory. Doporučuje se pro nové tabulky s optimalizovaným výkonem a úložištěm. |
| externí tabulky | Tabulky, které odkazují na data uložená v externích systémech úložiště při správě metadat v katalogu Unity |
| Cizí tabulky | Tabulky jen pro čtení představující data v externích systémech připojených přes Lakehouse Federation. |
Formáty úložiště
Pracujte s otevřenými formáty tabulek, které poskytují pokročilé možnosti správy dat.
| Formát | Description |
|---|---|
| Delta Lake | Výchozí formát úložiště poskytující transakce ACID, historii verzí a vynucení schématu pro externí a spravované tabulky. |
| Apache Iceberg | Otevřený formát tabulky pro integraci s ekosystémem Iceberg, který podporuje pokročilou správu metadat. |
Správa tabulek
Konfigurace a optimalizace chování, struktury a výkonu tabulek
| Vlastnost | Description |
|---|---|
| Omezení tabulky | Definujte a vynucujte pravidla kvality dat s omezeními kontroly a ne omezeními null. |
| Vynucení schématu | Řízení způsobu, jakým Azure Databricks zpracovává změny schématu a vynucení datového typu během zápisu |
| Dělení tabulek | Uspořádejte data podle klíčů oddílů za účelem zlepšení výkonu dotazů a správy dat. |
| Monitorování velikosti tabulky | Monitorujte a analyzujte vzorce využití a růstu úložiště tabulek. |
| Převod externího na spravované | Migrace externích tabulek do spravovaných tabulek pro lepší výkon a správu |
| Zjišťování externích oddílů | Automatické zjišťování a registrace particí v externích tabulkách uložených v cloudovém úložišti |