Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Azure Databricks poskytuje několik typů tabulek a formátů úložiště, které vyhovují různým potřebám správy dat. Tato část se zabývá spravovanými, externími a cizími tabulkami spolu s formáty úložiště Delta Lake a Apache Iceberg, které poskytují pokročilé funkce, jako jsou atomicita, konzistence, izolace a stálost (ACID) transakce a časové cestování.
Klíčové koncepty
Seznamte se se základy typů tabulek, formátů úložiště a integrace katalogu Unity.
| Téma | Description |
|---|---|
| Koncepty tabulek | Základní koncepty a základní informace o typech tabulek, formátech úložiště a integraci katalogu Unity |
Typy tabulek
Prozkoumejte různé typy tabulek a jejich možnosti pro různé scénáře správy dat.
| Typ tabulky | Description |
|---|---|
| Spravované tabulky katalogu Unity v Azure Databricks pro Delta Lake a Apache Iceberg | Azure Databricks spravuje metadata a datové soubory. Používá se pro nové tabulky vyžadující optimalizovaný výkon. |
| Dočasné tabulky | Spravované tabulky katalogu Unity s oborem relace pro zprostředkující data Pouze sklady SQL. |
| Práce s externími tabulkami | Data uložená v externích systémech. Katalog Unity spravuje pouze metadata. |
| Práce s cizími tabulkami | Přístup k datům jen pro čtení v externích systémech připojených prostřednictvím federace Lakehouse |
Formáty úložiště
Pracujte s otevřenými formáty tabulek, které poskytují pokročilé možnosti správy dat.
| Formát | Description |
|---|---|
| Delta Lake | Výchozí formát úložiště poskytující transakce ACID, historii verzí a vynucení schématu pro externí a spravované tabulky. |
| Apache Iceberg | Otevřený formát tabulky pro integraci s ekosystémem Iceberg, který podporuje pokročilou správu metadat. |
Správa tabulek
Konfigurace a optimalizace chování, struktury a výkonu tabulek
| Vlastnost | Description |
|---|---|
| Omezení tabulky | Definujte a vynucujte pravidla kvality dat s omezeními kontroly a ne omezeními null. |
| Vynucení schématu | Řízení způsobu, jakým Azure Databricks zpracovává změny schématu a vynucení datového typu během zápisu |
| Dělení tabulek | Uspořádejte data podle klíčů oddílů za účelem zlepšení výkonu dotazů a správy dat. |
| Monitorování velikosti tabulky | Monitorujte a analyzujte vzorce využití a růstu úložiště tabulek. |
| Převod externího na spravované | Migrace externích tabulek do spravovaných tabulek pro lepší výkon a správu |
| Zjišťování externích oddílů | Automatické zjišťování a registrace particí v externích tabulkách uložených v cloudovém úložišti |