Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Tabulka Azure Databricks se nachází ve schématu a obsahuje řádky dat. Výchozí typ tabulky vytvořený v Azure Databricks je spravovaná tabulka služby Unity Catalog.
Následující příklad ukazuje spravovanou tabulku s názvem prod.people_ops_employees , která obsahuje data o pěti zaměstnanech. Jako spravovaná tabulka se datové soubory ukládají do umístění spravovaného úložiště katalogu Unity v cloudovém úložišti.
Formáty úložiště
Typy tabulek v Azure Databricks definují způsob vlastnictví a přístupu k datům. Formát úložiště samostatně definuje, jak jsou data fyzicky strukturovaná a sledována na disku.
Azure Databricks podporuje dva primární otevřené formáty úložiště tabulek:
- Delta Lake je výchozí formát úložiště pro spravované a externí tabulky v Azure Databricks.
- Apache Iceberg se podporuje u spravovaných a cizích tabulek v Azure Databricks. Tento formát je užitečný při integraci s ekosystémem Iceberg.
Tyto formáty přidávají transakční vrstvu úložiště, která sleduje metadata a umožňuje atomicitu, konzistenci, izolaci a odolnost (ACID), časovou cestu a další funkce.
Typy tabulek
Azure Databricks nabízí tři primární typy tabulek, které jsou navržené pro různé scénáře správy dat a modely vlastnictví. Volba typu tabulky určuje, jak Azure Databricks spravuje podkladové datové soubory a metadata.
Primárním rozdílem pro typy tabulek v Azure Databricks je vlastnící katalog, jak je popsáno v následující tabulce:
| Typ tabulky | Správa katalogu | Podpora čtení a zápisu | Optimalizace výkonu | Optimalizace nákladů na úložiště |
|---|---|---|---|---|
| Řízený | Katalog Unity | Ano | Ano | Ano |
| External | Žádné (pouze soubory) | Ano | Pouze ručně | Pouze ručně |
| Zahraniční | Externí systém nebo služba katalogu | Jen pro čtení | Ne | Ne |
Spravované tabulky
Spravované tabulky spravují podkladové datové soubory spolu s registrací metastoru. Databricks doporučuje používat spravované tabulky při každém vytvoření nové tabulky. Spravované tabulky Unity Catalog jsou výchozí při vytváření tabulek v Azure Databricks. Viz Spravované tabulky.
Externí tabulky
Externí tabulky, někdy označované jako nespravované tabulky, odkazují na data uložená mimo Databricks v externím systému úložiště, jako je cloudové úložiště objektů. Oddělují správu podkladových datových souborů od registrace metastoru. Katalog Unity podporuje externí tabulky v několika formátech, včetně Delta Lake. Externí tabulky Katalogu Unity můžou ukládat datové soubory pomocí běžných formátů čitelných externími systémy. Viz Externí tabulky.
Cizí tabulky
Cizí tabulky představují data uložená v externích systémech připojených k Azure Databricks prostřednictvím federace Lakehouse. Cizí tabulky jsou v Azure Databricks jen pro čtení. Podívejte se na cizí tabulky.
Tabulky v katalogu Unity
V katalogu Unity se tabulky nacházejí na třetí úrovni oboru názvůcatalog.schema.table se třemi úrovněmi, jak je znázorněno v následujícím diagramu:
Základní oprávnění tabulky
Většina operací tabulek vyžaduje USE CATALOG a USE SCHEMA oprávnění k katalogu a schématu obsahujícímu tabulku.
Následující tabulka shrnuje další oprávnění potřebná pro běžné operace tabulek v katalogu Unity:
| Operation | Povolení |
|---|---|
| Vytvoření tabulky |
CREATE TABLE na obsahujícím schématu |
| Dotazování na tabulku |
SELECT v tabulce |
| Aktualizace, odstranění, sloučení nebo vložení dat do tabulky |
SELECT a MODIFY v tabulce |
| Přetažení tabulky |
MANAGE v tabulce |
| Nahrazení tabulky |
MANAGE v tabulce v CREATE TABLE obsahujícím schématu |
Další informace o oprávněních katalogu Unity najdete v tématu Správa oprávnění v katalogu Unity.