Sdílet prostřednictvím


Koncepty tabulek Azure Databricks

Tabulka Azure Databricks se nachází ve schématu a obsahuje řádky dat. Výchozí typ tabulky vytvořený v Azure Databricks je spravovaná tabulka služby Unity Catalog.

Následující příklad ukazuje spravovanou tabulku s názvem prod.people_ops_employees , která obsahuje data o pěti zaměstnanech. Jako spravovaná tabulka se datové soubory ukládají do umístění spravovaného úložiště katalogu Unity v cloudovém úložišti.

Příklad tabulky obsahující data zaměstnanců

Formáty úložiště

Typy tabulek v Azure Databricks definují způsob vlastnictví a přístupu k datům. Formát úložiště samostatně definuje, jak jsou data fyzicky strukturovaná a sledována na disku.

Azure Databricks podporuje dva primární otevřené formáty úložiště tabulek:

  • Delta Lake je výchozí formát úložiště pro spravované a externí tabulky v Azure Databricks.
  • Apache Iceberg se podporuje u spravovaných a cizích tabulek v Azure Databricks. Tento formát je užitečný při integraci s ekosystémem Iceberg.

Tyto formáty přidávají transakční vrstvu úložiště, která sleduje metadata a umožňuje atomicitu, konzistenci, izolaci a odolnost (ACID), časovou cestu a další funkce.

Typy tabulek

Azure Databricks nabízí tři primární typy tabulek, které jsou navržené pro různé scénáře správy dat a modely vlastnictví. Volba typu tabulky určuje, jak Azure Databricks spravuje podkladové datové soubory a metadata.

Primárním rozdílem pro typy tabulek v Azure Databricks je vlastnící katalog, jak je popsáno v následující tabulce:

Typ tabulky Správa katalogu Podpora čtení a zápisu Optimalizace výkonu Optimalizace nákladů na úložiště
Řízený Katalog Unity Ano Ano Ano
External Žádné (pouze soubory) Ano Pouze ručně Pouze ručně
Zahraniční Externí systém nebo služba katalogu Jen pro čtení Ne Ne

Spravované tabulky

Spravované tabulky spravují podkladové datové soubory spolu s registrací metastoru. Databricks doporučuje používat spravované tabulky při každém vytvoření nové tabulky. Spravované tabulky Unity Catalog jsou výchozí při vytváření tabulek v Azure Databricks. Viz Spravované tabulky.

Externí tabulky

Externí tabulky, někdy označované jako nespravované tabulky, odkazují na data uložená mimo Databricks v externím systému úložiště, jako je cloudové úložiště objektů. Oddělují správu podkladových datových souborů od registrace metastoru. Katalog Unity podporuje externí tabulky v několika formátech, včetně Delta Lake. Externí tabulky Katalogu Unity můžou ukládat datové soubory pomocí běžných formátů čitelných externími systémy. Viz Externí tabulky.

Cizí tabulky

Cizí tabulky představují data uložená v externích systémech připojených k Azure Databricks prostřednictvím federace Lakehouse. Cizí tabulky jsou v Azure Databricks jen pro čtení. Podívejte se na cizí tabulky.

Tabulky v katalogu Unity

V katalogu Unity se tabulky nacházejí na třetí úrovni oboru názvůcatalog.schema.table se třemi úrovněmi, jak je znázorněno v následujícím diagramu:

Diagram objektového modelu Unity, zaměřený na tabulku

Základní oprávnění tabulky

Většina operací tabulek vyžaduje USE CATALOG a USE SCHEMA oprávnění k katalogu a schématu obsahujícímu tabulku.

Následující tabulka shrnuje další oprávnění potřebná pro běžné operace tabulek v katalogu Unity:

Operation Povolení
Vytvoření tabulky CREATE TABLE na obsahujícím schématu
Dotazování na tabulku SELECT v tabulce
Aktualizace, odstranění, sloučení nebo vložení dat do tabulky SELECT a MODIFY v tabulce
Přetažení tabulky MANAGE v tabulce
Nahrazení tabulky MANAGE v tabulce v CREATE TABLE obsahujícím schématu

Další informace o oprávněních katalogu Unity najdete v tématu Správa oprávnění v katalogu Unity.