Sdílet prostřednictvím


Co je tabulka?

Tabulka se nachází ve schématu a obsahuje řádky dat. Všechny tabulky vytvořené v Azure Databricks ve výchozím nastavení používají Delta Lake. Tabulky zálohované službou Delta Lake se také označují jako tabulky Delta.

Tabulka Delta ukládá data jako adresář souborů v cloudovém úložišti objektů a registruje metadata tabulek do metastoru v rámci katalogu a schématu. Všechny spravované tabulky v katalogu Unity a streamované tabulky jsou tabulky Delta. Externí tabulky Katalogu Unity můžou být tabulky Delta, ale nemusí být povinné.

V Databricks je možné vytvářet tabulky, které nepoužívají Delta Lake. Tyto tabulky neposkytují transakční záruky ani optimalizovaný výkon tabulek Delta. Pomocí jiných formátů než Delta Lake můžete vytvořit následující typy tabulek:

  • Externí tabulky.
  • Cizí tabulky.
  • Tabulky zaregistrované ve starším metastoru Hive

V katalogu Unity jsou tabulky umístěné na třetí úrovni oboru názvů tří úrovní (catalog.schema.table):

Diagram objektového modelu Unity, zaměřený na tabulku

Typy tabulek Azure Databricks

Azure Databricks umožňuje používat následující typy tabulek.

Spravované tabulky

Spravované tabulky spravují podkladové datové soubory spolu s registrací metastoru. Databricks doporučuje používat spravované tabulky při každém vytvoření nové tabulky. Spravované tabulky Unity Catalog jsou výchozí při vytváření tabulek v Azure Databricks. Vždy používají Delta Lake. Viz Práce se spravovanými tabulkami.

Externí tabulky

Externí tabulky, někdy označované jako nespravované tabulky, oddělí správu podkladových datových souborů od registrace metastoru. Externí tabulky Katalogu Unity můžou ukládat datové soubory pomocí běžných formátů čitelných externími systémy. Viz Práce s externími tabulkami.

Tabulky Delta

Termín Delta table se používá k popisu jakékoli tabulky zálohované delta lakem. Vzhledem k tomu, že tabulky Delta jsou výchozí v Azure Databricks, většina odkazů na tabulky popisuje chování tabulek Delta, pokud není uvedeno jinak.

Databricks doporučuje vždy pracovat s tabulkami Delta pomocí plně kvalifikovaných názvů tabulek místo cest k souborům.

Streamované tabulky

Tabulky streamování jsou tabulky Delta, které se primárně používají ke zpracování přírůstkových dat. Většina aktualizací streamovaných tabulek probíhá prostřednictvím operací aktualizace.

Streamované tabulky můžete zaregistrovat v katalogu Unity pomocí Databricks SQL nebo je definovat jako součást kanálu Delta Live Tables. Viz Načtení dat pomocí streamovaných tabulek v Databricks SQL. a Co jsou tabulky Delta Live?

Cizí tabulky

Cizí tabulky představují data uložená v externích systémech připojených k Azure Databricks prostřednictvím federace Lakehouse. Cizí tabulky jsou v Azure Databricks jen pro čtení. Podívejte se , co je Federace Lakehouse.

Tabulky funkcí

Libovolná tabulka Delta spravovaná katalogem Unity, která má primární klíč, je tabulka funkcí. Tabulky funkcí můžete volitelně nakonfigurovat pomocí online úložiště funkcí pro případy použití s nízkou latencí. Viz Práce s funkcemi v úložišti funkcí pracovního prostoru.

Tabulky Hive (starší verze)

Tabulky Hive popisují dva odlišné koncepty v Azure Databricks, z nichž obě jsou starší vzory a nedoporučuje se.

Tabulky zaregistrované pomocí starší verze metastoru Hive ukládají data ve výchozím nastavení ve starším kořenovém adresáři DBFS. Databricks doporučuje migrovat všechny tabulky ze starší verze HMS do katalogu Unity. Viz Databázové objekty ve starší verzi metastoru Hive.

Apache Spark podporuje registraci a dotazování tabulek Hive, ale tyto kodeky nejsou optimalizované pro Azure Databricks. Databricks doporučuje registrovat tabulky Hive jenom pro podporu dotazů na data zapsaná externími systémy. Viz tabulka Hive (starší verze).

Živé tabulky (zastaralé)

Živé tabulky termínů odkazují na dřívější implementaci funkcí, které jsou nyní implementovány jako materializovaná zobrazení. Veškerý starší kód, který odkazuje na živé tabulky, by se měl aktualizovat tak, aby používal syntaxi pro materializovaná zobrazení. Podívejte se , co jsou tabulky Delta Live? a použití materializovaných zobrazení v Databricks SQL.

Základní oprávnění tabulky

Aby uživatelé mohli vytvořit tabulku, musí mít CREATE TABLE ke schématu oprávnění a USE SCHEMA musí mít USE CATALOG oprávnění pro nadřazený katalog. Pokud chcete zadat dotaz na tabulku, musí mít SELECT uživatelé oprávnění k tabulce, USE SCHEMA oprávnění nadřazeného schématu a USE CATALOG oprávnění nadřazeného katalogu.

Další informace o oprávněních katalogu Unity najdete v tématu Správa oprávnění v katalogu Unity.