Co jsou schémata v Azure Databricks?
V Katalogu Unity je schéma podřízenou položkou katalogu a může obsahovat tabulky, zobrazení, svazky, modely a funkce. Schémata poskytují podrobnější kategorie datových organizací než katalogy.
Tento článek popisuje roli schémat v hierarchii datových objektů Azure Databricks v katalogu Unity.
Informace o schématech ve starším metastoru Hive v místním pracovním prostoru najdete v tématu Databázové objekty ve starším metastoru Hive.
Co je schéma?
V katalogu Unity je schéma druhou úrovní tříúrovňového oboru názvůcatalog.schema.table-etc
().
Schéma uspořádá data a prostředky AI do logických kategorií, které jsou podrobnější než katalogy. Schéma obvykle představuje jeden případ použití, projekt nebo týmový sandbox. Bez ohledu na typ kategorie jsou schémata užitečným nástrojem pro správu řízení přístupu k datům a zlepšení zjistitelnosti dat.
Poznámka:
V Azure Databricks se schémata někdy označují jako databáze. Například CREATE DATABASE
je alias pro CREATE SCHEMA
. Tato terminologie se liší od některých relačních databázových systémů, ve kterých je databáze kolekcí schémat.
Další informace o hierarchii datových objektů v katalogu Unity najdete v tématu Co jsou databázové objekty v Azure Databricks?.
Spravovaná umístění pro schémata
V katalogu Unity můžete fyzicky izolovat data pro všechny spravované tabulky a spravované svazky ve schématu od jiných schémat v katalogu zadáním spravovaného umístění úložiště pro schéma. To je zcela volitelné. Pokud pro schéma nezadáte spravované umístění úložiště, data se nacházejí ve spravovaném umístění úložiště katalogu (a pokud není pro katalog definován žádný, nachází se ve spravovaném umístění úložiště metastoru). Viz Určení spravovaného umístění úložiště v katalogu Unity.
Izolace dat pro externí tabulky a svazky závisí na tom, jak spravujete data v cloudovém úložišti. Je nezávislý na spravovaném umístění schématu.