Mik azok a sémák az Azure Databricksben?
A Unity Catalogban a séma egy katalógus gyermeke, amely táblákat, nézeteket, köteteket, modelleket és függvényeket tartalmazhat. A sémák részletesebb adatszervezési kategóriákat biztosítanak, mint a katalógusok.
Ez a cikk a sémák szerepét ismerteti a Unity Catalog Azure Databricks adatobjektum-hierarchiájában.
Az örökölt munkaterület-helyi Hive metaadattár sémáiról további információt az örökölt Hive metaadattár adatbázis-objektumai című témakörben talál.
Mi az a séma?
A Unity Catalogban a séma a Unity Catalog háromszintű névterének (catalog.schema.table-etc
) második szintje.
A séma az adatokat és az AI-objektumokat a katalógusoknál részletesebb logikai kategóriákba rendezi. A séma általában egyetlen használati esetet, projektet vagy csapat tesztkörnyezetet jelöl. A kategóriák típusától függetlenül a sémák hasznos eszközök az adathozzáférés-vezérlés kezeléséhez és az adatok felderíthetőségének javításához.
Feljegyzés
Az Azure Databricksben a sémákat néha adatbázisoknak nevezik. Például CREATE DATABASE
a aliasa CREATE SCHEMA
. Ez a terminológia eltér bizonyos relációsadatbázis-rendszerektől, amelyekben az adatbázis sémák gyűjteménye.
További információ a Unity Catalog adatobjektum-hierarchiájáról: Mik azok az adatbázis-objektumok az Azure Databricksben?
Sémák felügyelt helyei
A Unity Katalógusban fizikailag elkülönítheti a séma összes felügyelt táblájának és felügyelt kötetének adatait a katalógus többi sémájától a séma felügyelt tárolási helyének megadásával. Ez teljesen nem kötelező. Ha nem ad meg felügyelt tárolási helyet a sémához, az adatok a katalógus felügyelt tárolási helyén találhatók (és ha nincs definiálva a katalógushoz, az a metaadattár felügyelt tárolási helyén található). Lásd: Felügyelt tárhely megadása a Unity Katalógusban.
A külső táblák és kötetek adatelkülönítésének függenie kell attól, hogyan kezeli az adatokat a felhőbeli tárolóban. Független a séma felügyelt helyétől.