Dela via


Vad är scheman i Azure Databricks?

I Unity Catalog är ett schema underordnat en katalog och kan innehålla tabeller, vyer, volymer, modeller och funktioner. Scheman ger mer detaljerade kategorier av dataorganisation än kataloger.

Den här artikeln beskriver rollen för scheman i Azure Databricks-dataobjekthierarkin i Unity Catalog.

Information om scheman i det äldre arbetsytelokala Hive-metaarkivet finns i Databasobjekt i det äldre Hive-metaarkivet.

Vad är ett schema?

I Unity Catalog är ett schema den andra nivån i Unity Catalogs namnområde på tre nivåer (catalog.schema.table-etc).

Objektmodelldiagram för Unity Catalog, fokuserat på schema

Ett schema organiserar data och AI-tillgångar i logiska kategorier som är mer detaljerade än kataloger. Vanligtvis representerar ett schema ett enskilt användningsfall, ett projekt eller en sandbox-miljö för teamet. Oavsett kategorityp är scheman ett användbart verktyg för att hantera dataåtkomstkontroll och förbättra dataidentifieringen.

Kommentar

I Azure Databricks kallas scheman ibland för databaser. Är till exempel CREATE DATABASE ett alias för CREATE SCHEMA. Den här terminologin skiljer sig från den för vissa relationsdatabassystem där en databas är en samling scheman.

Mer information om dataobjekthierarkin i Unity Catalog finns i Vad är databasobjekt i Azure Databricks?.

Hanterade platser för scheman

I Unity Catalog kan du fysiskt isolera data för alla hanterade tabeller och hanterade volymer i ett schema från andra scheman i en katalog genom att ange en hanterad lagringsplats för schemat. Detta är helt valfritt. Om du inte anger någon hanterad lagringsplats för schemat finns data på katalogens hanterade lagringsplats (och om ingen har definierats för katalogen finns den på metaarkivets hanterade lagringsplats). Se Ange en hanterad lagringsplats i Unity Catalog.

Dataisolering för externa tabeller och volymer beror på hur du hanterar data i molnlagringen. Den är oberoende av schemats hanterade plats.

Nästa steg