¿Qué son los esquemas en Azure Databricks?

En Unity Catalog, un esquema es un elemento secundario de un catálogo y puede contener tablas, vistas, volúmenes, modelos y funciones. Los esquemas proporcionan categorías más granulares de organización de datos que catálogos.

En esta página se describe el rol de esquemas en la jerarquía de objetos de datos de Azure Databricks en el catálogo de Unity.

Para obtener información sobre los esquemas del metastore de Hive local del área de trabajo antigua, consulte Database objects in the legacy Hive metastore.

¿Qué es un esquema?

En el catálogo de Unity, un esquema es el segundo nivel del espacio de nombres de tres niveles de Unity Catalog (catalog.schema.table-etc).

Diagrama del modelo de objetos de Unity Catalog, centrado en el esquema

Un esquema organiza los datos y los recursos de IA en categorías lógicas que son más granulares que los catálogos. Normalmente, un esquema representa un único caso de uso, proyecto o sandbox del equipo. Independientemente del tipo de categoría, los esquemas son una herramienta útil para administrar el control de acceso a datos y mejorar la detectabilidad de datos.

Nota:

En Azure Databricks, los esquemas a veces se denominan bases de datos. Por ejemplo, CREATE DATABASE es un alias para CREATE SCHEMA. Esta terminología difiere de la de algunos sistemas de base de datos relacionales en los que una base de datos es una colección de esquemas.

Nota:

Cada catálogo de catálogos de Unity incluye automáticamente un INFORMATION_SCHEMA, un esquema proporcionado por el sistema de vistas de metadatos de solo lectura que describen los objetos del catálogo. Es independiente de los esquemas creados por el usuario y el nombre está reservado. Consulte Esquema de información.

Para más información sobre la jerarquía de los objetos de datos en Unity Catalog, consulte ¿Qué son los objetos de base de datos en Azure Databricks?.

Ubicaciones administradas para esquemas

En Unity Catalog, puede aislar físicamente los datos de todas las tablas administradas y volúmenes administrados en un esquema de los demás esquemas de un catálogo especificando una ubicación de almacenamiento administrada para el esquema. Esto es totalmente opcional. Si no especifica una ubicación de almacenamiento administrada para el esquema, los datos residen en la ubicación de almacenamiento administrada del catálogo (y si no se define ninguna para el catálogo, reside en la ubicación de almacenamiento administrado del metastore). Consulte Especificar una ubicación de almacenamiento administrada en Unity Catalog.

El aislamiento de datos para tablas y volúmenes externos depende de cómo administre los datos en el almacenamiento en la nube. Es independiente de la ubicación administrada del esquema.

Pasos siguientes