Guía de configuración del catálogo de Unity

En esta página se describe la configuración inicial del catálogo de Unity para los administradores del área de trabajo en una nueva área de trabajo de Azure Databricks, entre las que se incluyen:

  • Confirmación de que el área de trabajo está habilitada para el catálogo de Unity
  • Gestión del acceso y las identidades del espacio de trabajo
  • Creación de recursos de proceso compatibles con el catálogo de Unity
  • Creación de un catálogo y un esquema para los datos
  • Conceder a los usuarios los privilegios que necesitan

Antes de empezar

Antes de empezar, familiarícese con los siguientes conceptos del catálogo de Unity:

  • Metastore: el contenedor de catálogo de Unity de nivel superior, cuyo ámbito es una sola región de nube. Contiene todos los objetos protegibles: catálogos, credenciales de almacenamiento, ubicaciones externas, etc. Consulte Metastore.
  • Catálogo: el objeto contenedor de datos de nivel más alto dentro de un metastore. Los catálogos contienen esquemas, que a su vez contienen tablas, vistas, volúmenes y funciones. Consulte Catálogo.
  • Roles de administrador: El catálogo de Unity tiene tres roles de administrador principales, administrador de cuentas, administrador del área de trabajo y administrador de metastore, cada uno con un ámbito y responsabilidades diferentes. Consulte Privilegios de administrador en Unity Catalog.

También necesitará lo siguiente:

Paso 1: Confirmar que el área de trabajo está habilitada para el catálogo de Unity

Use uno de los siguientes métodos para confirmar que su espacio de trabajo está asociado a un metastore de Unity Catalog.

Usa la consola de la cuenta

Este método requiere privilegios de administrador de cuentas.

  1. Como administrador de la cuenta de Azure Databricks, inicie sesión en la consola de la cuenta.
  2. Haga clic en el icono Áreas de trabajo.Áreas de trabajo.
  3. Busque el área de trabajo y compruebe la columna Metastore. Si aparece un nombre de metastore, tu espacio de trabajo tiene habilitado Unity Catalog.

Ejecución de una consulta SQL

Este método no requiere privilegios de administrador, pero requiere un recurso de proceso compatible con el catálogo de Unity. Paso 3: Crear un proceso compatible con el catálogo de Unity le guía a través de la creación de recursos de proceso compatibles con UC.

Ejecute el siguiente comando en el editor de consultas SQL o en un cuaderno asociado a un recurso de proceso:

SELECT CURRENT_METASTORE();

Si la consulta devuelve un identificador de metastore, el área de trabajo está habilitada para el catálogo de Unity.

Salida actual de metastore

Si el área de trabajo no está habilitado para usar Unity Catalog, consulte Actualizar un área de trabajo de Azure Databricks a Unity Catalog.

Paso 2: Administración del acceso e identidades del área de trabajo

Los administradores del área de trabajo pueden agregar usuarios y grupos, asignar roles de administrador y administrar entidades de servicio.

Agregar usuarios

Agregue usuarios individuales que necesiten acceso a esta área de trabajo. Para obtener instrucciones, consulte Administración de usuarios.

Organización de usuarios en grupos

Databricks recomienda administrar el acceso a través de grupos en lugar de usuarios individuales. Conceder privilegios a un grupo los aplica a todos los miembros, lo que reduce la sobrecarga administrativa a medida que crece el equipo.

  • Si su organización ya tiene grupos en un proveedor de identidades (IdP): sincronice para Azure Databricks mediante el aprovisionamiento automático de identity management o SCIM para que la pertenencia a grupos permanezca sincronizada automáticamente. Consulte Administración automática de identidades.
  • Si aún no tiene grupos: como administrador del área de trabajo, cree grupos de nivel de cuenta; para ello, vaya a Configuración>Identidad y acceso>a Administrar junto a Grupos. Consulte Administración de grupos.

Asignar roles de administrador

Los administradores del área de trabajo pueden realizar la mayoría de las tareas administrativas diarias: agregar y quitar usuarios, administrar el proceso, configurar la configuración del área de trabajo y conceder acceso a los datos. Este rol es adecuado para los miembros de una plataforma de datos central o un equipo de TI responsables de mantener el área de trabajo. Sea selectivo sobre quién recibe este rol. Los administradores del área de trabajo tienen acceso amplio a los recursos y la configuración del área de trabajo.

Normalmente, el rol de administrador del área de trabajo es el único rol de administrador que necesita asignar. Opcionalmente, puede asignar administradores de metastore para casos de uso especiales. Por ejemplo, puede asignar este rol a un equipo de gobernanza de datos dedicado o a un pequeño grupo de ingenieros de plataforma sénior si necesita:

  • Delegar la creación del catálogo en administradores que no son del área de trabajo.
  • Administre el script de inicialización y la lista de permitidos de JAR.
  • Recibir datos compartidos a través de Delta Sharing.
  • Transferir la propiedad del objeto cuando un miembro del equipo sale.

Para obtener instrucciones sobre cómo asignar estos roles, consulte Privilegios de administrador en el catálogo de Unity.

Paso 3: Creación de un proceso compatible con el catálogo de Unity

Para ejecutar cargas de trabajo del catálogo de Unity, los recursos de proceso deben cumplir los requisitos de seguridad del catálogo de Unity. La siguiente tabla muestra qué tipos de computación cumplen los requisitos:

Tipo de cálculo Compatible con UC
Almacén de SQL
Computación sin servidor (cuadernos, trabajos, canalizaciones)
Clúster: modo de acceso de usuario único
Clúster: modo de acceso compartido
Clúster — modo de acceso compartido sin aislamiento No

Para crear computación compatible con UC:

Como administrador del área de trabajo, puede restringir la creación de clústeres solo a los administradores o usar directivas de clúster para permitir que los usuarios creen sus propios clústeres compatibles con el catálogo de Unity. Vea permisos de proceso y Creación y administración de directivas de proceso.

Paso 4: Crear catálogos y esquemas

Los catálogos son la unidad principal de aislamiento de datos en el catálogo de Unity. Todos los esquemas, tablas, volúmenes, vistas y funciones residen en catálogos.

Cuándo crear un nuevo catálogo

Las nuevas áreas de trabajo se provisionan automáticamente con un catálogo del área de trabajo; de forma predeterminada, este catálogo recibe el nombre del área de trabajo. Para comprobar si tiene un catálogo de áreas de trabajo, haga clic en icono Datos.Cataloge en la barra lateral y busque un catálogo que coincida con el nombre del área de trabajo. Si existe, es posible que no necesite crear catálogos adicionales de inmediato.

Con el tiempo, considere crear nuevos catálogos a medida que aumente su uso, organizados en torno a límites lógicos, como:

  • Equipos o unidades de negocio: catálogos independientes para ingeniería, finanzas y marketing
  • Entornos: devcatálogos separados, staging y prod para aislar los datos de desarrollo de los de producción
  • Proyectos: un catálogo dedicado por producto o iniciativa de datos principales

Si los límites de datos de la organización ya están bien definidos, puede crear catálogos ahora.

Crear un catálogo

Para crear un catálogo, ejecute el siguiente código SQL.

CREATE CATALOG IF NOT EXISTS <catalog-name>;

Note

Los datos administrados de este catálogo se almacenan en la ubicación de almacenamiento administrada predeterminada del metastore. Para usar una ubicación diferente, especifique un MANAGED LOCATION. Consulte Conexión al almacenamiento de objetos en la nube mediante el catálogo de Unity.

A continuación, cree un esquema para organizar las tablas y otros objetos de datos:

CREATE SCHEMA IF NOT EXISTS <catalog-name>.<schema-name>;

Para obtener instrucciones detalladas y cómo usar el Explorador de catálogos, consulte Creación de catálogos y Creación de esquemas.

Paso 5: Conceder privilegios a los usuarios

En el Catálogo de Unity, los usuarios no tienen acceso a los datos de forma predeterminada. Los administradores del área de trabajo pueden conceder privilegios a objetos protegibles en todo el área de trabajo. Databricks recomienda conceder privilegios a grupos en lugar de usuarios individuales. Esto facilita la administración del acceso a medida que crece el equipo.

Habilitación de la detección de datos

Azure Databricks recomienda conceder el privilegio BROWSE en todos los catálogos al grupo All account users. BROWSE permite a los usuarios ver que existen objetos y ver sus metadatos en el Explorador de catálogos sin conceder acceso a los datos subyacentes. Esto permite a los usuarios detectar datos y solicitar acceso sin necesidad de que los administradores concedan permisos de forma preventiva.

GRANT BROWSE ON CATALOG <catalog-name> TO `account users`;

Concesión de acceso a datos

Para acceder a los datos en el Catálogo de Unity, los usuarios suelen necesitar el privilegio específico para la operación (por SELECT ejemplo, para leer una tabla) y los privilegios de uso adecuados (como USE CATALOG en el catálogo primario y USE SCHEMA en el esquema primario). Consulte Conceptos del modelo de permisos de Unity Catalog.

Conceda estos privilegios solo a los usuarios y grupos que necesitan acceso a catálogos y esquemas específicos. Por ejemplo, para conceder acceso de solo lectura a un esquema, use el siguiente código SQL:

GRANT USE CATALOG ON CATALOG <catalog-name> TO `<group-name>`;
GRANT USE SCHEMA ON SCHEMA <catalog-name>.<schema-name> TO `<group-name>`;
GRANT SELECT ON SCHEMA <catalog-name>.<schema-name> TO `<group-name>`;

Para acceso de lectura y escritura:

GRANT USE CATALOG ON CATALOG <catalog-name> TO `<group-name>`;
GRANT USE SCHEMA ON SCHEMA <catalog-name>.<schema-name> TO `<group-name>`;
GRANT SELECT, MODIFY ON SCHEMA <catalog-name>.<schema-name> TO `<group-name>`;

Los patrones de acceso cambian con el tiempo. Use las páginas siguientes como referencia al administrar privilegios en el catálogo de Unity:

Lista de comprobación de configuración

Si ha completado los cinco pasos, Unity Catalog se configura en el área de trabajo y los usuarios pueden empezar a trabajar con datos. Use la siguiente lista de comprobación para confirmar que todo está en su lugar:

Pasos siguientes

Con la configuración del catálogo de Unity, puede empezar a aplicar funcionalidades de gobernanza más avanzadas al área de trabajo.

Control de acceso basado en atributos

El control de acceso basado en atributos (ABAC) permite definir directivas de acceso dinámicas y específicas basadas en atributos de los datos y el usuario que accede a ellos. En lugar de administrar la tabla de permisos por tabla, se escriben directivas que aplican automáticamente el filtrado de nivel de fila y el enmascaramiento de nivel de columna. Por ejemplo, puede ocultar columnas confidenciales de usuarios externos a una región específica o enmascarar PII para roles sin privilegios.

Enmascaramiento de columnas de ABAC en acción

Clasificación de los datos

La clasificación de datos usa un agente de IA para examinar automáticamente el catálogo y etiquetar datos confidenciales, como PII, información financiera y credenciales. Después de la clasificación, las etiquetas se pueden integrar directamente con las directivas de ABAC, lo que permite aplicar controles de gobernanza en función de lo que los datos contienen realmente en lugar de administrar el objeto de acceso por objeto.

Resultados de clasificación de datos

Supervisión de la calidad de los datos

La supervisión de la calidad de los datos proporciona detección de anomalías en todas las tablas de un esquema y la generación de perfiles de datos en el nivel de tabla. La detección de anomalías supervisa automáticamente la actualidad y la completitud de los datos a partir de patrones históricos, detectando incidencias sin necesidad de configuración manual. La generación de perfiles de datos captura distribuciones estadísticas a lo largo del tiempo, lo que le permite realizar un seguimiento de la integridad de los datos y establecer alertas para cambios inesperados.

Panel de supervisión de calidad de datos

Gobernanza de inteligencia artificial con Unity AI Gateway

Unity AI Gateway amplía la gobernanza del catálogo de Unity a la inteligencia artificial. Proporciona gobernanza empresarial para endpoints, agentes y servidores MCP para LLM, lo que permite implementar control de acceso, registro de auditoría y observabilidad en todas las interacciones de IA desde una interfaz de usuario unificada.