Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En esta página se explica cómo crear y administrar comparticiones para Delta Sharing.
Un recurso compartido es un objeto protegible en el catálogo de Unity que puede usar para compartir los siguientes recursos de datos con uno o varios destinatarios:
- Tablas y particiones de tabla
- Tablas de streaming
- Tablas Iceberg administradas
- Vistas, incluidas las vistas dinámicas que restringen el acceso a nivel de filas y columnas
- Vistas materializadas
- Volúmenes
- Cuadernos
- Modelos de IA
Si comparte un esquema completo (base de datos), el destinatario puede acceder a todas las tablas, tablas de streaming, vistas, vistas materializadas, modelos y volúmenes en el esquema en el momento en que lo comparte, junto con los recursos de inteligencia artificial y datos agregados al esquema en el futuro.
Un recurso compartido puede contener datos y recursos de IA de solo un metastore de Unity Catalog. Puede agregar o eliminar datos y activos de IA de una compartición en cualquier momento.
Antes de crear un recurso compartido, asegúrese de que ha configurado Delta Sharing para su cuenta (para proveedores).
Para obtener más información sobre el modelo de uso compartido, consulte Recursos compartidos, proveedores y destinatarios.
Requisitos
Para crear un recurso compartido, debe:
- Ser administrador del metastore o tener el privilegio
CREATE SHARE
para el metastore de Unity Catalog donde están registrados los datos que quiere compartir. - Crear el recurso compartido mediante un área de trabajo de Azure Databricks que tenga asociado ese metastore de Unity Catalog.
Para agregar tablas, tablas de transmisión, tablas de Iceberg gestionadas, vistas o vistas materializadas a un recurso compartido, debe hacer lo siguiente:
- Ser el propietario del recurso compartido.
- Tener habilitados los privilegios
USE CATALOG
yUSE SCHEMA
en el catálogo y el esquema que incluyen la tabla, la tabla de flujo, la tabla de Iceberg administrada, la vista o la vista materializada o la propiedad del catálogo o esquema. - Tener habilitado el privilegio
SELECT
en la tabla, la tabla de flujo, la tabla de Iceberg administrada, la vista o la vista materializada. Debe mantener ese privilegio para que el recurso continúe compartido. Si lo pierde, el destinatario no puede acceder al recurso a través del recurso compartido. Databricks recomienda usar un grupo como propietario del recurso compartido.
Para agregar volúmenes a un recurso compartido, debe:
- Ser el propietario del recurso compartido.
- Tener los
USE CATALOG
privilegios yUSE SCHEMA
en el catálogo y esquema que contienen el volumen, o la propiedad del catálogo o esquema. - Tener el privilegio
READ VOLUME
en el volumen. Debe mantener ese privilegio para que el volumen siga siendo compartido. Si lo pierde, el destinatario no podrá acceder al volumen a través del recurso compartido. Databricks recomienda usar un grupo como propietario del recurso compartido.
Para agregar modelos a un recurso compartido, debe:
- Ser el propietario del recurso compartido.
- Tener los privilegios
USE CATALOG
yUSE SCHEMA
en el catálogo y esquema que contienen el modelo, o la propiedad del catálogo o esquema. - Tener el privilegio
EXECUTE
en el modelo. Debe mantener ese privilegio para que el modelo siga siendo compartido. Si lo pierde, el destinatario no puede acceder al modelo a través del recurso compartido. Databricks recomienda usar un grupo como propietario del recurso compartido.
Para compartir un esquema completo, debe:
- Ser el propietario del recurso compartido y el propietario del esquema, o tener
USE SCHEMA.
- Incluya
SELECT
en el esquema para compartir tablas. - Asegúrese de que
READ VOLUME
esté en el esquema para compartir volúmenes.
Para agregar archivos de cuaderno a un recurso compartido, debe ser:
- El propietario del recurso compartido, con el permiso CAN READ en el cuaderno.
Para conceder al destinatario acceso a un recurso compartido, debe ser uno de estos:
- Administrador del metastore.
- Usuario con permisos delegados o propietario tanto en el recurso compartido como en los objetos de destinatario ([
USE SHARE
+SET SHARE PERMISSION
] o propietario del recurso compartido) Y (propietario del destinatario oUSE RECIPIENT
).
Para ver recursos compartidos, debe ser uno de estos:
- Un administrador del metastore (puede ver todo)
- Un usuario con el privilegio
USE SHARE
(puede ver todo) - El propietario del objeto de recurso compartido
Requisitos de proceso:
- Si usa un cuaderno de Databricks para crear el recurso compartido, el recurso de proceso debe usar Databricks Runtime 11.3 LTS o superior y tener un modo de acceso estándar o dedicado (anteriormente compartido y de usuario único).
- Si usa instrucciones SQL para agregar un esquema a un recurso compartido (o actualizar o eliminar un esquema), deberá usar un almacén SQL o un equipo que ejecute Databricks Runtime 13.3 LTS o una versión superior. Hacer lo mismo con Explorador de catálogo no tiene requisitos de proceso.
Crear un objeto compartido
Para crear un recurso compartido, puede usar Catalog Explorer, la CLI de Unity Catalog de Databricks o el comando SQL CREATE SHARE
en un cuaderno de Azure Databricks o el editor de consultas de Databricks SQL.
Permisos necesarios: debe ser el administrador de metastore o un usuario con el CREATE SHARE
privilegio de metastore.
Explorador de catálogo
En el área de trabajo de Azure Databricks, haga clic en
Catálogo.
En la parte superior del panel Catálogo, haga clic en el
y seleccione Delta Sharing.
Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.
En la pestaña Compartido por mí, haga clic en el botón Compartir datos.
En la página Crear recurso compartido, escriba el nombre del recurso compartido y, si lo desea, un comentario.
Haga clic en Guardar y continuar.
Puede seguir agregando recursos de datos, o bien dejar de hacerlo y volver más adelante.
En la pestaña Agregar recursos de datos , seleccione las tablas, las tablas de streaming, los volúmenes, las vistas, las vistas materializadas y los modelos que desea compartir.
Para obtener instrucciones detalladas consulte:
- Incorporación de tablas a un recurso compartido
- Adición de tablas de streaming a un recurso compartido
- Adición de tablas de Iceberg administradas a un recurso compartido
- Agregar volúmenes a un recurso compartido
- Agregar vistas a un recurso compartido
- Agregar vistas materializadas a una compartición
- Incorporación de modelos a un recurso compartido
Haga clic en Guardar y continuar.
En la pestaña Agregar cuadernos, seleccione los cuadernos que desea compartir.
Para obtener instrucciones detalladas, consulte Adición de archivos de cuaderno a un recurso compartido.
Haga clic en Guardar y continuar.
En la pestaña Agregar destinatarios, seleccione los destinatarios con los que desea compartir.
Para obtener instrucciones detalladas, consulte Administración del acceso a los recursos compartidos de datos de Delta Sharing (para proveedores).
Haga clic en Compartir datos para compartir los datos con los destinatarios.
SQL
Ejecute el siguiente comando en un cuaderno o en el editor de consultas de Databricks SQL:
CREATE SHARE [IF NOT EXISTS] <share-name>
[COMMENT "<comment>"];
Ahora puede agregar tablas, tablas de streaming, volúmenes, vistas, vistas materializadas y modelos al recurso compartido.
Para obtener instrucciones detalladas consulte:
- Incorporación de tablas a un recurso compartido
- Adición de tablas de streaming a un recurso compartido
- Adición de tablas de Iceberg administradas a un recurso compartido
- Agregar volúmenes a un recurso compartido
- Agregar vistas a un recurso compartido
- Agregar vistas materializadas a una compartición
- Incorporación de modelos a un recurso compartido
Interfaz de línea de comandos (CLI)
Ejecute el siguiente comando mediante la CLI de Databricks.
databricks shares create <share-name>
Puede usar --comment
para agregar un comentario o --json
para agregar recursos al recurso compartido. Para obtener más información, consulte las secciones siguientes.
Ahora puede agregar tablas, tablas de streaming, volúmenes, vistas, vistas materializadas y modelos al recurso compartido.
Para obtener instrucciones detalladas consulte:
- Incorporación de tablas a un recurso compartido
- Adición de tablas de streaming a un recurso compartido
- Adición de tablas de Iceberg administradas a un recurso compartido
- Agregar volúmenes a un recurso compartido
- Agregar vistas a un recurso compartido
- Agregar vistas materializadas a una compartición
- Incorporación de modelos a un recurso compartido
Incorporación de tablas a un recurso compartido
Para agregar tablas a un recurso compartido, puede usar Catalog Explorer, la CLI de Unity Catalog de Databricks o los comandos SQL en un cuaderno de Azure Databricks o el editor de consultas de Databricks SQL.
Nota:
Los comentarios de tabla, los comentarios de columna y las restricciones de clave principal se incluyen en recursos compartidos que se comparten con un destinatario mediante el uso compartido de Databricks a Databricks el 25 de julio de 2024 o después. Si desea empezar a compartir comentarios y restricciones a través de un recurso compartido que se ha compartido con un destinatario antes de la fecha de lanzamiento, debe revocar y volver a conceder acceso al destinatario para desencadenar el uso compartido de comentarios y restricciones.
Permisos necesarios: debe ser el propietario del objeto de recurso compartido, tener los permisos USE CATALOG
y USE SCHEMA
en el catálogo y el esquema que contienen la tabla, y el privilegio SELECT
sobre la tabla. Debe mantener el privilegio SELECT
siempre que desee compartir la tabla. Para obtener más información, consulte los requisitos.
Nota:
Si es administrador del área de trabajo y ha heredado los permisos USE SCHEMA
y USE CATALOG
en el esquema y el catálogo que contienen la tabla del grupo de administración del área de trabajo, no podrá agregar la tabla a un recurso compartido. Primero deben concederse los permisos USE SCHEMA
y USE CATALOG
en el esquema y el catálogo.
Explorador de catálogo
En el área de trabajo de Azure Databricks, haga clic en
Catálogo.
En la parte superior del panel Catálogo, haga clic en el
y seleccione Delta Sharing.
Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.
En la pestaña Compartido por mí, busque el recurso compartido al que desea agregar una tabla y haga clic en su nombre.
Haga clic en Administrar recursos Agregar recursos > de datos.
En la página Agregar tablas , seleccione un esquema completo (base de datos) o tablas individuales.
Para seleccionar una tabla o vista, primero seleccione el catálogo y, a continuación, el esquema que contiene la tabla y, a continuación, la tabla o la propia vista.
Puede buscar tablas por nombre, nombre de columna o comentario mediante la búsqueda del área de trabajo. Consulte Búsqueda de objetos del área de trabajo.
Para seleccionar un esquema, seleccione primero el catálogo y, a continuación, el esquema.
Para obtener información detallada sobre cómo compartir esquemas, vea Agregar esquemas a un recurso compartido.
Historial: Comparta el historial de tabla para permitir que los destinatarios realicen consultas temporales o lean la tabla con Spark Structured Streaming. En el caso de los recursos compartidos de Databricks a Databricks, el registro delta de la tabla también se comparte para mejorar el rendimiento. Consulta Mejorar el rendimiento de lectura de tablas con el uso compartido del historial. El uso compartido del historial requiere Databricks Runtime 12.2 LTS o superior.
Nota:
Si también quiere que los clientes puedan consultar la fuente de distribución de datos modificados (CDF) de una tabla mediante la función table_changes(), debe habilitar CDF en la tabla antes de compartirla
WITH HISTORY
.(Opcional) Haga clic en
en las columnas Alias o Parition para añadir un alias o partición. Los alias y las particiones no están disponibles si selecciona un esquema completo. El historial de tablas se incluye de forma predeterminada si selecciona un esquema completo.
- Alias: un nombre de tabla alternativo para que el nombre de la tabla sea más legible. El alias es el nombre de tabla que el destinatario ve y debe usar en las consultas. Los destinatarios no pueden usar el nombre real de la tabla si se especifica un alias.
- Partición: comparta solo parte de la tabla. Por ejemplo,
(column = 'value')
. Consulte Especificar particiones de tabla para compartir y Usar propiedades de destinatario para realizar el filtrado de particiones.
Haga clic en Save(Guardar).
SQL
Ejecuta el siguiente comando en un bloc de notas o en el editor de consultas SQL de Databricks para añadir una tabla:
ALTER SHARE <share-name> ADD TABLE <catalog-name>.<schema-name>.<table-name> [COMMENT "<comment>"]
[PARTITION(<clause>)] [AS <alias>]
[WITH HISTORY | WITHOUT HISTORY];
Ejecute lo siguiente para agregar un esquema completo. El comando ADD SCHEMA
requiere un almacén SQL o un equipo que ejecute Databricks Runtime 13.3 LTS o una versión superior. Para obtener información detallada sobre cómo compartir esquemas, vea Agregar esquemas a un recurso compartido.
ALTER SHARE <share-name> ADD SCHEMA <catalog-name>.<schema-name>
[COMMENT "<comment>"];
Las opciones incluyen las siguientes. PARTITION
y AS <alias>
no están disponibles si selecciona un esquema completo.
PARTITION(<clause>)
: si solo desea compartir parte de la tabla, puede especificar una partición. Por ejemplo,(column = 'value')
Consulte Especificar particiones de tabla para compartir y Usar propiedades de destinatario para realizar el filtrado de particiones.AS <alias>
: un nombre de tabla alternativo o un alias para que el nombre de la tabla sea más legible. El alias es el nombre de tabla que el destinatario ve y debe usar en las consultas. Los destinatarios no pueden usar el nombre real de la tabla si se especifica un alias. Use el formato<schema-name>.<table-name>
.WITH HISTORY
oWITHOUT HISTORY
: Cuando se especificaWITH HISTORY
, comparte la tabla con el historial completo, lo que permite a los destinatarios realizar consultas de viaje en el tiempo y lecturas de flujo. En los recursos compartidos de Databricks a Databricks, el uso compartido del historial también comparte el registro Delta de la tabla para mejorar el rendimiento. El comportamiento predeterminado para el uso compartido de tablas esWITH HISTORY
si el proceso ejecuta Databricks Runtime 16.2 o posterior yWITHOUT HISTORY
para versiones anteriores de Databricks Runtime. En el caso del uso compartido de esquemas, el valor predeterminado esWITH HISTORY
independientemente de la versión de Databricks Runtime.WITH HISTORY
yWITHOUT HISTORY
requieren Databricks Runtime 12.2 LTS o superior. Consulte también Mejorar el rendimiento de lectura de tablas compartiendo historial.Nota:
Si, además de realizar consultas de viaje en el tiempo y lecturas de flujo, quiere que los clientes puedan consultar una fuente de distribución de datos modificados (CDF) de una tabla mediante la función table_changes(), debe habilitar CDF en la tabla antes de compartirlo como
WITH HISTORY
.
Para obtener más información sobre las opciones de ALTER SHARE
, consulte ALTER SHARE.
Interfaz de línea de comandos (CLI)
Para añadir una tabla, ejecuta el siguiente comando utilizando la función CLI de Databricks.
databricks shares update <share-name> \
--json '{
"updates": [
{
"action": "ADD",
"data_object": {
"name": "<table-full-name>",
"data_object_type": "TABLE",
"shared_as": "<table-alias>"
}
}
]
}'
Para agregar un esquema, ejecute el siguiente comando de la CLI de Databricks:
databricks shares update <share-name> \
--json '{
"updates": [
{
"action": "ADD",
"data_object": {
"name": "<schema-full-name>",
"data_object_type": "SCHEMA"
}
}
]
}'
Nota:
En el caso de las tablas, y solo para las tablas, puede omitir "data_object_type"
.
Para obtener información sobre las opciones enumeradas en este ejemplo, consulte las instrucciones de la pestaña SQL.
Para obtener información sobre parámetros adicionales, ejecute databricks shares update --help
o consulte PATCH /api/2.1/unity-catalog/shares/ en la referencia de la API de REST.
Para obtener información sobre cómo quitar tablas de un recurso compartido, consulte Actualización de recursos compartidos.
Especificación de particiones de tabla para compartir
Para compartir solo una parte de una tabla al agregar la tabla a un recurso compartido, puede proporcionar una especificación de partición. Puede especificar particiones al agregar una tabla a un recurso compartido o al actualizar un recurso compartido mediante Catalog Explorer, la CLI de Unity Catalog de Databricks o los comandos SQL en un cuaderno de Azure Databricks o en el editor de consultas de Databricks SQL. Consulte Incorporación de tablas a un recurso compartido y Actualización de recursos compartidos.
Ejemplo básico
En el ejemplo siguiente de SQL se comparte parte de los datos de la tabla inventory
, dado que la tabla está particionada por las columnas year
, month
y date
:
- Datos del año 2021.
- Datos de diciembre de 2020.
- Datos del 25 de diciembre de 2019.
ALTER SHARE share_name
ADD TABLE inventory
PARTITION (year = "2021"),
(year = "2020", month = "Dec"),
(year = "2019", month = "Dec", date = "2019-12-25");
Uso de propiedades de destinatarios para realizar el filtrado de particiones
Puede compartir una partición de tabla que coincida con las propiedades del destinatario de datos, también conocido como uso compartido de particiones con parámetros.
Las propiedades predeterminadas incluyen:
databricks.accountId
: la cuenta de Azure Databricks a la que pertenezca un destinatario de datos (solo para uso compartido de Databricks a Databricks).databricks.metastoreId
: el metastore de Unity Catalog al que pertenece un destinatario de datos (solo para uso compartido de Databricks a Databricks).databricks.name
: nombre del destinatario de los datos.
Puede crear cualquier propiedad personalizada que desee al crear o actualizar un destinatario.
El filtrado por propiedad de destinatario le permite compartir las mismas tablas, con el mismo recurso compartido, en varias cuentas, áreas de trabajo y usuarios de Databricks, a la vez que se mantienen los límites de datos entre ellas.
Por ejemplo, si las tablas incluyen una columna de identificador de cuenta de Azure Databricks, puede crear un único recurso compartido con particiones de tabla definidas por dicho identificador. Al compartir, Delta Sharing entrega dinámicamente a cada destinatario solo los datos asociados a su cuenta de Azure Databricks.
Sin la capacidad de crear particiones dinámicamente por propiedad, tendría que crear un recurso compartido independiente para cada destinatario.
Para especificar una partición que filtre por propiedades de destinatario al crear o actualizar un recurso compartido, puede usar Catalog Explorer o la función SQL CURRENT_RECIPIENT
en un cuaderno de Azure Databricks o en el editor de consultas de Databricks SQL:
Nota:
Las propiedades del destinatario están disponibles en Databricks Runtime 12.2 y versiones posteriores.
Explorador de catálogo
En el área de trabajo de Azure Databricks, haga clic en
Catálogo.
En la parte superior del panel Catálogo, haga clic en el
y seleccione Delta Sharing.
Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.
En la pestaña Compartido por mí, busque el recurso compartido que desea actualizar y haga clic en su nombre.
Haga clic en Administrar recursos Agregar recursos > de datos.
En la página Agregar tablas, seleccione el catálogo y la base de datos que contienen la tabla y, a continuación, seleccione la tabla.
Si no está seguro de qué catálogo y base de datos contienen la tabla, puede buscarla por nombre, nombre de columna o comentario mediante la búsqueda del área de trabajo. Consulte Búsqueda de objetos del área de trabajo.
(Opcional) Haga clic en
en la columna Partición para añadir una partición.
En el cuadro de diálogo Agregar partición a la tabla , agregue la especificación de partición basada en propiedades mediante la sintaxis siguiente:
(<column-name> = CURRENT_RECIPIENT().<property-key>)
Por ejemplo,
(country = CURRENT_RECIPIENT().'country')
Haga clic en Save(Guardar).
SQL
Ejecute el siguiente comando en un cuaderno o en el editor de consultas de Databricks SQL:
ALTER SHARE <share-name> ADD TABLE <catalog-name>.<schema-name>.<table-name>
PARTITION (<column-name> = CURRENT_RECIPIENT().<property-key>);
Por ejemplo,
ALTER SHARE acme ADD TABLE acme.default.some_table
PARTITION (country = CURRENT_RECIPIENT().'country');
Agregar tablas con vectores de eliminación o mapeo de columnas en un recurso compartido
Importante
Esta característica está en versión preliminar pública.
Los vectores de eliminación son una característica de optimización de almacenamiento que puede habilitar en tablas Delta. Consulte ¿Qué son los vectores de eliminación?.
Azure Databricks también admite la asignación de columnas para tablas Delta. Consulte Cambio de nombre y eliminación de columnas con la asignación de columnas de Delta Lake.
Para compartir una tabla con vectores de eliminación o asignación de columnas, debe compartirla con el historial. Consulte Agregar tablas a un recurso compartido.
Al compartir una tabla con vectores de eliminación o asignación de columnas, los destinatarios pueden consultar la tabla mediante un almacenamiento de SQL, un proceso que ejecute Databricks Runtime 14.1 o superior, o un proceso que ejecute código abierto delta-sharing-spark
3.1 o superior. Consulte Lectura de tablas con vectores de eliminación o asignación de columnas habilitados y Lectura de tablas con vectores de eliminación o asignación de columnas habilitados.
Adición de tablas de streaming a un recurso compartido
Importante
Esta característica está en versión preliminar pública.
Las tablas de streaming son tablas delta normales con compatibilidad adicional para el procesamiento de datos incremental o de streaming. Las tablas de streaming están diseñadas para orígenes de datos de solo anexión y procesan entradas solo una vez. Consulte Uso de tablas de streaming en Databricks SQL.
Permisos necesarios: debe ser el propietario del objeto share, tener USE CATALOG
y USE SCHEMA
en el catálogo y el esquema que contienen la tabla de streaming y SELECT
en la tabla de streaming. Debe mantener el SELECT
privilegio siempre que quiera compartir la tabla de streaming. Para obtener más información, consulte los requisitos.
Otros requisitos:
- Debe habilitar la computación sin servidor para flujos de trabajo, cuadernos y canalizaciones declarativas de Lakeflow en la cuenta donde se ha configurado la compartición de tablas de streaming. Consulte Habilitar la computación sin servidor.
- Si el área de trabajo tiene habilitados enlaces de catálogo de áreas de trabajo, asegúrese de que el área de trabajo tiene acceso de lectura y escritura al catálogo en el que se encuentra la tabla de streaming. Para obtener más información, vea Limitar el acceso de catálogo a áreas de trabajo específicas.
- Las tablas de streaming que se pueden compartir deben definirse en tablas delta u otras tablas o vistas de streaming que se pueden compartir.
- Debe usar un almacén SQL o un proceso en Databricks Runtime 13.3 LTS o superior al agregar una tabla de streaming a un recurso compartido.
Limitaciones:
- La tabla de streaming no puede tener filtros de fila y máscaras de columna.
- La tabla base de la tabla de streaming puede tener filtros de fila y máscaras de columna.
Para agregar tablas de streaming a un recurso compartido:
Explorador de catálogo
En el área de trabajo de Azure Databricks, haga clic en
Catálogo.
En la parte superior del panel Catálogo, haga clic en el
y seleccione Delta Sharing.
Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.
En la pestaña Compartido por mí , busque el recurso compartido al que desea agregar una tabla de streaming y haga clic en su nombre.
Haga clic en Administrar recursos > Editar recursos.
En la página Editar recursos, busque o navegue por la tabla de transmisión que desea compartir y selecciónela.
(Opcional) En la columna Alias, haga clic en
para indicar un alias o un nombre alternativo para la tabla de flujo y así hacer que el nombre de la tabla de flujo sea más legible. El alias es el nombre que el destinatario ve y debe utilizar en las consultas. Los destinatarios no pueden usar el nombre real de la tabla de streaming si se especifica un alias.
Haga clic en Save(Guardar).
SQL
Ejecute el siguiente comando en un cuaderno o en el editor de consultas de Databricks SQL.
ALTER SHARE <share_name> ADD TABLE <st_name> [COMMENT <comment>] [AS <shared_st_name>];
Interfaz de línea de comandos (CLI)
Ejecute el siguiente comando de la CLI de Databricks.
databricks shares update <share-name> \
--json '{
“updates”: [
{
“action”: “ADD”,
“data_object”: {
“name”: “<st-full-name>",
“data_object_type”: “TABLE”,
“comment”: “<comment>”
}
}
]
}'
Para obtener información sobre cómo quitar tablas de streaming de un recurso compartido, consulte Actualización de recursos compartidos.
Añadir tablas administradas de Iceberg a un recurso compartido
Importante
Esta característica está en versión preliminar pública.
En Azure Databricks, puede crear tablas Iceberg en el Catálogo de Unity, conocidas como tablas Iceberg administradas. Apache Iceberg es un formato de tabla de código abierto para cargas de trabajo de análisis.
Permisos necesarios: debe ser el propietario del objeto de recurso compartido, tener USE CATALOG
y USE SCHEMA
en el catálogo y el esquema que incluyen la tabla de Iceberg administrada, así como SELECT
en la tabla de Iceberg administrada. Debe mantener el privilegio SELECT
mientras quiera compartir la tabla de Iceberg administrada. Para obtener más información, consulte los requisitos.
Limitaciones: Se aplican las limitaciones de la tabla Iceberg y de la tabla de Iceberg gestionada. Consulte Limitaciones de la tabla de Iceberg.
Para agregar tablas de Iceberg administradas a una compartición:
Explorador de catálogo
En el área de trabajo de Azure Databricks, haga clic en
Catálogo.
En la parte superior del panel Catálogo, haga clic en el
y seleccione Delta Sharing.
Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.
En la pestaña Shared by me (Compartido por mí ), busque el recurso compartido al que desea agregar una tabla administrada de Iceberg y haga clic en su nombre.
Haga clic en Administrar recursos>.
En la página Edit assets (Editar recursos), busque o navegue la tabla administrada de Iceberg que desea compartir y selecciónela.
(Opcional) En la columna Alias, haga clic en
para indicar un alias o un nombre alternativo para la tabla de Iceberg administrada con el fin de que el nombre sea más legible. El alias es el nombre que el destinatario ve y debe utilizar en las consultas. Los destinatarios no pueden usar el nombre real de la tabla gestionada de Iceberg si se especifica un alias.
Haga clic en Save(Guardar).
SQL
Ejecute el siguiente comando en un cuaderno o en el editor de consultas de Databricks SQL. Si lo desea, especifique <shared_iceberg_table_name>
para exponer la tabla de Iceberg administrada bajo un nombre diferente.
ALTER SHARE <share_name> ADD TABLE <managed_iceberg_name> [COMMENT <comment>] [AS <shared_iceberg_table_name>];
Interfaz de línea de comandos (CLI)
Ejecute el siguiente comando de la CLI de Databricks.
databricks shares update <share-name> \
--json '{
“updates”: [
{
“action”: “ADD”,
“data_object”: {
“name”: “<managed-iceberg-full-name>",
“data_object_type”: “TABLE”,
“comment”: “<comment>”
}
}
]
}'
Añadir vistas a una compartición
Las vistas son objetos de solo lectura creados a partir de una o varias tablas u otras vistas. Se puede crear una vista a partir de tablas y otras vistas que están contenidas en múltiples esquemas y catálogos dentro de un metastore de Unity Catalog. Consulte Creación y administración de vistas.
En esta sección, se describe cómo agregar vistas a un recurso compartido con Catalog Explorer, la CLI de Databricks o comandos SQL en un cuaderno de Azure Databricks o en el editor de consultas SQL de Databricks. Si prefiere usar la API de REST de Unity Catalog, consulte PATCH /api/2.1/unity-catalog/shares/ en la referencia de la API de REST.
Permisos necesarios: debe ser el propietario del objeto compartido, y tener USE CATALOG
y USE SCHEMA
en el catálogo y el esquema que contienen la vista, y SELECT
en la vista. Debe mantener el privilegio SELECT
siempre que desee compartir la tabla. Para obtener más información, consulte los requisitos.
Requisitos adicionales:
- Debe habilitar la computación sin servidor para flujos de trabajo, cuadernos y Lakeflow Declarative Pipelines en la cuenta donde se configura la compartición de vistas. Consulte Habilitar la computación sin servidor.
- Las vistas compartidas deben definirse en las tablas Delta u otras vistas compartibles.
- No se pueden compartir vistas que hagan referencia a tablas compartidas o vistas compartidas.
- Debe utilizar un almacén de datos SQL o un proceso en Databricks Runtime 13.3 LTS o superior cuando agregue una vista a un recurso compartido.
- Si las vinculaciones de área de trabajo-catálogo están habilitadas, asegúrese de que el área de trabajo tenga acceso de lectura y escritura al catálogo. Para obtener más información, vea Limitar el acceso de catálogo a áreas de trabajo específicas.
- Para conocer los requisitos y las limitaciones sobre el uso de las vistas de los destinatarios, consulte Lectura de vistas compartidas.
Para agregar vistas a un recurso compartido:
Explorador de catálogo
En el área de trabajo de Azure Databricks, haga clic en
Catálogo.
En la parte superior del panel Catálogo, haga clic en el
y seleccione Delta Sharing.
Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.
En la pestaña Compartido por mí, busca el recurso compartido al que desea agregar una vista y haga clic en su nombre.
Haga clic en Administrar recursos Agregar recursos > de datos.
En la página Agregar tablas, busque o navegue la vista que desea compartir y selecciónela.
(Opcional) Haga clic en
en la columna Alias para indicar un nombre de vista alternativo o Alias para que el nombre de vista sea más legible. El alias es el nombre que el destinatario ve y debe utilizar en las consultas. Los destinatarios no pueden utilizar el nombre real de la vista si se especifica un alias.
Haga clic en Save(Guardar).
SQL
Ejecute el siguiente comando en un cuaderno o en el editor de consultas de Databricks SQL:
ALTER SHARE <share-name> ADD VIEW <catalog-name>.<schema-name>.<view-name>
[COMMENT "<comment>"]
[AS <alias>];
Las opciones incluyen:
AS <alias>
: Un nombre alternativo de la vista, o alias, para que el nombre de la vista sea más legible. El alias es el nombre de la vista que el destinatario ve y debe utilizar en las consultas. Los destinatarios no pueden utilizar el nombre real de la vista si se especifica un alias. Use el formato<schema-name>.<view-name>
.COMMENT "<comment>"
: los comentarios aparecen en la interfaz de usuario de Catalog Explorer y al enumerar y mostrar los detalles de la vista mediante instrucciones SQL.
Para obtener más información sobre las opciones de ALTER SHARE
, consulte ALTER SHARE.
Interfaz de línea de comandos (CLI)
Ejecute el siguiente comando de la CLI de Databricks:
databricks shares update <share-name> \
--json '{
"updates": [
{
"action": "ADD",
"data_object": {
"name": "<view-full-name>",
"data_object_type": "VIEW",
"shared_as": "<view-alias>"
}
}
]
}'
"shared_as": "<view-alias>"
es opcional y proporciona un nombre de vista alternativo, o alias, para que el nombre de la vista sea más legible. El alias es el nombre de la vista que el destinatario ve y debe utilizar en las consultas. Los destinatarios no pueden utilizar el nombre real de la vista si se especifica un alias. Use el formato <schema-name>.<view-name>
.
Para obtener información sobre parámetros adicionales, ejecute databricks shares update --help
o consulte PATCH /api/2.1/unity-catalog/shares/ en la referencia de la API de REST.
Para obtener información sobre cómo quitar vistas de un recurso compartido, consulte Actualización de recursos compartidos.
Adición de vistas dinámicas a un recurso compartido para filtrar filas y columnas
Puede usar vistas dinámicas para configurar el control de acceso específico a los datos de tabla, entre los que se incluyen:
- Seguridad al nivel de columnas o filas.
- Enmascaramiento de datos.
Al crear una vista dinámica que use la función CURRENT_RECIPIENT(), puede limitar el acceso de destinatarios según las propiedades que especifique en la definición del destinatario.
En esta sección se proporcionan ejemplos de restricción del acceso de destinatarios a los datos de tabla en el nivel de fila y columna mediante una vista dinámica.
Requisitos
- Versión de Databricks Runtime: la función
CURRENT_RECIPIENT
se admite en Databricks Runtime 14.2 y versiones posteriores. - Permisos:
- Para crear una vista, debe ser el propietario del objeto compartido, tener
USE CATALOG
yUSE SCHEMA
en el catálogo y el esquema que contienen la vista, junto conSELECT
en la vista. Debe mantener el privilegioSELECT
siempre que desee compartir la tabla. - Para establecer propiedades en un destinatario, debe ser el propietario del objeto de destinatario.
- Para crear una vista, debe ser el propietario del objeto compartido, tener
- Limitaciones: todas las limitaciones para el uso compartido de vistas, incluida la restricción del uso compartido de Databricks a Databricks, además de las siguientes:
- Cuando un proveedor comparte una vista que usa la
CURRENT_RECIPIENT
función , el proveedor no puede consultar la vista directamente debido al contexto de uso compartido. Para probar esta vista dinámica, el proveedor debe compartir la vista con ellos mismos y consultar la vista como destinatario. - Los proveedores no pueden crear una vista que haga referencia a una vista dinámica.
- Cuando un proveedor comparte una vista que usa la
Establecer una propiedad de destinatario
En estos ejemplos, la tabla que se va a compartir tiene una columna denominada country
, y solo los destinatarios con una propiedad country
coincidente pueden ver determinadas filas o columnas.
Puede establecer propiedades de destinatario mediante el Explorador de catálogos o comandos SQL en un cuaderno de Azure Databricks o en el editor de consultas SQL.
Explorador de catálogo
En el área de trabajo de Azure Databricks, haga clic en
Catálogo.
En la parte superior del panel Catálogo, haga clic en el
y seleccione Delta Sharing.
Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.
En la pestaña Destinatarios, busque el destinatario al que desea agregar las propiedades y haga clic en su nombre.
Haga clic en Editar propiedades.
En el cuadro de diálogo Editar propiedades del destinatario, escriba el nombre de la columna como clave (en este caso
country
) y el valor por el que quiere filtrar como valor (por ejemplo,CA
).Haga clic en Save(Guardar).
SQL
Para establecer la propiedad en el destinatario, use ALTER RECIPIENT
. En este ejemplo, la propiedad country
se establece en CA
.
ALTER RECIPIENT recipient1 SET PROPERTIES ('country' = 'CA');
Crea una vista dinámica con permisos a nivel de fila para destinatarios
En este ejemplo, solo los destinatarios con una propiedad coincidente country
pueden ver determinadas filas.
CREATE VIEW my_catalog.default.view1 AS
SELECT * FROM my_catalog.default.my_table
WHERE country = CURRENT_RECIPIENT('country');
Otra opción es que el proveedor de datos mantenga una tabla de mapeo independiente que asigne los campos de la tabla de hechos a las propiedades del destinatario. Esto permite desacoplar las propiedades del destinatario y los campos de tabla de hechos para mayor flexibilidad.
Creación de una vista dinámica con permiso de nivel de columna para los destinatarios
En este ejemplo, solo los destinatarios que coincidan con la propiedad country
pueden ver determinadas columnas. Otros ven los datos devueltos como REDACTED
:
CREATE VIEW my_catalog.default.view2 AS
SELECT
CASE
WHEN CURRENT_RECIPIENT('country') = 'US' THEN pii
ELSE 'REDACTED'
END AS pii
FROM my_catalog.default.my_table;
Uso compartido de la vista dinámica con un destinatario
Para compartir la vista dinámica con un destinatario, use los mismos comandos SQL o procedimiento de interfaz de usuario que usaría para una vista estándar. Consulte Adición de vistas a un recurso compartido.
Agregar vistas materializadas a un recurso compartido
Importante
Esta característica está en versión preliminar pública.
Al igual que las vistas, las vistas materializadas son los resultados de una consulta y puede acceder a ellas como lo haría con una tabla. A diferencia de las vistas normales, los resultados de una vista materializada reflejan el estado de los datos cuando la vista materializada se actualizó por última vez. Para obtener más información sobre las vistas materializadas, consulte Uso de vistas materializadas en Databricks SQL.
En esta sección se describe cómo agregar vistas materializadas a un recurso compartido mediante el Explorador de catálogos, la CLI de Databricks o comandos SQL en un cuaderno de Azure Databricks o el editor de consultas SQL de Databricks. Si prefiere usar la API de REST de Unity Catalog, consulte PATCH /api/2.1/unity-catalog/shares/ en la referencia de la API de REST.
Permisos necesarios: debe ser el propietario del objeto del recurso compartido, tener USE CATALOG
y USE SCHEMA
en el catálogo y el esquema que incluyen la vista materializada, así como SELECT
en la vista materializada. Debe mantener el SELECT
privilegio siempre que quiera compartir la vista materializada. Para obtener más información, consulte los requisitos.
Requisitos adicionales:
- Debe habilitar la computación sin servidor para flujos de trabajo, cuadernos y canalizaciones declarativas de Lakeflow en la cuenta donde se configura el uso compartido de vistas materializadas. Consulte Habilitar la computación sin servidor.
- Si el área de trabajo tiene habilitados enlaces de catálogo de áreas de trabajo, asegúrese de que el área de trabajo tiene acceso de lectura y escritura al catálogo que contiene la vista materializada. Para obtener más información, vea Limitar el acceso de catálogo a áreas de trabajo específicas.
- Las vistas materializadas que se pueden compartir deben definirse en tablas Delta u otras tablas de streaming, vistas o vistas materializadas.
- Debe usar una instancia de SQL Warehouse o un proceso en Databricks Runtime 13.3 LTS o superior al agregar una vista materializada a un recurso compartido.
Limitaciones:
- La vista materializada no puede tener filtros de fila y máscaras de columna.
- La tabla base de la vista materializada puede tener filtros de fila y máscaras de columna.
Explorador de catálogo
En el área de trabajo de Azure Databricks, haga clic en
Catálogo.
En la parte superior del panel Catálogo, haga clic en el
y seleccione Delta Sharing.
Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.
En la pestaña Compartido por mí , busque el recurso compartido al que desea agregar una vista materializada y haga clic en su nombre.
Haga clic en Administrar recursos > Editar recursos.
En la página Editar recursos, busque o explore la vista materializada que desea compartir y selecciónela.
(Opcional) En la columna Alias, haga clic en
para indicar un alias o un nombre de vista materializada alternativo para que el nombre de vista materializada sea más legible. El alias es el nombre que el destinatario ve y debe utilizar en las consultas. Los destinatarios no pueden usar el nombre de vista materializado real si se especifica un alias.
Haga clic en Save(Guardar).
SQL
Ejecute el siguiente comando en un cuaderno o en el editor de consultas de Databricks SQL.
ALTER SHARE <share_name> ADD MATERIALIZED VIEW <mv_name> [COMMENT <comment>] [AS <shared_mv_name>];
Interfaz de línea de comandos (CLI)
databricks shares update <share-name> \
--json '{
“updates”: [
{
“action”: “ADD”,
“data_object”: {
“name”: “<mat-view-full-name>”,
“data_object_type”: “MATERIALIZED_VIEW”,
“comment”: “<comment>”
}
}
]
}'
Para obtener información sobre cómo quitar vistas materializadas de un recurso compartido, consulte Actualización de recursos compartidos.
Agregar volúmenes a un recurso compartido
Los volúmenes son objetos de Unity Catalog que representan un volumen lógico de almacenamiento en una ubicación de almacenamiento de objetos en la nube. Están diseñados principalmente para proporcionar gobernanza sobre los recursos de datos no tabulares. Consulte ¿Qué son los volúmenes de Unity Catalog?.
En esta sección, se describe cómo agregar volúmenes a un recurso compartido utilizando Catalog Explorer, la CLI de Databricks o comandos SQL en un cuaderno de Azure Databricks o en el editor de consultas SQL. Si prefiere usar la API de REST de Unity Catalog, consulte PATCH /api/2.1/unity-catalog/shares/ en la referencia de la API de REST.
Nota:
Los comentarios de volumen se incluyen en recursos compartidos que se comparten con un destinatario mediante el uso compartido de Databricks a Databricks el 25 de julio de 2024 o después. Si desea empezar a compartir comentarios a través de un recurso compartido con un destinatario antes de la fecha de lanzamiento, debe revocar y volver a conceder acceso al destinatario para desencadenar el uso compartido de comentarios.
Permisos necesarios: Debe ser el propietario del objeto compartido, tener USE CATALOG
y USE SCHEMA
en el catálogo y el esquema que contienen el volumen, y READ VOLUME
en el volumen. Debe mantener el privilegio READ VOLUME
siempre que desee compartir el volumen. Para obtener más información, consulte los requisitos.
Requisitos adicionales:
- El uso compartido de volúmenes solo se admite en el uso compartido de Databricks a Databricks.
- Debe usar una instancia de SQL Warehouse en la versión 2023.50 o posterior, o en un recurso de proceso en Databricks Runtime 14.1 o superior al agregar un volumen a un recurso compartido.
- Si el almacenamiento de volúmenes en el lado del proveedor tiene configuraciones de red personalizadas (como un firewall o un vínculo privado), el proveedor debe asegurarse de que las direcciones del plano de control y del plano de datos del destinatario estén correctamente permitidas para poder conectarse a la ubicación de almacenamiento del volumen.
Para agregar volúmenes a un recurso compartido:
Explorador de catálogo
En el área de trabajo de Azure Databricks, haga clic en
Catálogo.
En la parte superior del panel Catálogo, haga clic en el
y seleccione Delta Sharing.
Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.
En la pestaña Compartido por mí, busca el recurso compartido al que desea agregar un volumen y haga clic en su nombre.
Haga clic en Administrar recursos > Editar recursos.
En la página Editar recursos, busque el volumen que desea compartir y selecciónelo.
Como alternativa, puede seleccionar todo el esquema que contiene el volumen. Consulte Adición de esquemas a un recurso compartido.
(Opcional) Haga clic en
en la columna Alias para indicar un nombre de volumen alternativo o Alias para que el nombre de volumen sea más legible.
Los alias no están disponibles si selecciona un esquema completo.
El alias es el nombre que el destinatario ve y debe utilizar en las consultas. Si se especifica un alias, los destinatarios no pueden utilizar el nombre real del volumen.
Haga clic en Save(Guardar).
SQL
Ejecute el siguiente comando en un cuaderno o en el editor de consultas de Databricks SQL:
ALTER SHARE <share-name> ADD VOLUME <catalog-name>.<schema-name>.<volume-name>
[COMMENT "<comment>"]
[AS <alias>];
Las opciones incluyen:
AS <alias>
: nombre de volumen alternativo, o alias, para que el nombre del volumen sea más legible. El alias es el nombre del volumen que el destinatario ve y debe utilizar en las consultas. Los destinatarios no pueden utilizar el nombre real del volumen si se especifica un alias. Use el formato<schema-name>.<volume-name>
.COMMENT "<comment>"
: los comentarios aparecen en la interfaz de usuario de Catalog Explorer, y al enumerar y mostrar los detalles del volumen mediante instrucciones SQL.
Para obtener más información sobre las opciones de ALTER SHARE
, consulte ALTER SHARE.
Interfaz de línea de comandos (CLI)
Ejecute el siguiente comando mediante la CLI de Databricks 0.210 o posterior:
databricks shares update <share-name> \
--json '{
"updates": [
{
"action": "ADD",
"data_object": {
"name": "<volume-full-name>",
"data_object_type": "VOLUME",
"string_shared_as": "<volume-alias>"
}
}
]
}'
"string_shared_as": "<volume-alias>"
es opcional y proporciona un nombre de volumen alternativo, o alias, para que el nombre del volumen sea más legible. El alias es el nombre del volumen que el destinatario ve y debe utilizar en las consultas. Los destinatarios no pueden utilizar el nombre real del volumen si se especifica un alias. Use el formato <schema-name>.<volume-name>
.
Para obtener información sobre parámetros adicionales, ejecute databricks shares update --help
o consulte PATCH /api/2.1/unity-catalog/shares/ en la referencia de la API de REST.
Para obtener información sobre cómo quitar volúmenes de un recurso compartido, consulte Actualización de recursos compartidos.
Adición de modelos a un recurso compartido
En esta sección, se describe cómo agregar modelos a un recurso compartido utilizando Catalog Explorer, la CLI de Databricks o comandos SQL en un cuaderno de Azure Databricks o en el editor de consultas SQL. Si prefiere usar la API de REST de Unity Catalog, consulte PATCH /api/2.1/unity-catalog/shares/ en la referencia de la API de REST.
Nota:
Los comentarios de modelo y los comentarios de la versión del modelo se incluyen en recursos compartidos que se comparten mediante el uso compartido de Databricks a Databricks.
Permisos necesarios: debe ser el propietario del objeto del recurso compartido, tener USE CATALOG
y USE SCHEMA
en el catálogo y el esquema que incluyen el modelo, así como EXECUTE
en el modelo. Debe mantener el privilegio EXECUTE
siempre que desee compartir el modelo. Para obtener más información, consulte los requisitos.
Requisitos adicionales:
- El uso compartido de modelos solo se admite en el uso compartido de Databricks a Databricks.
- Debe usar una instancia de SQL Warehouse en la versión 2023.50 o posterior o un recurso de computación en Databricks Runtime 14.0 o superior cuando agregue un modelo a un recurso compartido.
Para agregar modelos a un recurso compartido:
Explorador de catálogo
En el área de trabajo de Azure Databricks, haga clic en
Catálogo.
En la parte superior del panel Catálogo, haga clic en el
y seleccione Delta Sharing.
Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.
En la pestaña Compartido por mí, busca el recurso compartido al que desea agregar un modelo y haga clic en su nombre.
Haga clic en Administrar recursos > Editar recursos.
En la página Editar recursos, busque el modelo que desea compartir y selecciónelo.
Como alternativa, puede seleccionar todo el esquema que contiene el modelo. Consulte Adición de esquemas a un recurso compartido.
(Opcional) Haga clic en
en la columna Alias para indicar un nombre de modelo alternativo o Alias para que el nombre de modelo sea más legible.
Los alias no están disponibles si selecciona un esquema completo.
El alias es el nombre que el destinatario ve y debe utilizar en las consultas. Los destinatarios no pueden utilizar el nombre real del modelo si se especifica un alias.
Haga clic en Save(Guardar).
SQL
Ejecute el siguiente comando en un cuaderno o en el editor de consultas de Databricks SQL:
ALTER SHARE <share-name> ADD MODEL <catalog-name>.<schema-name>.<model-name>
[COMMENT "<comment>"]
[AS <alias>];
Las opciones incluyen:
AS <alias>
: un nombre de modelo alternativo, o alias, para que el nombre del modelo sea más legible. El alias es el nombre del modelo que el destinatario ve y debe utilizar en las consultas. Los destinatarios no pueden utilizar el nombre real del modelo si se especifica un alias. Use el formato<schema-name>.<model-name>
.COMMENT "<comment>"
: los comentarios aparecen en la interfaz de usuario de Catalog Explorer y al enumerar y mostrar los detalles del modelo mediante instrucciones SQL.
Para obtener más información sobre las opciones de ALTER SHARE
, consulte ALTER SHARE.
Interfaz de línea de comandos (CLI)
Ejecute el siguiente comando mediante la CLI de Databricks 0.210 o posterior:
databricks shares update <share-name> \
--json '{
"updates": [
{
"action": "ADD",
"data_object": {
"name": "<model-full-name>",
"data_object_type": "MODEL",
"string_shared_as": "<model-alias>"
}
}
]
}'
"string_shared_as": "<model-alias>"
es opcional y proporciona un nombre de modelo alternativo, o alias, para que el nombre del modelo sea más legible. El alias es el nombre del modelo que el destinatario ve y debe utilizar en las consultas. Los destinatarios no pueden utilizar el nombre real del modelo si se especifica un alias. Use el formato <schema-name>.<model-name>
.
Para obtener información sobre parámetros adicionales, ejecute databricks shares update --help
o consulte PATCH /api/2.1/unity-catalog/shares/ en la referencia de la API de REST.
Para obtener información sobre cómo quitar modelos de un recurso compartido, consulte Actualización de recursos compartidos.
Añadir esquemas a un recurso compartido
Al agregar un esquema completo a un recurso compartido, los destinatarios tendrán acceso no solo a todos los recursos de datos del esquema en el momento en que cree el recurso compartido, sino a todos los recursos que se agreguen al esquema a lo largo del tiempo. Esto incluye todas las tablas, vistas y volúmenes del esquema. Las tablas compartidas de esta manera siempre incluyen historial completo.
Para añadir, actualizar o eliminar un esquema usando SQL se requiere un almacén SQL o un equipo que ejecute Databricks Runtime 13.3 LTS o una versión superior. Hacer lo mismo con Explorador de catálogo no tiene requisitos de proceso.
Permisos necesarios: debe ser el propietario del objeto de recurso compartido y el propietario del esquema (o un usuario con privilegios de USE SCHEMA
y SELECT
en el esquema).
Para agregar un esquema a un recurso compartido, siga las instrucciones de Agregar tablas a un recurso compartido, prestando atención al contenido que especifica cómo agregar un esquema.
Los alias de tabla, las particiones y los alias de volumen no están disponibles si selecciona un esquema completo. Si ha creado alias o particiones para cualquier recurso en el esquema, estos se eliminan cuando agrega todo el esquema al recurso compartido.
Si desea especificar opciones avanzadas para una tabla o volumen que va a compartir mediante el uso compartido de esquemas, debe compartir la tabla o volumen mediante SQL y asignarle un alias con un nombre de esquema diferente.
Agregar archivos de cuaderno a un recurso compartido
Use Catalog Explorer para agregar un archivo de cuaderno a un recurso compartido.
Permisos necesarios: debe ser el propietario del objeto compartido y tener permiso para leer en el cuaderno que desea compartir.
- En el área de trabajo de Azure Databricks, haga clic en
Catálogo.
- En la página Acceso rápido, haz clic en el botón Delta Sharing >.
- En la pestaña Compartido por mí, busque el recurso compartido al que desea agregar un cuaderno y haga clic en su nombre.
- Haga clic en Administrar recursos y seleccione Agregar archivo de cuaderno.
- En la página Agregar archivo de cuaderno, haga clic en el icono de archivo para buscar el cuaderno que desea compartir.
- Haga clic en el archivo que desea compartir y haga clic en Seleccionar.
- (Opcionalmente) Especifique un alias descriptivo para el archivo en el campo Compartir como. Este es el identificador que verán los destinatarios.
- En Ubicación de almacenamiento, escribe la ubicación externa en el almacenamiento en la nube donde quiera almacenar el cuaderno. Puede especificar una subruta en la ubicación externa definida. Si no especifica una ubicación externa, el cuaderno se almacenará en la ubicación de almacenamiento de nivel de metastore (o "ubicación raíz de metastore"). Si no se define ninguna ubicación raíz para el metastore, debe escribir una ubicación externa aquí. Consulte Adición de almacenamiento administrado a un metastore existente.
- Haga clic en Save(Guardar).
El archivo de cuaderno compartido aparece ahora en la lista Archivos de cuaderno de la pestaña Activos.
Eliminación de archivos de cuaderno de recursos compartidos
Para quitar un archivo de cuaderno de un recurso compartido:
En el área de trabajo de Azure Databricks, haga clic en
Catálogo.
En la parte superior del panel Catálogo, haga clic en el
y seleccione Delta Sharing.
Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.
En la pestaña Compartido por mí, busque el recurso compartido que incluye el cuaderno y haga clic en el nombre del recurso compartido.
En la pestaña Recursos, busque el archivo del cuaderno que desea quitar del recurso compartido.
Haga clic en el menú kebab
situado a la derecha de la fila y seleccione Eliminar archivo del cuaderno.
En el cuadro de diálogo de confirmación, haga clic en Eliminar.
Actualización de archivos de cuaderno en recursos compartidos
Para actualizar un cuaderno que ya ha compartido, debe volver a agregarlo y proporcionar un nuevo alias en el campo Compartir como. Databricks recomienda usar un nombre que indique el estado revisado del cuaderno, como <old-name>-update-1
. Es posible que tenga que notificar al destinatario del cambio. El destinatario debe seleccionar y clonar el nuevo cuaderno para aprovechar la actualización.
Conceder a los destinatarios acceso a una parte
Para conceder acceso compartido a los destinatarios, puede usar Catalog Explorer, la CLI de Unity Catalog de Databricks o el comando SQL GRANT ON SHARE
en un cuaderno de Azure Databricks o en el editor de consultas de Databricks SQL.
Permisos necesarios: uno de los siguientes:
- Administrador del metastore.
- Permisos delegados o control tanto en el recurso compartido como en los objetos de destinatario ((
USE SHARE
+SET SHARE PERMISSION
) o propietario del recurso compartido) AND (USE RECIPIENT
o propietario del destinatario).
Para obtener instrucciones, consulte Administrar el acceso a los recursos compartidos de datos de Delta Sharing (para proveedores). En este artículo también se explica cómo revocar el acceso de un destinatario a un recurso compartido.
Visualización de recursos compartidos y detalles de recursos compartidos
Para ver una lista de recursos compartidos o detalles sobre un recurso compartido, puede usar Catalog Explorer, la CLI de Unity Catalog de Databricks o los comandos SQL en un cuaderno de Azure Databricks o el editor de consultas de Databricks SQL.
Permisos necesarios: la lista de recursos compartidos devueltos depende de su rol y permisos. Los administradores y usuarios del metastore con el privilegio USE SHARE
ven todos los recursos compartidos. De lo contrario, solo puede ver los recursos compartidos para los que es el propietario del objeto de recurso compartido.
Los detalles incluyen:
- Propietario del recurso compartido, creador, marca de tiempo de creación, actualizador, marca de tiempo actualizada, comentarios.
- Recursos de datos del recurso compartido.
- Los destinatarios con acceso al recurso compartido.
Explorador de catálogo
En el área de trabajo de Azure Databricks, haga clic en
Catálogo.
En la parte superior del panel Catálogo, haga clic en el
y seleccione Delta Sharing.
Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.
Abra la pestaña Recursos compartidos para ver una lista de recursos compartidos.
Vea los detalles del recurso compartido en la pestaña Detalles.
SQL
Para ver una lista de recursos compartidos, ejecute el siguiente comando en un cuaderno o en el editor de consultas de Databricks SQL. Opcionalmente, reemplace <pattern>
por un predicado LIKE
.
SHOW SHARES [LIKE <pattern>];
Para ver detalles sobre un recurso compartido específico, ejecute el siguiente comando.
DESCRIBE SHARE <share-name>;
Para ver detalles sobre todas las tablas, vistas y volúmenes de un recurso compartido, ejecute el siguiente comando.
SHOW ALL IN SHARE <share-name>;
Interfaz de línea de comandos (CLI)
Para ver una lista de recursos compartidos, ejecute el siguiente comando mediante la CLI de Databricks.
databricks shares list
Para ver detalles sobre un recurso compartido específico, ejecute el siguiente comando.
databricks shares get <share-name>
Visualización de los destinatarios que tienen permisos en un recurso compartido
Para ver la lista de recursos compartidos a los que se haya concedido acceso a un destinatario, puede usar Catalog Explorer, la CLI de Unity Catalog de Databricks o el comando SQL SHOW GRANTS TO RECIPIENT
en un cuaderno de Azure Databricks o en el editor de consultas de Databricks SQL.
Permisos necesarios: debe ser el administrador de metastore, tener USE SHARE
privilegio o ser el propietario del objeto compartido.
Explorador de catálogo
En el área de trabajo de Azure Databricks, haga clic en
Catálogo.
En la parte superior del panel Catálogo, haga clic en el
y seleccione Delta Sharing.
Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.
En la pestaña Compartido por mí, busque y seleccione el destinatario.
Vaya a la pestaña Destinatarios para ver la lista de destinatarios que pueden acceder al recurso compartido.
SQL
Ejecute el siguiente comando en un cuaderno o en el editor de consultas de Databricks SQL.
SHOW GRANTS ON SHARE <share-name>;
Interfaz de línea de comandos (CLI)
Ejecute el siguiente comando mediante la CLI de Databricks.
databricks shares share-permissions <share-name>
Actualizar recursos compartidos
Además de agregar tablas, vistas, volúmenes y cuadernos a un recurso compartido, puede hacer lo siguiente:
- Cambiar el nombre de un recurso compartido.
- Quite tablas, vistas, volúmenes y esquemas de un recurso compartido.
- Agregar o actualizar un comentario en un recurso compartido.
- Cambie el nombre del alias de una tabla (el nombre de la tabla que se muestra al destinatario).
- Habilite o deshabilite el acceso a los datos del historial de una tabla, lo que permite a los destinatarios realizar consultas de viaje en tiempo o lecturas de streaming de la tabla.
- Agregar, actualizar o quitar definiciones de particiones.
- Cambiar el propietario del recurso compartido.
Para actualizar recursos compartidos, puede usar Catalog Explorer, la CLI de Unity Catalog de Databricks o los comandos SQL en un cuaderno de Azure Databricks o el editor de consultas de Databricks SQL. No puede usar Catalog Explorer para cambiar el nombre del recurso compartido.
Permisos necesarios: para actualizar el propietario del recurso compartido, debe ser uno de los siguientes: un administrador del metastore, el propietario del objeto de recurso compartido o un usuario con los privilegios USE SHARE
y SET SHARE PERMISSION
. Para actualizar el nombre del recurso compartido, debe ser un usuario con el privilegio CREATE SHARE
el propietario del recurso compartido. Debe ser el propietario para actualizar cualquier otra propiedad de recurso compartido.
Explorador de catálogo
En el área de trabajo de Azure Databricks, haga clic en
Catálogo.
En la parte superior del panel Catálogo, haga clic en el
y seleccione Delta Sharing.
Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.
En la pestaña Compartido por mí, busque el recurso compartido que desea actualizar y haga clic en su nombre.
Realice las siguientes acciones en la página de detalles del recurso compartido:
- Haga clic en el
situado junto al campo Propietario o Comentario para actualizar estos valores.
- Haga clic en el botón de menú kebab
de una fila de recursos para quitarlo.
- Haga clic en Administrar recursos > Editar recursos para actualizar todas las demás propiedades:
- Para quitar un recurso, desactive la casilla situada junto al recurso.
- Para agregar, actualizar o quitar definiciones de partición, haga clic en Opciones avanzadas.
SQL
Ejecute los siguientes comandos en un cuaderno o en el editor de Databricks SQL.
Cambiar el nombre de un recurso compartido:
ALTER SHARE <share-name> RENAME TO <new-share-name>;
Quitar tablas de un recurso compartido:
ALTER SHARE share_name REMOVE TABLE <table-name>;
Quitar volúmenes de un recurso compartido:
ALTER SHARE share_name REMOVE VOLUME <volume-name>;
Agregar o actualizar un comentario en un recurso compartido:
COMMENT ON SHARE <share-name> IS '<comment>';
Agregar o modificar particiones para una tabla en un recurso compartido:
ALTER SHARE <share-name> ADD TABLE <table-name> PARTITION(<clause>);
Cambiar el propietario del recurso compartido:
ALTER SHARE <share-name> OWNER TO '<principal>'
-- Principal must be an account-level user email address or group name.
Habilitar el uso compartido del historial para una tabla:
ALTER SHARE <share-name> ADD TABLE <table-name> WITH HISTORY;
Para obtener más información sobre los parámetros de ALTER SHARE
, consulte ALTER SHARE.
Interfaz de línea de comandos (CLI)
Ejecute los comandos siguientes mediante la CLI de Databricks.
Cambiar el nombre de un recurso compartido:
databricks shares update <share-name> --name <new-share-name>
Quitar tablas de un recurso compartido:
databricks shares update <share-name> \
--json '{
"updates": [
{
"action": "REMOVE",
"data_object": {
"name": "<table-full-name>",
"data_object_type": "TABLE",
"shared_as": "<table-alias>"
}
}
]
}'
Quitar volúmenes de un recurso compartido (mediante la CLI de Databricks 0.210 o posterior):
databricks shares update <share-name> \
--json '{
"updates": [
{
"action": "REMOVE",
"data_object": {
"name": "<volume-full-name>",
"data_object_type": "VOLUME",
"string_shared_as": "<volume-alias>"
}
}
]
}'
Nota:
Use la propiedad name
si no hay ningún alias para el volumen. Use string_shared_as
si hay un alias.
Agregar o actualizar un comentario en un recurso compartido:
databricks shares update <share-name> --comment '<comment>'
Cambiar el propietario del recurso compartido:
databricks shares update <share-name> --owner '<principal>'
La entidad de seguridad debe ser una dirección de correo electrónico de usuario de nivel de cuenta o un nombre de grupo.
Eliminación de un recurso compartido
Para eliminar un recurso compartido, puede usar Catalog Explorer, la CLI de Unity Catalog de Databricks o el comando SQL DELETE SHARE
en un cuaderno de Azure Databricks o el editor de consultas de Databricks SQL. Debe ser propietario del recurso compartido.
Al eliminar un recurso compartido, los destinatarios ya no pueden acceder a los datos compartidos.
Permisos necesarios: debe ser el propietario del objeto compartido.
Explorador de catálogo
En el área de trabajo de Azure Databricks, haga clic en
Catálogo.
En la parte superior del panel Catálogo, haga clic en el
y seleccione Delta Sharing.
Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.
En la pestaña Compartido por mí, busque el recurso compartido que desea eliminar y haga clic en su nombre.
Haga clic en el
Menú kebab y seleccione Eliminar.
En el cuadro de diálogo de confirmación, haga clic en Eliminar.
SQL
Ejecute el siguiente comando en un cuaderno o en el editor de consultas de Databricks SQL.
DROP SHARE [IF EXISTS] <share-name>;
Interfaz de línea de comandos (CLI)
Ejecute el siguiente comando mediante la CLI de Databricks.
databricks shares delete <share-name>