Leer datos compartidos mediante el uso compartido de Databricks a Databricks Delta (para destinatarios): Azure Databricks

En esta página se describe cómo leer datos compartidos con usted mediante el protocolo Databricks-to-Databricks Delta Sharing, donde Databricks administra una conexión segura para el uso compartido de datos. A diferencia del protocolo Delta Sharing de uso compartido abierto, el protocolo Databricks a Databricks no requiere un archivo de credenciales (seguridad basada en tokens).

El uso compartido de Databricks a Databricks requiere que, como destinatario, cumpla los dos requisitos siguientes:

Tiene acceso a un área de trabajo de Databricks con Unity Catalog habilitado.
El proveedor usa el protocolo Databricks-to-Databricks Delta Sharing, no el protocolo de uso compartido abierto, que proporciona un archivo de credenciales.

Si no se cumple alguno de los requisitos, consulte Lectura de datos compartidos mediante el uso compartido de delta sharing abierto con tokens de portador.

¿Cómo puedo hacer que los datos compartidos estén disponibles para mi equipo?

Para leer datos y cuadernos que se han compartido con usted mediante el protocolo Databricks-to-Databricks, debe ser un usuario en un área de trabajo de Databricks habilitada para Catálogo de Unity. Un miembro del equipo proporciona al proveedor de datos un identificador único para el metastore del catálogo de Unity y el proveedor de datos usa ese identificador para crear una conexión de uso compartido seguro con su organización. A continuación, los datos compartidos estarán disponibles para el acceso de lectura en el área de trabajo. Las actualizaciones que realiza el proveedor de datos en las tablas compartidas, vistas, volúmenes y particiones se reflejan en el área de trabajo casi en tiempo real.

Note

Es posible que los cambios de columna, como agregar, cambiar el nombre o eliminar, no aparezcan en el Explorador de catálogos hasta un minuto. Del mismo modo, los nuevos recursos compartidos y las actualizaciones de los recursos compartidos, incluida la adición de nuevas tablas, se almacenan en caché durante un minuto antes de que estén disponibles para ver y consultar.

Note

Las tablas de information_schema un catálogo compartido reflejan los metadatos almacenados en el catálogo de Unity. Estos metadatos se actualizan desde el proveedor solo cuando se consulta directamente la tabla compartida o se ejecuta un comando como DESCRIBE o REFRESH FOREIGN. Hasta entonces, information_schema puede aparecer obsoleto en comparación con los datos del proveedor.

Para leer los datos que se han compartido con usted:

Un usuario del equipo busca el recurso compartido (el contenedor de las tablas, vistas y cuadernos que se han compartido con usted) y lo utiliza para crear un catálogo, el contenedor de nivel superior para todos los datos de Unity Catalog de Databricks.
Un usuario del equipo concede o deniega el acceso al catálogo y a los objetos del catálogo (esquemas, tablas, vistas y volúmenes) a los miembros del equipo.
Usted lee los datos en las tablas, vistas y volúmenes a los que se le haya concedido acceso igual que cualquier recurso de datos en Databricks al que tenga acceso de solo lectura (SELECT o READ VOLUME).
Puede obtener una vista previa y clonar cuadernos en el recurso compartido, siempre y cuando tenga el privilegio USE CATALOG en el catálogo.

Permisos necesarios

Para poder enumerar y ver detalles sobre todos los proveedores y recursos compartidos de proveedores, debe tener el USE PROVIDER privilegio . Otros usuarios solo tienen acceso a los proveedores y recursos compartidos de los que son propietarios.

Para crear un catálogo a partir de un recurso compartido de proveedor, debe ser un administrador de metastore, un usuario que tenga los privilegios CREATE CATALOG y USE PROVIDER para el metastore de Unity Catalog, o un usuario que tenga tanto el privilegio CREATE CATALOG como la propiedad del objeto de proveedor.

La capacidad de conceder acceso de solo lectura a los esquemas (bases de datos), tablas, vistas y volúmenes del catálogo creados a partir del recurso compartido sigue la jerarquía de privilegios típica de Unity Catalog. La capacidad de ver cuadernos en el catálogo creado a partir del recurso compartido requiere el privilegio USE CATALOG en el catálogo. Consulte Administración de permisos para los esquemas, tablas y volúmenes de un catálogo de Delta Sharing.

Visualización de proveedores y recursos compartidos

Para empezar a leer los datos compartidos con usted por un proveedor de datos, debe conocer el nombre del proveedor y de los objetos de recurso compartido que se almacenan en el metastore de Unity Catalog una vez que el proveedor haya compartido datos con usted.

El objeto de proveedor representa el metastore de Unity Catalog, la plataforma en la nube y la región de la organización que compartió los datos con usted.

El objeto del recurso compartido representa las tablas, volúmenes y vistas que el proveedor ha compartido con usted.

Visualización de todos los proveedores que han compartido datos con usted

Para ver una lista de proveedores de datos disponibles, puede usar el Explorador de catálogos, la CLI del catálogo de Databricks Unity o el comando SHOW PROVIDERS SQL en un cuaderno de Azure Databricks o el editor de consultas sql de Databricks.

Permisos necesarios: Debe tener el USE PROVIDER privilegio. Otros usuarios solo tienen acceso a los proveedores y recursos compartidos de proveedores de los que son propietarios.

Para obtener más información, consulte Visualización de proveedores.

Ver detalles del proveedor

Para ver detalles sobre un proveedor, puede usar el Explorador de catálogos, la CLI del catálogo de Databricks Unity o el comando DESCRIBE PROVIDER SQL en un cuaderno de Azure Databricks o el editor de consultas SQL de Databricks.

Permisos necesarios: debe ser administrador del metastore, tener el privilegio USE PROVIDER o ser propietario del objeto de proveedor.

Para obtener más información, consulte Visualización de detalles del proveedor.

Visualización de recursos compartidos

Para ver los recursos compartidos que un proveedor ha compartido con usted, puede usar el Explorador de catálogos, la CLI del catálogo de Databricks Unity o el comando SHOW SHARES IN PROVIDER SQL en un cuaderno de Azure Databricks o el editor de consultas SQL de Databricks.

Permisos necesarios: debe ser administrador del metastore, tener el privilegio USE PROVIDER o ser propietario del objeto de proveedor.

Para obtener más información, consulte Visualización de recursos compartidos que un proveedor ha compartido con usted.

Acceso a datos en una tabla o volumen compartido

Para leer datos en una tabla o volumen compartido:

Un usuario con privilegios debe crear un catálogo a partir del recurso compartido que contiene la tabla o volumen. Puede ser un administrador de metastore, un usuario que tenga los privilegios CREATE CATALOG y USE PROVIDER para el metastore de Unity Catalog, o un usuario que tenga tanto el privilegio como la propiedad CREATE CATALOG del objeto de proveedor.
Ese usuario o un usuario con los mismos privilegios deben concederle acceso a la tabla o volumen compartido.
Puede acceder a la tabla o volumen igual que haría con cualquier otro recurso de datos registrado en el metastore de Unity Catalog.

Para que los datos de un recurso compartido sean accesibles para su equipo, debe crear un catálogo a partir del recurso compartido o montarlo en un catálogo compartido existente. Para crear un catálogo a partir de un recurso compartido, puede usar el Explorador de catálogos, la CLI del catálogo de Databricks unity o los comandos SQL de un cuaderno de Azure Databricks o el editor de consultas SQL de Databricks. Para montar el recurso compartido en un catálogo compartido existente, puede usar el Explorador de catálogos.

Permisos necesarios para crear un catálogo: un administrador de metastore, un usuario que tenga tanto los privilegios CREATE CATALOG y USE PROVIDER para tu metastore del catálogo de Unity, o un usuario que tenga tanto el privilegio CREATE CATALOG y la propiedad sobre el objeto de proveedor.

Permisos necesarios para montar el recurso compartido en un catálogo existente: un usuario debe tener el USE PROVIDER privilegio o ser propietario del objeto del proveedor, y también debe ser propietario del catálogo compartido existente o tener ambos privilegios MANAGE y USE CATALOG en el catálogo compartido existente.

Note

Si va a crear un catálogo a partir de un recurso compartido de SAP BDC , los metadatos semánticos de SAP (comentarios de tabla y columna, claves principales, claves externas y etiquetas de gobernanza) se sincronizan automáticamente en el catálogo. No es necesario realizar ninguna acción adicional. Para más información, consulte Metadatos semánticos de SAP BDC.

Note

Si el recurso compartido incluye vistas, debe usar un nombre de catálogo distinto del nombre del catálogo que contiene la vista en el metastore del proveedor.

Explorador de catálogos

En el área de trabajo de Azure Databricks, haga clic en Catalog para abrir el Explorador de catálogos.
En la parte superior del panel Catálogo, haga clic en el y seleccione Delta Sharing.

Como alternativa, en la esquina superior derecha, haga clic en Compartir > Delta Sharing.
En la pestaña Compartidos conmigo, busque el proveedor y selecciónelo.
Busque el recurso compartido deseado y haga clic en Montar para catalogar en la fila del recurso compartido.
Seleccione Crear un nuevo catálogo o Montar en el catálogo existente para agregar el recurso de datos a un catálogo existente.
Escriba un nombre para el nuevo catálogo o elija el catálogo existente al que agregar el recurso compartido.
Haga clic en Crear o montar.

Como alternativa, al abrir el Explorador de catálogos, puede hacer clic en + > Crear catálogo en la esquina superior derecha para crear un catálogo compartido. Consulte Creación de catálogos.

SQL

Ejecute el siguiente comando en un cuaderno o en el editor de consultas de Databricks SQL.

CREATE CATALOG [IF NOT EXISTS] <catalog-name>
USING SHARE <provider-name>.<share-name>;

CLI

databricks catalogs create <catalog-name> /
--provider-name <provider-name> /
--share-name <share-name>

El catálogo creado a partir de un recurso compartido tiene un tipo de catálogo de Delta Sharing. Puede ver el tipo en la página de detalles del catálogo en el Explorador de catálogos o ejecutando el comando DESCRIBE CATALOG SQL en un cuaderno o una consulta SQL de Databricks. Todos los catálogos compartidos aparecen en Catálogo > compartido en el panel izquierdo del Explorador de catálogos.

Un catálogo de Delta Sharing se puede administrar de la misma manera que los catálogos normales en un metastore de Unity Catalog. Puede ver, actualizar y eliminar un catálogo de Delta Sharing utilizando Catalog Explorer, la CLI de Databricks, y los comandos SQL mediante SHOW CATALOGS, DESCRIBE CATALOG, ALTER CATALOG, y DROP CATALOG.

La estructura de espacio de nombres de 3 niveles en un catálogo delta sharing creado a partir de un recurso compartido es el mismo que el de un catálogo normal en el catálogo de Unity: catalog.schema.table o catalog.schema.volume.

Los datos de tabla y volumen de un catálogo compartido son de solo lectura, lo que significa que puede realizar operaciones de lectura como:

DESCRIBE, SHOWy SELECT para tablas.
DESCRIBE VOLUME, LIST <volume-path>, SELECT * FROM <format>.'<volume_path>' y COPY INTO para volúmenes.

Los cuadernos de un catálogo compartido pueden obtener una vista previa y clonarse por cualquier usuario con USE CATALOG en el catálogo.

Los modelos de un catálogo compartido se pueden leer y cargar para la inferencia por parte de cualquier usuario con los siguientes privilegios: EXECUTE privilegios en el modelo registrado, además de USE SCHEMA y privilegios de USE CATALOG en el esquema y catálogo que contiene el modelo.

De forma predeterminada, el creador del catálogo es el propietario de todos los objetos de datos de un catálogo de Delta Sharing y puede administrar permisos para cualquiera de ellos.

Los privilegios se heredan de manera descendente, aunque es posible que algunas áreas de trabajo todavía estén en el modelo de seguridad heredado, ya que no ofrecía herencia. Consulte Modelo de herencia. Cualquier usuario que haya concedido el privilegio SELECT en el catálogo tendrá el privilegio SELECT en todos los esquemas y tablas del catálogo a menos que se revoque ese privilegio. Del mismo modo, cualquier usuario que tenga concedido el privilegio READ VOLUME en el catálogo tendrá el privilegio READ VOLUME en todos los volúmenes del catálogo, a menos que se revoque ese privilegio. No se pueden conceder privilegios que concedan acceso de escritura o actualización a un catálogo de Delta Sharing o a objetos de un catálogo de Delta Sharing.

El propietario del catálogo puede delegar la propiedad de los objetos de datos a otros usuarios o grupos, lo que concede a esos usuarios la capacidad de administrar los permisos de objeto y los ciclos de vida.

Para obtener información detallada sobre cómo administrar privilegios en objetos de datos mediante Unity Catalog, consulte Administración de privilegios en Unity Catalog.

Lectura de datos en una tabla compartida

Puede leer datos en una tabla compartida mediante cualquiera de las herramientas disponibles como usuario de Azure Databricks: Explorador de catálogos, cuadernos, consultas SQL, la CLI de Databricks y las API rest de Databricks. Debe tener el privilegio SELECT en la tabla.

Si el proveedor ha compartido la tabla WITH HISTORY, puede ejecutar transacciones en la tabla. Para obtener más información sobre los requisitos y las limitaciones de las transacciones, consulte Transacciones.

Leer datos en una tabla externa compartida o un esquema externo

Important

Esta característica se encuentra en su versión beta. Los administradores del área de trabajo pueden controlar el acceso a esta característica desde la página Vistas previas . Consulte Administrar versiones preliminares de Azure Databricks.

Puede leer datos en una tabla externa compartida o un esquema externo mediante cualquiera de las herramientas disponibles como usuario de Azure Databricks: Explorador de catálogos, cuadernos, consultas SQL, cli de Databricks y API rest de Databricks. Debe tener el SELECT privilegio en la tabla externa compartida o en el esquema externo.

Puede ejecutar transacciones en tablas externas compartidas. Consulte los requisitos y las limitaciones de las transacciones.

Hay costos adicionales al acceder a una tabla externa compartida o un esquema externo. Para obtener información sobre cómo se calculan los costos de compartición de Delta, consulte ¿Cómo se generan y verifican los costos de compartición de Delta?.

Limitaciones: no se puede omitir la restricción de clúster para leer tablas externas compartidas, incluso si el proveedor lo permite.

Lectura de datos en una tabla foránea compartida de Iceberg

Important

Esta característica está en versión preliminar pública.

Puede leer datos en una tabla externa compartida de Iceberg mediante cualquiera de las herramientas disponibles como usuario de Azure Databricks: Explorador de Catálogos, cuadernos, consultas SQL, la CLI de Databricks y las REST APIs de Databricks. En el Explorador de catálogos, se muestra una tabla compartida con un tipo de tabla de Foreign y un formato de origen de datos de Iceberg.

Tiene acceso a la ubicación del origen de Iceberg, pero solo puede realizar los siguientes tipos de consultas:

Consultas de instantáneas
Consultas de streaming

Requisitos:

Debe tener el privilegio SELECT en la tabla compartida externa de Iceberg.
Debe usar Databricks Runtime 15.4 LTS o superior.

Leer datos en un volumen compartido

Puede leer datos en un volumen compartido mediante cualquiera de las herramientas disponibles como usuario de Azure Databricks: Explorador de catálogos, cuadernos, consultas SQL, la CLI de Databricks y las API rest de Databricks. Debe tener el privilegio READ VOLUME en el volumen.

Leer datos protegidos por ABAC y aplicar directivas de ABAC

Important

Esta característica está en versión preliminar pública.

Attribute-based access control (ABAC) es un modelo de gobernanza de datos que proporciona control de acceso flexible, escalable y centralizado en Azure Databricks.

Los administradores de cuentas en el lado destinatario deben activar el Control de Acceso Basado en Atributos para Delta Sharing en las vistas previas de la consola de cuenta para leer las tablas compartidas aseguradas por las políticas ABAC. Esto garantiza que los resultados de la consulta sean correctos. De lo contrario, existe un riesgo de que los datos no se rijan correctamente.

Cree directivas de ABAC para tablas, esquemas y catálogos compartidos creados a partir de un 'share'. Las vistas materializadas se admiten con limitaciones. No se pueden crear directivas de ABAC para tablas de streaming compartidas ni vistas materializadas. Para configurar directivas de ABAC, consulte Creación y administración de directivas de control de acceso basado en atributos (ABAC).

Leer columnas de seguimiento de filas en tablas compartidas

Si el proveedor de datos ha habilitado el seguimiento de filas en una tabla compartida, puede consultar las columnas de metadatos de seguimiento de filas. Consulte Seguimiento de filas en Databricks para obtener una lista de columnas disponibles.

El acceso a estas columnas depende del tipo de tabla compartida:

Tablas compartidas con el historial y sin filtros de partición: puede consultar columnas de seguimiento de filas sin restricciones.
Tablas con filtros de partición o tablas compartidas sin historial: debe usar Scala Spark y establecer explícitamente la responseFormat opción en delta.
```
spark.read.option(“responseformat”, “delta”).table(“shared_table”).select(“_metadata.row_id”).show()
```

Carga de un modelo compartido para la inferencia

Para más información sobre cómo cargar un modelo compartido y usarlo para la inferencia por lotes, consulte Versión del modelo de carga por alias para cargas de trabajo de inferencia.

Consulta de los datos del historial de una tabla

Si el historial se comparte junto con la tabla, puede consultar los datos de la tabla a partir de una versión o marca de tiempo. Requiere Databricks Runtime 12.2 LTS o superior.

Por ejemplo:

SELECT * FROM vaccine.vaccine_us.vaccine_us_distribution VERSION AS OF 3;
SELECT * FROM vaccine.vaccine_us.vaccine_us_distribution TIMESTAMP AS OF "2023-01-01 00:00:00";

Además, si el flujo de datos de cambios (CDF) está habilitado con la tabla, puede consultar el CDF. Se admiten la versión y la marca de tiempo:

SELECT * FROM table_changes('vaccine.vaccine_us.vaccine_us_distribution', 0, 3);
SELECT * FROM table_changes('vaccine.vaccine_us.vaccine_us_distribution', "2023-01-01 00:00:00", "2022-02-01 00:00:00");

Para obtener más información sobre la alimentación de datos de cambios, consulte Use Delta Lake change data feed on Azure Databricks.

Consulta de una tabla mediante Apache Spark Structured Streaming

Si una tabla se comparte con el historial, puede usarla como origen de Spark Structured Streaming. Requiere Databricks Runtime 12.2 LTS o superior.

Opciones admitidas:

ignoreDeletes: omitir las transacciones que eliminan los datos.
ignoreChanges: volver a procesar las actualizaciones si los archivos se volvieron a escribir en la tabla de origen debido a una operación de cambio de datos como UPDATE, MERGE INTO, DELETE (dentro de las particiones) o OVERWRITE. Todavía se pueden emitir filas sin cambios. Por tanto, los consumidores de nivel inferior deben ser capaces de controlar los duplicados. Las eliminaciones no se propagan hacia abajo. ignoreChanges engloba ignoreDeletes. Por lo tanto, si usa ignoreChanges, el flujo no se interrumpirá mediante eliminaciones o actualizaciones de la tabla de origen.
startingVersion: la versión de la tabla compartida desde la cual iniciar. El origen de streaming leerá todos los cambios de tabla a partir de esta versión (inclusive).
startingTimestamp: marca de tiempo desde la que empezar. El origen de streaming leerá todos los cambios de tabla confirmados en o después de la marca de tiempo (inclusive). Ejemplo: "2023-01-01 00:00:00.0"
maxFilesPerTrigger: el número de archivos nuevos a considerar en cada microlote.
maxBytesPerTrigger: la cantidad de datos que se procesan en cada microlote. Esta opción establece un "máximo flexible", lo que significa que un lote procesa aproximadamente esta cantidad de datos y puede procesar más allá del límite para que la consulta en streaming avance en los casos en que la unidad de entrada más pequeña supere este límite.
readChangeFeed: stream lee la fuente de distribución de datos de cambios de la tabla compartida.

Opciones no admitidas:

Trigger.availableNow

Ejemplos de consultas de Structured Streaming

Scala

spark.readStream.format("deltaSharing")
.option("startingVersion", 0)
.option("ignoreChanges", true)
.option("maxFilesPerTrigger", 10)
.table("vaccine.vaccine_us.vaccine_us_distribution")

Python

spark.readStream.format("deltaSharing")\
.option("startingVersion", 0)\
.option("ignoreDeletes", true)\
.option("maxBytesPerTrigger", 10000)\
.table("vaccine.vaccine_us.vaccine_us_distribution")

Si se habilita el flujo de datos de cambios (CDF) en la tabla, puede realizar una lectura en streaming del CDF.

spark.readStream.format("deltaSharing")
.option("readChangeFeed", "true")
.table("vaccine.vaccine_us.vaccine_us_distribution")

Aplicar filtros de fila y máscaras de columna

Para aplicar filtros de fila y máscaras de columna en tablas y tablas externas compartidas por el proveedor de datos, consulte Aplicar manualmente filtros de fila y máscaras de columna. No se pueden aplicar máscaras de columnas a tablas de streaming ni vistas materializadas.

Lectura de tablas con vectores de eliminación o asignación de columnas habilitada

Important

Esta característica está en versión preliminar pública.

Los vectores de eliminación son una característica de optimización de almacenamiento que el proveedor puede habilitar en tablas Delta compartidas. Consulte Vectores de eliminación en Databricks.

Azure Databricks también admite la asignación de columnas para las tablas Delta. Consulte Cambiar nombre y quitar columnas con la asignación de columnas de Delta Lake.

Si su proveedor compartió una tabla con vectores de eliminación o asignación de columnas habilitados, puede realizar lecturas por lotes en la tabla usando un almacén SQL o un clúster que ejecute Databricks Runtime 14.1 o superior. Las consultas de CDF y streaming requieren Databricks Runtime 14.2 o superior.

Puede realizar consultas por lotes tal como están, ya que pueden resolver automáticamente responseFormat en función de las características de tabla de la tabla compartida.

Para leer un flujo de datos de cambio (CDF) o para realizar consultas en tiempo real en tablas compartidas con vectores de eliminación o asignación de columnas habilitados, debe establecer la opción adicional responseFormat=delta.

En los siguientes ejemplos se muestran consultas por lotes, CDF y streaming:

import org.apache.spark.sql.SparkSession

// Batch query
spark.read.format("deltaSharing").table(<tableName>)

// CDF query
spark.read.format("deltaSharing")
  .option("readChangeFeed", "true")
  .option("responseFormat", "delta")
  .option("startingVersion", 1)
  .table(<tableName>)

// Streaming query
spark.readStream.format("deltaSharing").option("responseFormat", "delta").table(<tableName>)

Leer tablas administradas de Iceberg compartidas

Important

Esta característica está en versión preliminar pública.

La lectura de tablas Iceberg compartidas es la misma que la lectura de tablas compartidas, con estas excepciones:

Compatibilidad con el uso compartido abierto:

Las instrucciones de este artículo se centran en leer datos compartidos mediante las interfaces de usuario de Azure Databricks, específicamente la sintaxis y las interfaces del Catálogo de Unity. Debido a la limitación de la compatibilidad avanzada de características de Delta con conectores de Delta Sharing, no se admite la consulta de tablas administradas y compartidas de Iceberg mediante Python, Tableau y Power BI.

Cambiar la fuente de datos:

La alimentación de datos de cambio no está soportada para las tablas Iceberg gestionadas.

limitaciones de Azure Databricks Iceberg

Se aplican las limitaciones de la tabla de Iceberg y de la tabla de Iceberg gestionada. Consulte Limitaciones de la tabla de Iceberg.

Leer vistas compartidas

La lectura de vistas compartidas es la misma que la lectura de tablas compartidas, con estas excepciones:

Restricciones de vistas compartidas:

Las vistas compartidas solo admiten un subconjunto de funciones y operadores integrados en Databricks. Consulte Funcionalidades compatibles en las vistas compartidas de Databricks a Databricks.
Los destinatarios no pueden consultar más de 20 vistas compartidas en una consulta en el uso compartido de Databricks a Databricks. Las vistas compartidas no pueden proceder de más de cinco proveedores compartidos diferentes.
Cuando el proveedor procede de la misma cuenta o cuando se usa un proceso sin servidor en otra cuenta, no se pueden consultar varias vistas dependientes del mismo proveedor en una sola consulta. Por ejemplo, si view1 depende de view2 del lado del proveedor y ambas vistas se comparten con usted, no puede hacer referencia a view1 y view2 en la misma consulta.
Puede ejecutar transacciones en vistas compartidas. Consulte los requisitos y las limitaciones de las transacciones.

Requisitos de nomenclatura:

El nombre del catálogo que se usa para el catálogo compartido que contiene la vista no puede ser el mismo que cualquier catálogo de proveedores que contenga una tabla a la que hace referencia la vista. Por ejemplo, si la vista compartida está contenida en test el catálogo y una de las tablas del proveedor a las que se hace referencia en esa vista se encuentra en el catálogo del test proveedor, la consulta producirá un error de conflicto de espacio de nombres. Vea Creación de un catálogo a partir de un recurso compartido.

Tiempo de espera del resultado de la consulta:

Si no tiene acceso directo a los datos subyacentes, Azure Databricks realiza una materialización en tiempo real al ejecutar consultas en la vista. Cuando esta materialización tarda más de 5 minutos, la consulta agota el tiempo de espera. Cambie a computación sin servidor para evitar esta limitación.

Historial y streaming:

No puede consultar el historial ni usar una vista como origen de streaming.

Ver compatibilidad con el uso compartido abierto:

Las instrucciones de este artículo se centran en leer datos compartidos mediante las interfaces de usuario de Azure Databricks, específicamente la sintaxis y las interfaces del Catálogo de Unity. También puede consultar vistas compartidas mediante Apache Spark, Python y herramientas de BI como Tableau y Power BI.

Costs:

Para obtener información sobre cómo se calculan los costos de compartición de Delta, consulte ¿Cómo se generan y verifican los costos de compartición de Delta?.

Leer tablas de streaming compartidas y vistas materializadas

Leer tablas de streaming compartidas y vistas materializadas es lo mismo que leer tablas compartidas, con estas excepciones:

Compatibilidad con el uso compartido abierto:

Las instrucciones de esta página se centran en leer datos compartidos mediante las interfaces de usuario de Azure Databricks, específicamente la sintaxis y las interfaces de Unity Catalog. También puede consultar tablas de streaming compartidas y vistas materializadas mediante Apache Spark, Python y herramientas de BI como Tableau y Power BI. Consulte Read data shared using Delta Sharing open sharing with bearer tokens (Leer datos compartidos mediante el uso compartido de Delta Sharing) con tokens de portador.

Transacciones:

Puede ejecutar transacciones en vistas materializadas compartidas y tablas de streaming. Consulte los requisitos y las limitaciones de las transacciones.

Limitaciones de SQL:

No se admite el uso de la función current_recipient.
No se admite el DESCRIBE EXTENDED comando.

Asignación de columnas:

Si está utilizando computación clásica al recibir un recurso compartido de una cuenta de Azure Databricks diferente, debe especificar el responseFormat como se muestra a continuación al consultar una vista materializada o tablas de transmisión con asignación de columnas.

spark.read.option("responseFormat", "delta").table("catalog_name.schema_name.mv_name")

Si utiliza "computación clásica" al compartir dentro de la misma cuenta de Azure Databricks o "computación sin servidor" en cualquier escenario, puede consultar sin restricciones.

Costs:

Para obtener información sobre cómo se calculan los costos de compartición de Delta, consulte ¿Cómo se generan y verifican los costos de compartición de Delta?.

Excepciones específicas de la vista materializada

History:

No se puede consultar el historial.

Refresh:

No puede acceder al estado de actualización y a la programación de actualización de la vista materializada.

Visualización y creación de tablas de streaming:

No se pueden crear tablas de streaming en vistas materializadas compartidas.

Excepciones específicas de la tabla de streaming

History:

El historial de consultas está disponible en las siguientes circunstancias de uso compartido de Databricks a Databricks:

Estás utilizando computación sin servidor al compartir con una cuenta diferente de Azure Databricks.
Estás usando computación sin servidor o clásica cuando compartes recursos dentro de la misma cuenta de Azure Databricks.

Para obtener más información sobre los distintos procesos, consulte Proceso.

Refresh:

No puede acceder al estado de actualización y a la programación de actualización de la tabla de streaming.

Lea UDF de Python compartidas

Leer las UDF de Python compartidas es igual que leer tablas compartidas. Después de crear un nuevo catálogo para el recurso compartido o montarlo en un catálogo existente, puede acceder a y usar el UDF de Python.

Lectura compartida `FeatureSpecs`

La lectura compartida FeatureSpecs es la misma que la lectura de tablas compartidas. Después de crear un nuevo catálogo para el recurso compartido o montarlo en un catálogo existente, puede implementar el FeatureSpec en el punto de conexión de servicio deseado. Para obtener información sobre cómo crear un punto de conexión, consulte Creación de un punto de conexión.

Si su proveedor actualiza con FeatureSpec una nueva dependencia, pero, si no comparte la dependencia con usted, su modelo fallará. Póngase en contacto con el proveedor de datos para comprobar si hay nuevas dependencias.

Antes de servir el FeatureSpec, debe crear una tienda en línea y publicar las tablas dependientes en su espacio de trabajo. Para obtener información sobre cómo crear tiendas en línea y publicar la tabla, consulte Databricks Online Feature Stores.

Lectura de cuadernos compartidos

Para obtener una vista previa y clonar archivos de cuaderno compartidos, puede usar Catalog Explorer.

Limitación de almacenamiento: Si el almacenamiento usa puntos de conexión privados, no puede leer cuadernos compartidos.

Permisos necesarios: propietario del catálogo o usuario con el privilegio USE CATALOG en el catálogo creado a partir del recurso compartido.

En el área de trabajo de Azure Databricks, haga clic en Catalog.
En el panel izquierdo, expanda el menú Catálogo, busque y seleccione el catálogo creado a partir del recurso compartido.
En la pestaña Otros recursos , verá los archivos de bloc de notas compartidos.
Haga clic en el nombre de un archivo de cuaderno compartido para obtener una vista previa.
(Opcional) Haga clic en el botón Clonar para importar el archivo de cuaderno compartido en el área de trabajo.
1. En el cuadro de diálogo Clonar en, escriba un Nuevo nombre y seleccione la carpeta del área de trabajo en la que quiere clonar el archivo de cuaderno.
2. Haga clic en Clonar.
3. Una vez clonado el cuaderno, aparece un cuadro de diálogo para informarle de que se ha clonado correctamente. Haga clic en Mostrar en el editor de cuadernos del cuadro de diálogo para verlo en el editor de cuadernos.
Consulte Cuadernos de Databricks.

Desmontar una unidad compartida para eliminar el activo de datos de su catálogo.

Permisos necesarios: Usuario con los privilegios USE CATALOG y MANAGE en el catálogo compartido.

En el área de trabajo de Azure Databricks, haga clic en Catalog para abrir el Explorador de catálogos.
En la parte superior del panel Catálogo, haga clic en el y seleccione Delta Sharing.

Como alternativa, en la esquina superior derecha, haga clic en Compartir > Delta Sharing.
En la pestaña Compartidos conmigo, busque el proveedor y selecciónelo.
Haga clic en en la fila de compartir.
Haga clic en Desmontar recurso compartido.
Haga clic en Desmontar.

Comentaris

Us ha resultat útil aquesta pàgina?

Last updated on 2026-04-22

Leer datos compartidos mediante el uso compartido de Databricks a Databricks Delta (para destinatarios)

¿Cómo puedo hacer que los datos compartidos estén disponibles para mi equipo?

Permisos necesarios

Visualización de proveedores y recursos compartidos

Visualización de todos los proveedores que han compartido datos con usted

Ver detalles del proveedor

Visualización de recursos compartidos

Acceso a datos en una tabla o volumen compartido

Crear un catálogo a partir de un recurso compartido

Explorador de catálogos

SQL

CLI

Administración de permisos para los esquemas, tablas y volúmenes de un catálogo de Delta Sharing

Lectura de datos en una tabla compartida

Leer datos en una tabla externa compartida o un esquema externo

Lectura de datos en una tabla foránea compartida de Iceberg

Leer datos en un volumen compartido

Leer datos protegidos por ABAC y aplicar directivas de ABAC

Leer columnas de seguimiento de filas en tablas compartidas

Carga de un modelo compartido para la inferencia

Consulta de los datos del historial de una tabla

Consulta de una tabla mediante Apache Spark Structured Streaming

Ejemplos de consultas de Structured Streaming

Scala

Python

Aplicar filtros de fila y máscaras de columna

Lectura de tablas con vectores de eliminación o asignación de columnas habilitada

Leer tablas administradas de Iceberg compartidas

Leer vistas compartidas

Leer tablas de streaming compartidas y vistas materializadas

Excepciones específicas de la vista materializada

Excepciones específicas de la tabla de streaming

Lea UDF de Python compartidas

Lectura compartida FeatureSpecs

Lectura de cuadernos compartidos

Desmontar un recurso compartido

Comentaris

Recursos addicionals

Lectura compartida `FeatureSpecs`