Nota
L'accés a aquesta pàgina requereix autorització. Pots provar d'iniciar sessió o canviar de directori.
L'accés a aquesta pàgina requereix autorització. Pots provar de canviar directoris.
En esta página se describe cómo leer datos compartidos con usted mediante el protocolo Databricks-to-Databricks Delta Sharing, donde Databricks administra una conexión segura para el uso compartido de datos. A diferencia del protocolo Delta Sharing de uso compartido abierto, el protocolo Databricks a Databricks no requiere un archivo de credenciales (seguridad basada en tokens).
El uso compartido de Databricks a Databricks requiere que, como destinatario, cumpla los dos requisitos siguientes:
- Tiene acceso a un área de trabajo de Databricks con Unity Catalog habilitado.
- El proveedor usa el protocolo Databricks-to-Databricks Delta Sharing, no el protocolo de uso compartido abierto, que proporciona un archivo de credenciales.
Si no se cumple alguno de los requisitos, consulte Lectura de datos compartidos mediante el uso compartido abierto de Delta Sharing con tokens de portador (para destinatarios).
¿Cómo puedo hacer que los datos compartidos estén disponibles para mi equipo?
Para leer datos y cuadernos que se han compartido con usted mediante el protocolo Databricks-to-Databricks, debe ser un usuario en un área de trabajo de Databricks habilitada para Catálogo de Unity. Un miembro del equipo proporciona al proveedor de datos un identificador único para el metastore del catálogo de Unity y el proveedor de datos usa ese identificador para crear una conexión de uso compartido seguro con su organización. A continuación, los datos compartidos estarán disponibles para el acceso de lectura en el área de trabajo. Las actualizaciones que realiza el proveedor de datos en las tablas compartidas, vistas, volúmenes y particiones se reflejan en el área de trabajo casi en tiempo real.
Note
Es posible que los cambios de columna, como agregar, cambiar el nombre o eliminar, no aparezcan en el Explorador de catálogos hasta un minuto. Del mismo modo, los nuevos recursos compartidos y las actualizaciones de los recursos compartidos, incluida la adición de nuevas tablas, se almacenan en caché durante un minuto antes de que estén disponibles para ver y consultar.
Para leer los datos que se han compartido con usted:
- Un usuario del equipo busca el recurso compartido (el contenedor de las tablas, vistas y cuadernos que se han compartido con usted) y lo utiliza para crear un catálogo, el contenedor de nivel superior para todos los datos de Unity Catalog de Databricks.
- Un usuario del equipo concede o deniega el acceso al catálogo y a los objetos del catálogo (esquemas, tablas, vistas y volúmenes) a los miembros del equipo.
- Usted lee los datos en las tablas, vistas y volúmenes a los que se le haya concedido acceso igual que cualquier recurso de datos en Databricks al que tenga acceso de solo lectura (
SELECToREAD VOLUME). - Puede obtener una vista previa y clonar cuadernos en el recurso compartido, siempre y cuando tenga el privilegio
USE CATALOGen el catálogo.
Permisos necesarios
Para poder enumerar y ver detalles sobre todos los proveedores y recursos compartidos de proveedores, debe ser administrador de metastore o tener el privilegio USE PROVIDER. Otros usuarios solo tienen acceso a los proveedores y recursos compartidos de los que son propietarios.
Para crear un catálogo a partir de un recurso compartido de proveedor, debe ser un administrador de metastore, un usuario que tenga los privilegios CREATE CATALOG y USE PROVIDER para el metastore de Unity Catalog, o un usuario que tenga tanto el privilegio CREATE CATALOG como la propiedad del objeto de proveedor.
La capacidad de conceder acceso de solo lectura a los esquemas (bases de datos), tablas, vistas y volúmenes del catálogo creados a partir del recurso compartido sigue la jerarquía de privilegios típica de Unity Catalog. La capacidad de ver cuadernos en el catálogo creado a partir del recurso compartido requiere el privilegio USE CATALOG en el catálogo. Consulte Administración de permisos para los esquemas, tablas y volúmenes de un catálogo de Delta Sharing.
Visualización de proveedores y recursos compartidos
Para empezar a leer los datos compartidos con usted por un proveedor de datos, debe conocer el nombre del proveedor y de los objetos de recurso compartido que se almacenan en el metastore de Unity Catalog una vez que el proveedor haya compartido datos con usted.
El objeto de proveedor representa el metastore de Unity Catalog, la plataforma en la nube y la región de la organización que compartió los datos con usted.
El objeto del recurso compartido representa las tablas, volúmenes y vistas que el proveedor ha compartido con usted.
Visualización de todos los proveedores que han compartido datos con usted
Para ver una lista de proveedores de datos disponibles, puede usar Catalog Explorer, la CLI de Unity Catalog de Databricks o el comando SQL SHOW PROVIDERS en un cuaderno de Azure Databricks o el editor de consultas de Databricks SQL.
Permisos necesarios: debe ser administrador de metastore o tener el privilegio USE PROVIDER. Otros usuarios solo tienen acceso a los proveedores y recursos compartidos de proveedores de los que son propietarios.
Para obtener más información, consulte Visualización de proveedores.
Ver detalles del proveedor
Para ver detalles sobre un proveedor, puede usar Catalog Explorer, la CLI de Unity Catalog de Databricks o el comando SQL DESCRIBE PROVIDER en un cuaderno de Azure Databricks o el editor de consultas de Databricks SQL.
Permisos necesarios: debe ser administrador del metastore, tener el privilegio USE PROVIDER o ser propietario del objeto de proveedor.
Para obtener más información, consulte Visualización de detalles del proveedor.
Visualización de recursos compartidos
Para ver los recursos compartidos que un proveedor ha compartido con usted, puede usar Catalog Explorer, la CLI de Unity Catalog de Databricks o el comando SQL SHOW SHARES IN PROVIDER en un cuaderno de Azure Databricks o el editor de consultas de Databricks SQL.
Permisos necesarios: debe ser administrador del metastore, tener el privilegio USE PROVIDER o ser propietario del objeto de proveedor.
Para obtener más información, consulte Visualización de recursos compartidos que un proveedor ha compartido con usted.
Acceso a datos en una tabla o volumen compartido
Para leer datos en una tabla o volumen compartido:
- Un usuario con privilegios debe crear un catálogo a partir del recurso compartido que contiene la tabla o volumen. Puede ser un administrador de metastore, un usuario que tenga los privilegios
CREATE CATALOGyUSE PROVIDERpara el metastore de Unity Catalog, o un usuario que tenga tanto el privilegio como la propiedadCREATE CATALOGdel objeto de proveedor. - Ese usuario o un usuario con los mismos privilegios deben concederle acceso a la tabla o volumen compartido.
- Puede acceder a la tabla o volumen igual que haría con cualquier otro recurso de datos registrado en el metastore de Unity Catalog.
Crear un catálogo a partir de un recurso compartido
Para que los datos de un recurso compartido sean accesibles para su equipo, debe crear un catálogo a partir del recurso compartido o montarlo en un catálogo compartido existente. Para crear un catálogo a partir de un recurso compartido, puede usar Catalog Explorer, la CLI de Unity Catalog de Databricks o comandos SQL en un cuaderno de Azure Databricks o el editor de consultas de Databricks SQL. Para montar el recurso compartido en un catálogo compartido existente, puede usar el Explorador de catálogos.
Permisos necesarios para crear un catálogo: un administrador de metastore, un usuario que tenga tanto los privilegios CREATE CATALOG y USE PROVIDER para tu metastore del catálogo de Unity, o un usuario que tenga tanto el privilegio CREATE CATALOG y la propiedad sobre el objeto de proveedor.
Permisos necesarios para montar el recurso compartido en un catálogo existente: un usuario debe tener el USE PROVIDER privilegio o ser propietario del objeto del proveedor, y también debe ser propietario del catálogo compartido existente o tener ambos privilegios MANAGE y USE CATALOG en el catálogo compartido existente.
Note
Si el recurso compartido incluye vistas, debe usar un nombre de catálogo distinto del nombre del catálogo que contiene la vista en el metastore del proveedor.
Explorador de catálogos
En el área de trabajo de Azure Databricks, haga clic en
Catálogo para abrir el Explorador de catálogos.
En la parte superior del panel Catálogo, haga clic en el
y seleccione Delta Sharing.
Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.
En la pestaña Compartidos conmigo, busque el proveedor y selecciónelo.
Busque el recurso compartido deseado y haga clic en Montar para catalogar en la fila del recurso compartido.
Seleccione Crear un nuevo catálogo o Montar en el catálogo existente para agregar el recurso de datos a un catálogo existente.
Escriba un nombre para el nuevo catálogo o elija el catálogo existente al que agregar el recurso compartido.
Haga clic en Crear o montar.
Como alternativa, al abrir el Explorador de catálogos, puede hacer clic en + > Crear catálogo en la esquina superior derecha para crear un catálogo compartido. Consulte Creación de catálogos.
SQL
Ejecute el siguiente comando en un cuaderno o en el editor de consultas de Databricks SQL.
CREATE CATALOG [IF NOT EXISTS] <catalog-name>
USING SHARE <provider-name>.<share-name>;
CLI
databricks catalogs create <catalog-name> /
--provider-name <provider-name> /
--share-name <share-name>
El catálogo creado a partir de un recurso compartido tiene un tipo de catálogo de Delta Sharing. Puede ver el tipo en la página de detalles del catálogo en el Explorador de catálogos o ejecutando el comando DESCRIBE CATALOG SQL en un cuaderno o una consulta SQL de Databricks. Todos los catálogos compartidos aparecen en Catálogo > compartido en el panel izquierdo del Explorador de catálogos.
Un catálogo de Delta Sharing se puede administrar de la misma manera que los catálogos normales en un metastore de Unity Catalog. Puede ver, actualizar y eliminar un catálogo de Delta Sharing utilizando Catalog Explorer, la CLI de Databricks, y los comandos SQL mediante SHOW CATALOGS, DESCRIBE CATALOG, ALTER CATALOG, y DROP CATALOG.
La estructura de espacio de nombres de 3 niveles en un catálogo delta sharing creado a partir de un recurso compartido es el mismo que el de un catálogo normal en el catálogo de Unity: catalog.schema.table o catalog.schema.volume.
Los datos de tabla y volumen de un catálogo compartido son de solo lectura, lo que significa que puede realizar operaciones de lectura como:
-
DESCRIBE,SHOWySELECTpara tablas. -
DESCRIBE VOLUME,LIST <volume-path>,SELECT * FROM <format>.'<volume_path>'yCOPY INTOpara volúmenes.
Los cuadernos de un catálogo compartido pueden obtener una vista previa y clonarse por cualquier usuario con USE CATALOG en el catálogo.
Los modelos de un catálogo compartido se pueden leer y cargar para la inferencia por parte de cualquier usuario con los siguientes privilegios: EXECUTE privilegios en el modelo registrado, además de USE SCHEMA y privilegios de USE CATALOG en el esquema y catálogo que contiene el modelo.
Administración de permisos para los esquemas, tablas y volúmenes de un catálogo de Delta Sharing
De forma predeterminada, el creador del catálogo es el propietario de todos los objetos de datos de un catálogo de Delta Sharing y puede administrar permisos para cualquiera de ellos.
Los privilegios se heredan de manera descendente, aunque es posible que algunas áreas de trabajo todavía estén en el modelo de seguridad heredado, ya que no ofrecía herencia. Consulte Modelo de herencia. Cualquier usuario que haya concedido el privilegio SELECT en el catálogo tendrá el privilegio SELECT en todos los esquemas y tablas del catálogo a menos que se revoque ese privilegio. Del mismo modo, cualquier usuario que tenga concedido el privilegio READ VOLUME en el catálogo tendrá el privilegio READ VOLUME en todos los volúmenes del catálogo, a menos que se revoque ese privilegio. No se pueden conceder privilegios que concedan acceso de escritura o actualización a un catálogo de Delta Sharing o a objetos de un catálogo de Delta Sharing.
El propietario del catálogo puede delegar la propiedad de los objetos de datos a otros usuarios o grupos, lo que concede a esos usuarios la capacidad de administrar los permisos de objeto y los ciclos de vida.
Para obtener información detallada sobre cómo administrar privilegios en objetos de datos mediante Unity Catalog, consulte Administración de privilegios en Unity Catalog.
Lectura de datos en una tabla compartida
Puede leer datos en una tabla compartida mediante cualquiera de las herramientas disponibles como usuario de Azure Databricks: Catalog Explorer, cuadernos, consultas SQL, la CLI de Databricks y las API de REST de Databricks. Debe tener el privilegio SELECT en la tabla.
Leer datos en una tabla externa compartida o un esquema externo
Important
Esta característica se encuentra en su versión beta. Los administradores del área de trabajo pueden controlar el acceso a esta característica desde la página Vistas previas . Consulte Administración de versiones preliminares de Azure Databricks.
Puede leer datos en una tabla externa compartida o un esquema externo compartido mediante cualquiera de las herramientas disponibles como usuario de Azure Databricks: Explorador de catálogos, cuadernos, consultas SQL, la CLI de Databricks y las API rest de Databricks. Debe tener el SELECT privilegio en la tabla externa compartida o en el esquema externo.
Hay costos adicionales al acceder a una tabla externa compartida o un esquema externo. Para obtener información sobre cómo se calculan los costos de compartición de Delta, consulte ¿Cómo se generan y verifican los costos de compartición de Delta?.
Leer datos en un volumen compartido
Puede leer datos en un volumen compartido mediante cualquiera de las herramientas disponibles como usuario de Azure Databricks: Catalog Explorer, cuadernos, consultas SQL, la CLI de Databricks y las API REST de Databricks. Debe tener el privilegio READ VOLUME en el volumen.
Leer datos protegidos por ABAC y aplicar directivas de ABAC
Important
Esta característica está en versión preliminar pública.
El control de acceso basado en atributos (ABAC) es un modelo de gobernanza de datos que proporciona control de acceso flexible, escalable y centralizado en Azure Databricks.
Los administradores de cuentas del lado destinatario deben activar el Control de Acceso Basado en Atributos para Delta Sharing en las versiones preliminares de la consola de cuentas para leer las tablas compartidas protegidas por las reglas de ABAC. Esto garantiza que los resultados de la consulta sean correctos. De lo contrario, existe un riesgo de que los datos no se rijan correctamente.
Cree directivas de ABAC para tablas, esquemas y catálogos compartidos creados a partir de un 'share'. Las vistas materializadas se admiten con limitaciones. No se pueden crear directivas de ABAC para tablas de streaming compartidas ni vistas materializadas. Para configurar directivas de ABAC, consulte Creación y administración de directivas de control de acceso basado en atributos (ABAC).
Carga de un modelo compartido para la inferencia
Para más información sobre cómo cargar un modelo compartido y usarlo para la inferencia por lotes, consulte Versión del modelo de carga por alias para cargas de trabajo de inferencia.
Consulta de los datos del historial de una tabla
Si el historial se comparte junto con la tabla, puede consultar los datos de la tabla a partir de una versión o marca de tiempo. Requiere Databricks Runtime 12.2 LTS o superior.
Por ejemplo:
SELECT * FROM vaccine.vaccine_us.vaccine_us_distribution VERSION AS OF 3;
SELECT * FROM vaccine.vaccine_us.vaccine_us_distribution TIMESTAMP AS OF "2023-01-01 00:00:00";
Además, si el flujo de datos de cambios (CDF) está habilitado con la tabla, puede consultar el CDF. Se admiten la versión y la marca de tiempo:
SELECT * FROM table_changes('vaccine.vaccine_us.vaccine_us_distribution', 0, 3);
SELECT * FROM table_changes('vaccine.vaccine_us.vaccine_us_distribution', "2023-01-01 00:00:00", "2022-02-01 00:00:00");
Para obtener más información sobre el flujo de datos de cambios, consulte Usar el flujo de datos de cambios de Delta Lake en Azure Databricks.
Consulta de una tabla mediante Apache Spark Structured Streaming
Si una tabla se comparte con el historial, puede usarla como origen de Spark Structured Streaming. Requiere Databricks Runtime 12.2 LTS o superior.
Opciones admitidas:
-
ignoreDeletes: omitir las transacciones que eliminan los datos. -
ignoreChanges: volver a procesar las actualizaciones si los archivos se volvieron a escribir en la tabla de origen debido a una operación de cambio de datos comoUPDATE,MERGE INTO,DELETE(dentro de las particiones) oOVERWRITE. Todavía se pueden emitir filas sin cambios. Por tanto, los consumidores de nivel inferior deben ser capaces de controlar los duplicados. Las eliminaciones no se propagan hacia abajo.ignoreChangesenglobaignoreDeletes. Por lo tanto, si usaignoreChanges, el flujo no se interrumpirá mediante eliminaciones o actualizaciones de la tabla de origen. -
startingVersion: la versión de la tabla compartida desde la cual iniciar. El origen de streaming leerá todos los cambios de tabla a partir de esta versión (inclusive). -
startingTimestamp: marca de tiempo desde la que empezar. El origen de streaming leerá todos los cambios de tabla confirmados en o después de la marca de tiempo (inclusive). Ejemplo:"2023-01-01 00:00:00.0" -
maxFilesPerTrigger: el número de archivos nuevos a considerar en cada microlote. -
maxBytesPerTrigger: la cantidad de datos que se procesan en cada microlote. Esta opción establece un "máximo flexible", lo que significa que un lote procesa aproximadamente esta cantidad de datos y puede procesar más allá del límite para que la consulta en streaming avance en los casos en que la unidad de entrada más pequeña supere este límite. -
readChangeFeed: stream lee la fuente de distribución de datos de cambios de la tabla compartida.
Opciones no admitidas:
Trigger.availableNow
Ejemplos de consultas de Structured Streaming
Scala
spark.readStream.format("deltaSharing")
.option("startingVersion", 0)
.option("ignoreChanges", true)
.option("maxFilesPerTrigger", 10)
.table("vaccine.vaccine_us.vaccine_us_distribution")
Python
spark.readStream.format("deltaSharing")\
.option("startingVersion", 0)\
.option("ignoreDeletes", true)\
.option("maxBytesPerTrigger", 10000)\
.table("vaccine.vaccine_us.vaccine_us_distribution")
Si se habilita el flujo de datos de cambios (CDF) en la tabla, puede realizar una lectura en streaming del CDF.
spark.readStream.format("deltaSharing")
.option("readChangeFeed", "true")
.table("vaccine.vaccine_us.vaccine_us_distribution")
Aplicar filtros de fila y máscaras de columna
Para aplicar filtros de fila y máscaras de columna en tablas y tablas externas compartidas por el proveedor de datos, consulte Aplicar manualmente filtros de fila y máscaras de columna. No se pueden aplicar máscaras de columnas a tablas de streaming ni vistas materializadas.
Lectura de tablas con vectores de eliminación o asignación de columnas habilitada
Important
Esta característica está en versión preliminar pública.
Los vectores de eliminación son una característica de optimización de almacenamiento que el proveedor puede habilitar en tablas Delta compartidas. Consulte ¿Qué son los vectores de eliminación?.
Azure Databricks también admite la asignación de columnas para tablas Delta. Consulte Cambiar nombre y quitar columnas con la asignación de columnas de Delta Lake.
Si su proveedor compartió una tabla con vectores de eliminación o asignación de columnas habilitados, puede realizar lecturas por lotes en la tabla usando un almacén SQL o un clúster que ejecute Databricks Runtime 14.1 o superior. Las consultas de CDF y streaming requieren Databricks Runtime 14.2 o superior.
Puede realizar consultas por lotes tal como están, ya que pueden resolver automáticamente responseFormat en función de las características de tabla de la tabla compartida.
Para leer un flujo de datos de cambio (CDF) o para realizar consultas en tiempo real en tablas compartidas con vectores de eliminación o asignación de columnas habilitados, debe establecer la opción adicional responseFormat=delta.
En los siguientes ejemplos se muestran consultas por lotes, CDF y streaming:
import org.apache.spark.sql.SparkSession
// Batch query
spark.read.format("deltaSharing").table(<tableName>)
// CDF query
spark.read.format("deltaSharing")
.option("readChangeFeed", "true")
.option("responseFormat", "delta")
.option("startingVersion", 1)
.table(<tableName>)
// Streaming query
spark.readStream.format("deltaSharing").option("responseFormat", "delta").table(<tableName>)
Leer tablas administradas de Iceberg compartidas
Important
Esta característica está en versión preliminar pública.
La lectura de tablas Iceberg compartidas es la misma que la lectura de tablas compartidas, con estas excepciones:
Compatibilidad con el uso compartido abierto:
Las instrucciones de este artículo se centran en la lectura de datos compartidos mediante interfaces de usuario de Azure Databricks, específicamente la sintaxis y las interfaces del catálogo de Unity. Debido a la limitación en la compatibilidad de funciones avanzadas de Delta para los conectores de Delta Sharing, no se admite la consulta de tablas gestionadas y compartidas de Iceberg utilizando Python, Tableau y Power BI.
Cambiar la fuente de datos:
La alimentación de datos de cambio no está soportada para las tablas Iceberg gestionadas.
Limitaciones de Azure Databricks Iceberg:
Se aplican las limitaciones de la tabla de Iceberg y de la tabla de Iceberg gestionada. Consulte Limitaciones de la tabla de Iceberg.
Leer vistas compartidas
La lectura de vistas compartidas es la misma que la lectura de tablas compartidas, con estas excepciones:
Restricciones de vistas compartidas:
- Las vistas compartidas solo admiten un subconjunto de funciones y operadores integrados en Databricks. Consulte Funcionalidades compatibles en las vistas compartidas de Databricks a Databricks.
- Los destinatarios no pueden consultar más de 20 vistas compartidas en una consulta en el uso compartido de Databricks a Databricks. Las vistas compartidas no pueden proceder de más de cinco proveedores compartidos diferentes.
- Cuando el proveedor procede de la misma cuenta o cuando se usa un proceso sin servidor en otra cuenta, no se pueden consultar varias vistas dependientes del mismo proveedor en una sola consulta.
Por ejemplo, si
view1depende deview2del lado del proveedor y ambas vistas se comparten con usted, no puede hacer referencia aview1yview2en la misma consulta.
Requisitos de nomenclatura:
El nombre del catálogo que se usa para el catálogo compartido que contiene la vista no puede ser el mismo que cualquier catálogo de proveedores que contenga una tabla a la que hace referencia la vista. Por ejemplo, si la vista compartida está contenida en test el catálogo y una de las tablas del proveedor a las que se hace referencia en esa vista se encuentra en el catálogo del test proveedor, la consulta producirá un error de conflicto de espacio de nombres. Vea Creación de un catálogo a partir de un recurso compartido.
Tiempo de espera del resultado de la consulta:
Si no tiene acceso directo a los datos subyacentes, Azure Databricks realiza materialización sobre la marcha al consultar la vista. Cuando esta materialización tarda más de 5 minutos, la consulta agota el tiempo de espera. Cambie a computación sin servidor para evitar esta limitación.
Historial y streaming:
No puede consultar el historial ni usar una vista como origen de streaming.
Ver compatibilidad con el uso compartido abierto:
Las instrucciones de este artículo se centran en la lectura de datos compartidos mediante interfaces de usuario de Azure Databricks, específicamente la sintaxis y las interfaces del catálogo de Unity. También puede consultar vistas compartidas mediante herramientas de Apache Spark, Python y BI como Tableau y Power BI.
Costs:
Para obtener información sobre cómo se calculan los costos de compartición de Delta, consulte ¿Cómo se generan y verifican los costos de compartición de Delta?.
Leer tablas de streaming compartidas y vistas materializadas
Leer tablas de streaming compartidas y vistas materializadas es lo mismo que leer tablas compartidas, con estas excepciones:
Compatibilidad con el uso compartido abierto:
Las instrucciones de este artículo se centran en la lectura de datos compartidos mediante interfaces de usuario de Azure Databricks, específicamente la sintaxis y las interfaces del catálogo de Unity. También puede consultar tablas de streaming compartidas y vistas materializadas mediante herramientas de Apache Spark, Python y BI como Tableau y Power BI.
Limitaciones de SQL:
- No se admite el uso de la función
current_recipient. - No se admite el
DESCRIBE EXTENDEDcomando.
Asignación de columnas:
Si usa el proceso clásico al recibir un recurso compartido de otra cuenta de Azure Databricks, debe especificar el responseFormat de la siguiente manera al consultar una vista materializada o tablas de streaming con asignación de columnas.
spark.read.option("responseFormat", "delta").table("catalog_name.schema_name.mv_name")
Si usa computación clásica al compartir dentro de la misma cuenta de Azure Databricks o computación sin servidor en cualquier escenario, puede realizar consultas sin restricciones.
Costs:
Para obtener información sobre cómo se calculan los costos de compartición de Delta, consulte ¿Cómo se generan y verifican los costos de compartición de Delta?.
Excepciones específicas de la vista materializada
History:
No se puede consultar el historial.
Refresh:
No puede acceder al estado de actualización y a la programación de actualización de la vista materializada.
Visualización y creación de tablas de streaming:
No se pueden crear tablas de streaming en vistas materializadas compartidas.
Excepciones específicas de la tabla de streaming
History:
El historial de consultas está disponible en las siguientes circunstancias de uso compartido de Databricks a Databricks:
Cuando compartes con una cuenta de Azure Databricks diferente, estás utilizando cómputo sin servidor.
Está usando computación sin servidor o computación clásica al compartir dentro de la misma cuenta de Azure Databricks.
Para obtener más información sobre los distintos procesos, consulte Proceso.
Refresh:
No puede acceder al estado de actualización y a la programación de actualización de la tabla de streaming.
Leer UDF de Python compartidas
La lectura de UDF de Python compartidas es la misma que la lectura de tablas compartidas. Después de crear un nuevo catálogo para el recurso compartido o montarlo en un catálogo existente, puede acceder y usar la UDF de Python.
Lectura compartida FeatureSpecs
La lectura compartida FeatureSpecs es la misma que la lectura de tablas compartidas. Después de crear un nuevo catálogo para el recurso compartido o montarlo en un catálogo existente, puede implementar el FeatureSpec en el punto de conexión de servicio deseado. Para obtener información sobre cómo crear un punto de conexión, consulte Creación de un punto de conexión.
Si su proveedor actualiza con FeatureSpec una nueva dependencia, pero, si no comparte la dependencia con usted, su modelo fallará. Póngase en contacto con el proveedor de datos para comprobar si hay nuevas dependencias.
Antes de servir el FeatureSpec, debe crear una tienda en línea y publicar las tablas dependientes en su espacio de trabajo. Para obtener información sobre cómo crear tiendas en línea y publicar la tabla, consulte Databricks Online Feature Stores.
Lectura de cuadernos compartidos
Para obtener una vista previa y clonar archivos de cuaderno compartidos, puede usar Catalog Explorer.
Limitación de almacenamiento: Si el almacenamiento usa puntos de conexión privados, no puede leer cuadernos compartidos.
Permisos necesarios: propietario del catálogo o usuario con el privilegio USE CATALOG en el catálogo creado a partir del recurso compartido.
En el área de trabajo de Azure Databricks, haga clic en
Catálogo.
En el panel izquierdo, expanda el menú Catálogo, busque y seleccione el catálogo creado a partir del recurso compartido.
En la pestaña Otros recursos , verá los archivos de bloc de notas compartidos.
Haga clic en el nombre de un archivo de cuaderno compartido para obtener una vista previa.
(Opcional) Haga clic en el botón Clonar para importar el archivo de cuaderno compartido en el área de trabajo.
- En el cuadro de diálogo Clonar en, escriba un Nuevo nombre y seleccione la carpeta del área de trabajo en la que quiere clonar el archivo de cuaderno.
- Haga clic en Clonar.
- Una vez clonado el cuaderno, aparece un cuadro de diálogo para informarle de que se ha clonado correctamente. Haga clic en Mostrar en el editor de cuadernos del cuadro de diálogo para verlo en el editor de cuadernos.
Consulte Cuadernos de Databricks.
Desmontar un recurso compartido
Desmontar una unidad compartida para eliminar el activo de datos de su catálogo.
Permisos necesarios: Usuario con los privilegios USE CATALOG y MANAGE en el catálogo compartido.
En el área de trabajo de Azure Databricks, haga clic en
Catálogo para abrir el Explorador de catálogos.
En la parte superior del panel Catálogo, haga clic en el
y seleccione Delta Sharing.
Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.
En la pestaña Compartidos conmigo, busque el proveedor y selecciónelo.
Haga clic en
en la fila de compartir.
Haga clic en Desmontar recurso compartido.
Haga clic en Desmontar.