Nota
L'accés a aquesta pàgina requereix autorització. Pots provar d'iniciar sessió o canviar de directori.
L'accés a aquesta pàgina requereix autorització. Pots provar de canviar directoris.
En esta página se proporciona una visión general sobre cómo los proveedores pueden usar el protocolo de uso compartido abierto Delta Sharing para compartir datos desde el área de trabajo de Azure Databricks habilitada para el Catálogo de Unity con cualquier usuario de cualquier plataforma de computación, en cualquier lugar. Si usted es un destinatario de datos (un usuario o grupo de usuarios con los que se comparten datos), consulte en su lugar Acceder a los datos compartidos con usted utilizando Delta Sharing (para destinatarios).
¿Quién debe utilizar el protocolo de uso compartido abierto Delta Sharing?
Hay tres maneras de compartir datos utilizando Delta Sharing:
El protocolo de uso compartido abierto de Databricks, que se aborda en este artículo, le permite compartir los datos que administra en un área de trabajo de Databricks habilitada para Unity Catalog con usuarios de cualquier plataforma informática.
Este enfoque usa el servidor delta Sharing integrado en Azure Databricks y resulta útil cuando administra datos mediante el catálogo de Unity y quiere compartirlos con usuarios que no usan Databricks o que no tienen acceso a un área de trabajo de Databricks habilitada para el catálogo de Unity. La integración con Unity Catalog en el lado del proveedor simplifica la configuración y la administración para los proveedores.
Una implementación administrada por el cliente del servidor de código abierto Delta Sharing le permite compartir desde cualquier plataforma a cualquier plataforma, ya sea Databricks o no.
Consulte github.com/delta-io/delta-sharing.
El protocolo de uso compartido Databricks a Databricks le permite compartir datos de su área de trabajo habilitada para Unity Catalog con usuarios que también tienen acceso a un área de trabajo Databricks habilitada para Unity Catalog.
Consulte Compartir datos mediante el protocolo Delta Sharing Databricks a Databricks (para proveedores).
Para obtener una introducción al uso compartido de Delta y más información acerca de estos tres enfoques, consulte ¿Qué es el uso compartido delta?.
Flujo de trabajo de uso compartido abierto de Delta Sharing
En esta sección se proporciona información general de alto nivel sobre el flujo de trabajo de uso compartido abierto, con vínculos a documentación detallada para cada paso.
En el modelo de uso compartido abierto de Delta Sharing:
El proveedor de datos crea un destinatario, que es un objeto con nombre que representa un usuario o grupo de usuarios con los que el proveedor de datos desea compartir datos.
Cuando el proveedor de datos crea el destinatario, el proveedor configura la autenticación mediante un token de portador de larga duración o una federación de Open ID Connect (OIDC). Si el proveedor usa un token de portador, Azure Databricks genera un archivo de credenciales y un vínculo de activación que el proveedor de datos puede enviar al destinatario para acceder al archivo de credenciales. En el flujo de federación de OIDC, el IdP del destinatario administra la autenticación, en función de una directiva creada por el proveedor.
Para obtener más información, consulte Crear un objeto de destinatario para usuarios que no son de Databricks mediante tokens de portador (uso compartido abierto) y Usar la federación de Open ID Connect (OIDC) para habilitar la autenticación en particiones de Delta Sharing (uso compartido abierto).
El proveedor de datos crea un recurso compartido, que es un objeto con nombre que contiene una colección de tablas registradas en un metastore de catálogo de Unity en la cuenta del proveedor.
Para obtener más información, consulte el artículo sobre cómo crear y administrar recursos compartidos para Delta Sharing.
El proveedor de datos concede al destinatario acceso al recurso compartido.
Para obtener más información, consulte Administración del acceso a los datos compartidos de Delta Sharing (para proveedores).
En el flujo de token de portador, el proveedor de datos envía el vínculo de activación al destinatario a través de un canal seguro, junto con instrucciones para usar el vínculo de activación para descargar el archivo de credenciales que el destinatario usará para establecer una conexión segura con el proveedor de datos para recibir los datos compartidos.
Para obtener más información, consulte Obtener el vínculo de activación.
En el flujo de federación de OIDC, los destinatarios se autentican a través de su IdP. Consulte Uso de la federación de Open ID Connect (OIDC) para habilitar la autenticación en recursos compartidos Delta Sharing (uso compartido abierto).
En el flujo del token de portador, el destinatario de datos sigue el vínculo de activación para descargar el archivo de credenciales y, a continuación, usa el archivo de credenciales para acceder a los datos compartidos.
Los datos compartidos están disponibles para solo lectura. Los usuarios pueden acceder a los datos mediante la plataforma o las herramientas que prefieran. Para obtener más información, consulte Lectura de datos compartidos mediante el uso compartido abierto de Delta Sharing con tokens de portador (para destinatarios).
En el flujo de federación de OIDC, los destinatarios se autentican a través de su IdP. Consulte Uso de la federación de Open ID Connect (OIDC) para habilitar la autenticación en recursos compartidos Delta Sharing (uso compartido abierto).
Configuraciones específicas del proveedor
Muchos proveedores tienen sus propias redes de uso compartido delta para compartir. Para obtener instrucciones de uso compartido específicas, consulte, por ejemplo:
Consideraciones de configuración y seguridad del proveedor para el uso compartido abierto
Una buena administración de tokens es clave a la hora de compartir datos de forma segura cuando se usa el modelo de uso compartido abierto:
- Los proveedores de datos de Azure Databricks que piensan usar el uso compartido abierto cuando proporcionan recursos compartidos deben configurar la duración predeterminada del token de destinatario cuando habilitan Delta Sharing para su metastore de Unity Catalog. Databricks recomienda configurar tokens para que expiren. Consulte Habilitación de Delta Sharing en un metastore.
- Si necesita modificar la duración predeterminada del token, consulte la sección sobre cómo modificar la duración del token de destinatario.
- Anime a los destinatarios a administrar su archivo de credenciales descargado de forma segura.
- Para obtener más información sobre la administración de tokens y la seguridad de uso compartido abierto, consulte Administración de tokens de destinatario.
- El uso compartido abierto se admite entre tipos de entorno en la nube, por ejemplo, desde nubes comerciales de AWS a AWS GovCloud o Azure China.
Los proveedores de datos pueden proporcionar seguridad adicional mediante la asignación de listas de acceso de IP para restringir el acceso de los destinatarios a ubicaciones de red específicas. Consulte Restringir el acceso de destinatarios a Delta Sharing mediante listas de acceso IP (uso compartido abierto).