Compartir datos mediante el protocolo de intercambio abierto Delta Sharing (para proveedores)
Este artículo ofrece una visión general de cómo los proveedores pueden utilizar el protocolo de uso compartido abierto Delta Sharing para compartir datos de su área de trabajo Azure Databricks habilitada para Unity Catalog con cualquier usuario en cualquier plataforma informática, en cualquier lugar.
Nota:
Si usted es un destinatario de datos (un usuario o grupo de usuarios con los que se comparten datos), consulte en su lugar Acceder a los datos compartidos con usted utilizando Delta Sharing (para destinatarios).
¿Quién debe utilizar el protocolo de uso compartido abierto Delta Sharing?
Hay tres maneras de compartir datos utilizando Delta Sharing:
El protocolo de uso compartido abierto de Databricks, que se aborda en este artículo, le permite compartir los datos que administra en un área de trabajo de Databricks habilitada para Unity Catalog con usuarios de cualquier plataforma informática.
Este enfoque utiliza el servidor Delta Sharing integrado en Azure Databricks y resulta útil cuando se administran datos mediante Unity Catalog y se desea compartirlos con usuarios que no utilizan Databricks o no tienen acceso a un área de trabajo de Databricks habilitada para Unity Catalog. La integración con Unity Catalog en el lado del proveedor simplifica la configuración y la administración para los proveedores.
Una implementación administrada por el cliente del servidor de código abierto Delta Sharing le permite compartir desde cualquier plataforma a cualquier plataforma, ya sea Databricks o no.
Consulte github.com/delta-io/delta-sharing.
El protocolo de uso compartido Databricks a Databricks le permite compartir datos de su área de trabajo habilitada para Unity Catalog con usuarios que también tienen acceso a un área de trabajo Databricks habilitada para Unity Catalog.
Consulte Compartir datos mediante el protocolo Delta Sharing Databricks a Databricks (para proveedores).
Para obtener una introducción al uso compartido de Delta y más información acerca de estos tres enfoques, consulte ¿Qué es el uso compartido delta?.
Flujo de trabajo de uso compartido abierto de Delta Sharing
En esta sección se proporciona información general de alto nivel sobre el flujo de trabajo de uso compartido abierto, con vínculos a documentación detallada para cada paso.
En el modelo de uso compartido abierto de Delta Sharing:
El proveedor de datos crea un destinatario, que es un objeto con nombre que representa un usuario o grupo de usuarios con los que el proveedor de datos desea compartir datos.
Cuando el proveedor de datos crea el destinatario, Azure Databricks genera un token, un archivo de credenciales que incluye el token y un vínculo de activación que el proveedor de datos puede enviar al destinatario para acceder al archivo de credenciales.
Para obtener más información, consulte Paso 1: creación del destinatario.
El proveedor de datos crea un recurso compartido, que es un objeto con nombre que contiene una colección de tablas registradas en un metastore de Unity Catalog en la cuenta del proveedor.
Para obtener más información, consulte el artículo sobre cómo crear y administrar recursos compartidos para Delta Sharing.
El proveedor de datos concede al destinatario acceso al recurso compartido.
Para obtener más información, consulte Administración del acceso a los datos compartidos de Delta Sharing (para proveedores).
El proveedor de datos envía el vínculo de activación al destinatario a través de un canal seguro, junto con instrucciones sobre cómo usar el vínculo de activación para descargar el archivo de credenciales que el destinatario usará para establecer una conexión segura con el proveedor de datos a fin de recibir los datos compartidos.
Para obtener más información, consulte Paso 2: obtención del vínculo de activación.
El destinatario de datos sigue el vínculo de activación para descargar el archivo de credenciales y, a continuación, lo usa para acceder a los datos compartidos.
Los datos compartidos están disponibles para solo lectura. Los usuarios pueden acceder a los datos mediante la plataforma o las herramientas que prefieran.
Para obtener más información, consulte Lectura de datos compartidos mediante el uso compartido abierto de Delta Sharing (para destinatarios).
Consideraciones de configuración y seguridad para el uso compartido abierto
Una buena administración de tokens es clave a la hora de compartir datos de forma segura cuando se usa el modelo de uso compartido abierto:
- Los proveedores de datos que tengan previsto usar el uso compartido abierto deben configurar la duración predeterminada del token de destinatario cuando habiliten Delta Sharing para su metastore de Unity Catalog. Databricks recomienda configurar tokens para que expiren. Consulte Habilitación de Delta Sharing en un metastore.
- Si necesita modificar la duración predeterminada del token, consulte la sección sobre cómo modificar la duración del token de destinatario.
- Anime a los destinatarios a administrar su archivo de credenciales descargado de forma segura.
- Para obtener más información sobre la administración de tokens y la seguridad del uso compartido abierto, consulte la sección sobre cómo administrar tokens de destinatario (uso compartido abierto).
Los proveedores de datos pueden proporcionar seguridad adicional mediante la asignación de listas de acceso de IP para restringir el acceso de los destinatarios a ubicaciones de red específicas. Consulte Restringir el acceso de destinatarios a Delta Sharing mediante listas de acceso IP (uso compartido abierto).