Lectura de datos compartidos mediante el uso compartido abierto de Delta Sharing con tokens de portador (para destinatarios): Azure Databricks

2025-04-15

En esta página se describe cómo leer los datos compartidos con usted mediante el protocolo delta sharing open sharing con tokens de portador. Incluye instrucciones para leer datos compartidos mediante las siguientes herramientas:

Databricks
Apache Spark
Pandas
Power BI
Cuadro

En este modelo de uso compartido abierto, se usa un archivo de credenciales, compartido con un miembro del equipo por el proveedor de datos, para obtener acceso de lectura seguro a los datos compartidos. El acceso persiste siempre y cuando las credenciales sean válidas y el proveedor siga compartiendo los datos. Los proveedores administran la expiración y la rotación de credenciales. Las actualizaciones de los datos están disponibles casi en tiempo real. Puede leer y realizar copias de los datos compartidos, pero no puede modificar los datos de origen.

Nota

Si los datos se han compartido con usted mediante Databricks-to-Databricks Delta Sharing, no necesita un archivo de credenciales para acceder a los datos y este artículo no se aplica a usted. Para obtener instrucciones, consulte Lectura de datos compartidos usando Delta Sharing de Databricks a Databricks (para destinatarios).

En las secciones siguientes se describe cómo usar Azure Databricks, Apache Spark, pandas y Power BI para acceder a datos compartidos y leerlos mediante el archivo de credenciales. Para obtener una lista completa de los conectores de Delta Sharing e información sobre cómo usarlos, consulte la documentación de orígenes abiertos de Delta Sharing. Si tiene problemas para acceder a los datos compartidos, póngase en contacto con el proveedor de datos.

Antes de empezar

Un miembro de su equipo debe descargar el archivo de credenciales compartido por el proveedor de datos. Consulte Obtener acceso en el modelo de uso compartido abierto.

Deberían usar un canal seguro para compartir ese archivo o su ubicación con usted.

En esta sección se describe cómo importar un proveedor y cómo consultar los datos compartidos en el Explorador de catálogos o en un cuaderno de Python:

Si el área de trabajo de Azure Databricks está habilitada para el catálogo de Unity, use la interfaz de usuario del proveedor de importación en el Explorador de catálogos. Puede hacer lo siguiente sin necesidad de almacenar o especificar un archivo de credenciales:
- Cree catálogos a partir de recursos compartidos con el clic de un botón.
- Use los controles de acceso del catálogo de Unity para conceder acceso a las tablas compartidas.
- Consulta de datos compartidos mediante la sintaxis estándar del Catálogo de Unity.
Si el área de trabajo de Azure Databricks no está habilitada para el catálogo de Unity, use las instrucciones del cuaderno de Python como ejemplo.

Explorador de catálogos

Permisos necesarios: un administrador de metastore o un usuario que tenga los privilegios CREATE PROVIDER y USE PROVIDER para el metastore de Unity Catalog.

En el área de trabajo de Azure Databricks, haga clic en Catálogo para abrir el Explorador de catálogos.
En la parte superior del panel Catálogo, haga clic en el y seleccione Delta Sharing.

Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.
En la pestaña Compartido conmigo, haga clic en Importar datos.
Escriba el nombre del proveedor.

El nombre no puede incluir espacios.
Cargue el archivo de credenciales que el proveedor ha compartido con usted.

Muchos proveedores tienen sus propias redes de delta Sharing de las que puede recibir recursos compartidos. Para obtener más información, consulte Configuraciones específicas del proveedor.
(Opcional) Escriba un comentario.
Haga clic en Import.
Cree catálogos a partir de los datos compartidos.

En la pestaña Recursos compartidos, haga clic en Crear catálogo en la fila de recursos compartidos.

Para obtener información sobre el uso de SQL o la CLI de Databricks para crear un catálogo a partir de un recurso compartido, consulte Creación de un catálogo a partir de un recurso compartido.
Conceda acceso a los catálogos.

Consulte ¿Cómo puedo hacer que los datos compartidos estén disponibles para mi equipo? y Administración de permisos para los esquemas, tablas y volúmenes de un catálogo Delta sharing.
Lea los objetos de datos compartidos como haría con cualquier objeto de datos registrado en el Catálogo de Unity.

Para obtener más información y ejemplos, consulte Datos de Access en una tabla o volumen compartidos.

Pitón

Esta sección describe cómo usar un conector de uso compartido abierto para acceder a datos compartidos usando un cuaderno en su área de trabajo de Azure Databricks. Usted u otro miembro del equipo almacenan el archivo de credenciales en Azure Databricks y, a continuación, lo usa para autenticarse en la cuenta de Azure Databricks del proveedor de datos y leer los datos que el proveedor de datos ha compartido con usted.

Nota

En estas instrucciones se supone que el área de trabajo de Azure Databricks no está habilitada para el catálogo de Unity. Si usa Unity Catalog, no es necesario que apunte al archivo de credenciales al leer desde el recurso compartido. Puede leer desde tablas compartidas como lo hace desde cualquier tabla registrada en el catálogo de Unity. Databricks recomienda usar la interfaz de usuario del proveedor de importación en el Explorador de catálogos en lugar de las instrucciones que se proporcionan aquí.

En primer lugar, use un cuaderno de Python en Azure Databricks para almacenar el archivo de credenciales para que los usuarios del equipo puedan acceder a los datos compartidos.

En un editor de texto, abra el archivo de credenciales.
En el área de trabajo de Azure Databricks, haga clic en Nuevo > Cuaderno.
- Escriba un nombre.
- Establezca el idioma predeterminado del cuaderno en Python.
- Seleccione un clúster para adjuntarlo al cuaderno.
- Haga clic en Crear.
El cuaderno se abre en el editor de cuadernos.
Para usar Python o Pandas para acceder a los datos compartidos, instale el conector de Python de Delta Sharing. En el editor de cuadernos, pegue el siguiente comando:
```
%sh pip install delta-sharing
```
Ejecute la celda.

La delta-sharing biblioteca de Python se instala en el clúster si aún no está instalada.
En una nueva celda, pegue el siguiente comando, que carga el contenido del archivo de credenciales en una carpeta de DBFS.

Reemplace las variables como se muestra a continuación:
- <dbfs-path>: ruta de acceso a la carpeta donde desea guardar el archivo de credenciales
- <credential-file-contents>: el contenido del archivo de credenciales. No se trata de una ruta de acceso al archivo, sino del contenido copiado del mismo.
  
  El archivo de credenciales contiene JSON, que define tres campos: shareCredentialsVersion, endpoint y bearerToken.
```
%scala
dbutils.fs.put("<dbfs-path>/config.share","""
<credential-file-contents>
""")
```
Ejecute la celda.

Una vez cargado el archivo de credenciales, puede eliminar esta celda. Todos los usuarios del área de trabajo pueden leer el archivo de credenciales de DBFS, y dicho archivo está disponible en DBFS en todos los clústeres y almacenes de SQL de su área de trabajo. Para eliminar la celda, haga clic en x en el menú acciones de celda en el extremo derecho.

Ahora que se almacena el archivo de credenciales, puede usar un cuaderno para enumerar y leer tablas compartidas.

Con Python, enumere las tablas del recurso compartido.

En una nueva celda, pegue el siguiente comando. Reemplaza <dbfs-path> por la ruta que se creó anteriormente.

Cuando se ejecute el código, Python leerá el archivo de credenciales de DBFS en el clúster. Acceda a los datos almacenados en DBFS en la ruta de acceso /dbfs/.
```
import delta_sharing

client = delta_sharing.SharingClient(f"/dbfs/<dbfs-path>/config.share")

client.list_all_tables()
```
Ejecute la celda.

El resultado es una matriz de tablas, junto con metadatos para cada tabla. En la salida siguiente se muestran dos tablas:
```
Out[10]: [Table(name='example_table', share='example_share_0', schema='default'), Table(name='other_example_table', share='example_share_0', schema='default')]
```
Si la salida está vacía o no contiene las tablas que espera, póngase en contacto con el proveedor de datos.
Consulta de una tabla compartida.
- Usando Scala:
  
  En una nueva celda, pegue el siguiente comando. Cuando se ejecuta el código, el archivo de credenciales se lee de DBFS a través de JVM.
  
  Reemplace las variables como se muestra a continuación:
  - <profile-path>: ruta de acceso de DBFS del archivo de credenciales. Por ejemplo, /<dbfs-path>/config.share.
  - <share-name>: valor de share= para la tabla.
  - <schema-name>: valor de schema= para la tabla.
  - <table-name>: valor de name= para la tabla.
```
%scala
    spark.read.format("deltaSharing")
    .load("<profile-path>#<share-name>.<schema-name>.<table-name>").limit(10);
```
  Ejecute la celda. Cada vez que cargue la tabla compartida, verá datos nuevos del origen.
- Usando SQL:
  
  Para consultar los datos mediante SQL, cree una tabla local en el área de trabajo a partir de la tabla compartida y, después, consulte la tabla local. Los datos compartidos no se guardan ni almacenan en caché en la tabla local. Cada vez que se consulta la tabla local, se ve el estado actual de los datos compartidos.
  
  En una nueva celda, pegue el siguiente comando.
  
  Reemplace las variables como se muestra a continuación:
  - <local-table-name>: nombre de la tabla local.
  - <profile-path>: ubicación del archivo de credenciales.
  - <share-name>: valor de share= para la tabla.
  - <schema-name>: valor de schema= para la tabla.
  - <table-name>: valor de name= para la tabla.
```
%sql
DROP TABLE IF EXISTS table_name;

CREATE TABLE <local-table-name> USING deltaSharing LOCATION "<profile-path>#<share-name>.<schema-name>.<table-name>";

SELECT * FROM <local-table-name> LIMIT 10;
```
  Al ejecutar el comando, los datos compartidos se consultan directamente. Como prueba, se consulta la tabla y se devuelven los diez primeros resultados.
Si la salida está vacía o no contiene los datos esperados, póngase en contacto con el proveedor de datos.

Apache Spark: Lectura de datos compartidos

Siga estos pasos para acceder a los datos compartidos usando Spark 3.x o superior.

En estas instrucciones se supone que tiene acceso al archivo de credenciales compartido por el proveedor de datos. Consulte Obtener acceso en el modelo de uso compartido abierto.

Nota

Si usa Spark en un área de trabajo de Azure Databricks habilitada para el catálogo de Unity y ha usado la interfaz de usuario del proveedor de importación para importar el proveedor y compartir, las instrucciones de esta sección no se aplican a usted. Puede acceder a tablas compartidas igual que haría con cualquier otra tabla registrada en el catálogo de Unity. No es necesario instalar el conector de delta-sharing Python ni proporcionar la ruta de acceso al archivo de credenciales. Consulte Azure Databricks: Lectura de datos compartidos mediante conectores de uso compartido abierto.

Para acceder a los metadatos relacionados con los datos compartidos, como la lista de tablas compartidas con usted, haga lo siguiente. Este ejemplo utiliza Python.

Instale el conector de Python delta-sharing:
```
pip install delta-sharing
```
Instale el conector de Apache Spark.

Enumeración de tablas compartidas mediante Spark

Enumera las tablas del recurso compartido. En el ejemplo siguiente, reemplace <profile-path> por la ubicación del archivo de credenciales.

import delta_sharing

client = delta_sharing.SharingClient(f"<profile-path>/config.share")

client.list_all_tables()

El resultado es una matriz de tablas, junto con metadatos para cada tabla. En la salida siguiente se muestran dos tablas:

Out[10]: [Table(name='example_table', share='example_share_0', schema='default'), Table(name='other_example_table', share='example_share_0', schema='default')]

Si la salida está vacía o no contiene las tablas que espera, póngase en contacto con el proveedor de datos.

Acceso a datos compartidos mediante Spark

Ejecute lo siguiente, sustituyendo estas variables:

<profile-path>: ubicación del archivo de credenciales.
<share-name>: valor de share= para la tabla.
<schema-name>: valor de schema= para la tabla.
<table-name>: valor de name= para la tabla.
<version-as-of>: opcional. Versión de la tabla para cargar los datos. Solo funciona si el proveedor de datos comparte el historial de la tabla. Requiere delta-sharing-spark 0.5.0 o superior.
<timestamp-as-of>: opcional. Cargue los datos en la versión anterior o en la marca de tiempo especificada. Solo funciona si el proveedor de datos comparte el historial de la tabla. Requiere delta-sharing-spark 0.6.0 o superior.

Pitón

delta_sharing.load_as_spark(f"<profile-path>#<share-name>.<schema-name>.<table-name>", version=<version-as-of>)

spark.read.format("deltaSharing")\
.option("versionAsOf", <version-as-of>)\
.load("<profile-path>#<share-name>.<schema-name>.<table-name>")\
.limit(10))

delta_sharing.load_as_spark(f"<profile-path>#<share-name>.<schema-name>.<table-name>", timestamp=<timestamp-as-of>)

spark.read.format("deltaSharing")\
.option("timestampAsOf", <timestamp-as-of>)\
.load("<profile-path>#<share-name>.<schema-name>.<table-name>")\
.limit(10))

Scala

Ejecute lo siguiente, sustituyendo estas variables:

<profile-path>: ubicación del archivo de credenciales.
<share-name>: valor de share= para la tabla.
<schema-name>: valor de schema= para la tabla.
<table-name>: valor de name= para la tabla.
<version-as-of>: opcional. Versión de la tabla para cargar los datos. Solo funciona si el proveedor de datos comparte el historial de la tabla. Requiere delta-sharing-spark 0.5.0 o superior.
<timestamp-as-of>: opcional. Cargue los datos en la versión anterior o en la marca de tiempo especificada. Solo funciona si el proveedor de datos comparte el historial de la tabla. Requiere delta-sharing-spark 0.6.0 o superior.

spark.read.format("deltaSharing")
.option("versionAsOf", <version-as-of>)
.load("<profile-path>#<share-name>.<schema-name>.<table-name>")
.limit(10)

spark.read.format("deltaSharing")
.option("timestampAsOf", <version-as-of>)
.load("<profile-path>#<share-name>.<schema-name>.<table-name>")
.limit(10)

Acceso a una fuente de distribución de datos de cambios compartida mediante Spark

Si el historial de tablas se ha compartido con usted y la fuente de distribución de datos modificados (CDF) está habilitada en la tabla de origen, puede acceder a la fuente de distribución de datos modificados ejecutando lo siguiente, reemplazando estas variables. Requiere delta-sharing-spark 0.5.0 o superior.

Se debe proporcionar uno y solo un parámetro de inicio.

<profile-path>: ubicación del archivo de credenciales.
<share-name>: valor de share= para la tabla.
<schema-name>: valor de schema= para la tabla.
<table-name>: valor de name= para la tabla.
<starting-version>: opcional. Versión inicial de la consulta, inclusiva. Especifíquelo como Long.
<ending-version>: opcional. Versión final de la consulta, inclusiva. Si no se proporciona la versión final, la API usa la versión de tabla más reciente.
<starting-timestamp>: opcional. La marca de tiempo inicial de la consulta, se convierte en una versión creada mayor o igual que esta marca de tiempo. Especifíquelo como una cadena con el formato yyyy-mm-dd hh:mm:ss[.fffffffff].
<ending-timestamp>: opcional. La marca de tiempo final de la consulta, esta se convierte en una versión creada inferior o igual a esta marca de tiempo. Especifíquelo como una cadena con el formato yyyy-mm-dd hh:mm:ss[.fffffffff].

Pitón

delta_sharing.load_table_changes_as_spark(f"<profile-path>#<share-name>.<schema-name>.<table-name>",
  starting_version=<starting-version>,
  ending_version=<ending-version>)

delta_sharing.load_table_changes_as_spark(f"<profile-path>#<share-name>.<schema-name>.<table-name>",
  starting_timestamp=<starting-timestamp>,
  ending_timestamp=<ending-timestamp>)

spark.read.format("deltaSharing").option("readChangeFeed", "true")\
.option("statingVersion", <starting-version>)\
.option("endingVersion", <ending-version>)\
.load("<profile-path>#<share-name>.<schema-name>.<table-name>")

spark.read.format("deltaSharing").option("readChangeFeed", "true")\
.option("startingTimestamp", <starting-timestamp>)\
.option("endingTimestamp", <ending-timestamp>)\
.load("<profile-path>#<share-name>.<schema-name>.<table-name>")

Scala

spark.read.format("deltaSharing").option("readChangeFeed", "true")
.option("statingVersion", <starting-version>)
.option("endingVersion", <ending-version>)
.load("<profile-path>#<share-name>.<schema-name>.<table-name>")

spark.read.format("deltaSharing").option("readChangeFeed", "true")
.option("startingTimestamp", <starting-timestamp>)
.option("endingTimestamp", <ending-timestamp>)
.load("<profile-path>#<share-name>.<schema-name>.<table-name>")

Si la salida está vacía o no contiene los datos esperados, póngase en contacto con el proveedor de datos.

Acceso a una tabla compartida mediante Spark Structured Streaming

Si el historial de tablas se comparte con usted, puede transmitir los datos compartidos. Requiere delta-sharing-spark 0.6.0 o superior.

Opciones admitidas:

ignoreDeletes: omitir las transacciones que eliminan los datos.
ignoreChanges: volver a procesar las actualizaciones si los archivos se volvieron a escribir en la tabla de origen debido a una operación de cambio de datos como UPDATE, MERGE INTO, DELETE (dentro de las particiones) o OVERWRITE. Todavía se pueden emitir filas sin cambios. Por tanto, los consumidores de nivel inferior deben ser capaces de controlar los duplicados. Las eliminaciones no se propagan de bajada. ignoreChanges engloba ignoreDeletes. Por lo tanto, si usa ignoreChanges, el flujo no se interrumpirá mediante eliminaciones o actualizaciones de la tabla de origen.
startingVersion: la versión de la tabla compartida desde la que se va a iniciar. El origen de streaming leerá todos los cambios de tabla a partir de esta versión (inclusive).
startingTimestamp: marca de tiempo desde la que empezar. El origen de streaming leerá todos los cambios de tabla confirmados en o después de la marca de tiempo (inclusive). Ejemplo: "2023-01-01 00:00:00.0".
maxFilesPerTrigger: el número de archivos nuevos por considerar en cada microlote.
maxBytesPerTrigger: la cantidad de datos que se procesan en cada microlote. Esta opción establece un “máximo temporal”, lo que significa que un lote procesa aproximadamente esta cantidad de datos y puede procesar más que el límite para que la consulta de streaming avance en los casos en los que la unidad de entrada más pequeña sea mayor que este límite.
readChangeFeed: se lee por streaming la fuente de datos modificados de la tabla compartida.

Opciones no admitidas:

Trigger.availableNow

Ejemplos de consultas de Structured Streaming

Scala

spark.readStream.format("deltaSharing")
.option("startingVersion", 0)
.option("ignoreChanges", true)
.option("maxFilesPerTrigger", 10)
.load("<profile-path>#<share-name>.<schema-name>.<table-name>")

Pitón

spark.readStream.format("deltaSharing")\
.option("startingVersion", 0)\
.option("ignoreDeletes", true)\
.option("maxBytesPerTrigger", 10000)\
.load("<profile-path>#<share-name>.<schema-name>.<table-name>")

Consulte también conceptos de Structured Streaming.

Lectura de tablas con vectores de eliminación o asignación de columnas habilitada

Importante

Esta característica está en versión preliminar pública.

Los vectores de eliminación son una característica de optimización de almacenamiento que el proveedor puede habilitar en tablas Delta compartidas. Consulte ¿Qué son los vectores de eliminación?.

Azure Databricks también admite la asignación de columnas para tablas Delta. Consulte Cambiar nombre y quitar columnas con la asignación de columnas de Delta Lake.

Si el proveedor ha compartido una tabla con vectores de eliminación o asignación de columna habilitada, puede leer la tabla mediante el proceso que ejecuta delta-sharing-spark 3.1 o superior. Si usa clústeres de Databricks, puede realizar lecturas por lotes mediante un clúster que ejecute Databricks Runtime 14.1 o superior. Las consultas de CDF y streaming requieren Databricks Runtime 14.2 o superior.

Puede realizar consultas por lotes tal como están, ya que pueden resolver automáticamente responseFormat en función de las características de tabla de la tabla compartida.

Para leer una fuente de distribución de datos modificado (CDF) o para realizar consultas de streaming en tablas compartidas con vectores de eliminación o asignación de columnas habilitadas, debe establecer la opción adicional responseFormat=delta.

En los siguientes ejemplos se muestran consultas por lotes, CDF y streaming:

import org.apache.spark.sql.SparkSession

val spark = SparkSession
        .builder()
        .appName("...")
        .master("...")
        .config("spark.sql.extensions", "io.delta.sql.DeltaSparkSessionExtension")
        .config("spark.sql.catalog.spark_catalog", "org.apache.spark.sql.delta.catalog.DeltaCatalog")
        .getOrCreate()

val tablePath = "<profile-file-path>#<share-name>.<schema-name>.<table-name>"

// Batch query
spark.read.format("deltaSharing").load(tablePath)

// CDF query
spark.read.format("deltaSharing")
  .option("readChangeFeed", "true")
  .option("responseFormat", "delta")
  .option("startingVersion", 1)
  .load(tablePath)

// Streaming query
spark.readStream.format("deltaSharing").option("responseFormat", "delta").load(tablePath)

Pandas: lectura de datos compartidos

Siga estos pasos para acceder a los datos compartidos en Pandas 0.25.3 o posterior.

En estas instrucciones se supone que tiene acceso al archivo de credenciales compartido por el proveedor de datos. Consulte Obtener acceso en el modelo de uso compartido abierto.

Nota

Si usa pandas en un área de trabajo de Azure Databricks habilitada para el catálogo de Unity y ha usado la interfaz de usuario del proveedor de importación para importar el proveedor y compartir, las instrucciones de esta sección no se aplican a usted. Puede acceder a tablas compartidas igual que haría con cualquier otra tabla registrada en el catálogo de Unity. No es necesario instalar el conector de delta-sharing Python ni proporcionar la ruta de acceso al archivo de credenciales. Consulte Azure Databricks: Lectura de datos compartidos mediante conectores de uso compartido abierto.

Para acceder a los metadatos relacionados con los datos compartidos, como la lista de tablas compartidas con usted, debe instalar el conector delta-sharing de Python.

pip install delta-sharing

Enumeración de tablas compartidas mediante pandas

Para enumerar las tablas del recurso compartido, ejecute lo siguiente, sustituyendo <profile-path>/config.share por la ubicación del archivo de credenciales.

import delta_sharing

client = delta_sharing.SharingClient(f"<profile-path>/config.share")

client.list_all_tables()

Si la salida está vacía o no contiene las tablas que espera, póngase en contacto con el proveedor de datos.

Acceso a datos compartidos mediante pandas

Para acceder a los datos compartidos en pandas usando Python, ejecute lo siguiente, reemplazando las variables como se indica a continuación:

<profile-path>: ubicación del archivo de credenciales.
<share-name>: valor de share= para la tabla.
<schema-name>: valor de schema= para la tabla.
<table-name>: valor de name= para la tabla.

import delta_sharing
delta_sharing.load_as_pandas(f"<profile-path>#<share-name>.<schema-name>.<table-name>")

Acceso a una fuente de distribución de datos de cambios compartida mediante pandas

Para acceder a la fuente de distribución de datos de una tabla compartida en pandas usando Python ejecute lo siguiente, reemplazando las variables como se indica a continuación. Es posible que la fuente de distribución de datos de cambios no esté disponible, dependiendo de si el proveedor de datos compartió o no la fuente de distribución de datos de cambios para la tabla.

<starting-version>: opcional. Versión inicial de la consulta, inclusiva.
<ending-version>: opcional. Versión final de la consulta, inclusiva.
<starting-timestamp>: opcional. Marca de tiempo inicial de la consulta. Se convierte en una versión creada mayor o igual que esta marca de tiempo.
<ending-timestamp>: opcional. Marca de tiempo final de la consulta. Se convierte en una versión creada inferior o igual que esta marca de tiempo.

import delta_sharing
delta_sharing.load_table_changes_as_pandas(
  f"<profile-path>#<share-name>.<schema-name>.<table-name>",
  starting_version=<starting-version>,
  ending_version=<starting-version>)

delta_sharing.load_table_changes_as_pandas(
  f"<profile-path>#<share-name>.<schema-name>.<table-name>",
  starting_timestamp=<starting-timestamp>,
  ending_timestamp=<ending-timestamp>)

Si la salida está vacía o no contiene los datos esperados, póngase en contacto con el proveedor de datos.

Power BI: leer datos compartidos

|El conector de Delta Sharing de Power BI le permite descubrir, analizar y visualizar conjuntos de datos compartidos con usted a través del protocolo abierto de Delta Sharing.

Requisitos

Power BI Desktop 2.99.621.0 o superior.
Acceso al archivo de credenciales compartido por el proveedor de datos. Consulte Obtener acceso en el modelo de uso compartido abierto.

Conexión a Databricks

Para conectarse a Azure Databricks usando el conector de Delta Sharing, haga lo siguiente:

Abra el archivo de credenciales compartido con un editor de texto para recuperar la URL del punto de conexión y el token.
Abra Power BI Desktop.
En el menú Obtener datos, busque Delta Sharing.
Seleccione el conector y haga clic en Conectar.
Escriba la dirección URL del punto de conexión que copió del archivo de credenciales en el campo Delta Sharing Server URL (Dirección URL de Delta Sharing).
Opcionalmente, en la pestaña Opciones avanzadas, establezca un límite de filas para el número máximo de filas que puede descargar. De forma predeterminada, se establece en 1 millón de filas.
Haga clic en OK.
En Autenticación, copie el token que recuperó del archivo de credenciales en Token de portador.
Haga clic en Conectar.

El conector de Delta Sharing de Power BI tiene las siguientes limitaciones:

Los datos que carga el conector deben ajustarse a la memoria de la máquina. Para administrar este requisito, el conector limita el número de filas importadas al límite de filas que estableció en la pestaña Opciones avanzadas de Power BI Desktop.

Tableau: leer datos compartidos

El conector Delta Sharing de Tableau le permite descubrir, analizar y visualizar conjuntos de datos que se comparten con usted a través del protocolo abierto Delta Sharing.

Requisitos

Tableau Desktop y Tableau Server 2024.1 o superior
Acceso al archivo de credenciales compartido por el proveedor de datos. Consulte Obtener acceso en el modelo de uso compartido abierto.

Conexión a Azure Databricks

Para conectarse a Azure Databricks usando el conector de Delta Sharing, haga lo siguiente:

Vaya a Tableau Exchange, siga las instrucciones para descargar el Conector de Delta Sharing y colóquelo en una carpeta apropiada del escritorio.
Abra Tableau Desktop.
En la página Conectores, busca "Delta Sharing por Databricks".
Seleccione Cargar archivo compartido y elija el archivo de credenciales compartido por el proveedor.
Haga clic en Obtener datos.
En el Explorador de datos, seleccione la tabla.
Opcionalmente, agregue filtros SQL o límites de fila.
Haga clic en Obtener datos de tabla.

Tableau Delta Sharing Connector tiene las siguientes limitaciones:

Los datos que carga el conector deben ajustarse a la memoria de la máquina. Para administrar este requisito, el conector limita el número de filas importadas al límite de filas establecido en Tableau.
Todas las columnas se devuelven como tipo String.
El filtro SQL solo funciona si el servidor Delta Sharing admite predicateHint.
No se admiten vectores de eliminación.

Solicitud de credenciales nuevas

Si la dirección URL de activación de credenciales o las credenciales descargadas se pierden, dañan o ponen en peligro, o sus credenciales expiran sin que el proveedor le envíe unas nuevas, póngase en contacto con el proveedor para solicitar credenciales nuevas.

Compartir a través de

Lectura de datos compartidos mediante el uso compartido abierto de Delta Sharing con tokens de portador (para destinatarios)

Antes de empezar

Azure Databricks: lectura de datos compartidos mediante conectores de uso compartido abierto

Explorador de catálogos

Pitón

Apache Spark: Lectura de datos compartidos

Instalación de los conectores de Python y Spark de Delta Sharing

Enumeración de tablas compartidas mediante Spark

Acceso a datos compartidos mediante Spark

Pitón

Scala

Acceso a una fuente de distribución de datos de cambios compartida mediante Spark

Pitón

Scala

Acceso a una tabla compartida mediante Spark Structured Streaming

Ejemplos de consultas de Structured Streaming

Scala

Pitón

Lectura de tablas con vectores de eliminación o asignación de columnas habilitada

Pandas: lectura de datos compartidos

Instale el conector de Python de Delta Sharing

Enumeración de tablas compartidas mediante pandas

Acceso a datos compartidos mediante pandas

Acceso a una fuente de distribución de datos de cambios compartida mediante pandas

Power BI: leer datos compartidos

Requisitos

Conexión a Databricks

Limitaciones del conector de Delta Sharing de Power BI

Tableau: leer datos compartidos

Requisitos

Conexión a Azure Databricks

Limitaciones del conector Tableau Delta Sharing

Solicitud de credenciales nuevas

Comentarios

Recursos adicionales