Compartir a través de


Interoperabilidad del formato de tabla Delta Lake

En Microsoft Fabric, el formato de tabla delta Lake es el estándar para el análisis. Delta Lake es una capa de almacenamiento de código abierto que aporta transacciones ACID (atomicidad, coherencia, aislamiento, durabilidad) a cargas de trabajo de macrodatos y análisis.

Todas las experiencias de Fabric generan y consumen tablas de Delta Lake de forma nativa, lo que proporciona una experiencia de producto unificada. Las tablas de Delta Lake generadas por un motor de proceso, como Fabric Data Warehouse o Synapse Spark, pueden consumirse en cualquier otro motor, como Power BI. Al ingerir datos en Fabric, Fabric lo almacena como tablas delta de forma predeterminada. Puede integrar fácilmente datos externos que contienen tablas de Delta Lake mediante accesos directos de OneLake.

Características de Delta Lake y experiencias de Fabric

Para lograr la interoperabilidad, todas las experiencias de Fabric se alinean en las características de Delta Lake y las funcionalidades de Fabric. Algunas experiencias solo pueden escribir en tablas de Delta Lake, mientras que otras pueden leerlas.

  • Escritores: almacenamientos de datos, secuencias de eventos y modelos semánticos de Power BI exportados a OneLake
  • Lectores: punto de conexión de análisis SQL y modelos semánticos de Direct Lake de Power BI
  • Escritores y lectores: Entorno de ejecución de Fabric Spark, flujos de datos, canalizaciones de datos y bases de datos del Lenguaje de Consulta Kusto (KQL)

En la matriz siguiente se muestran las características clave de Delta Lake y su disponibilidad en cada experiencia de Fabric.

Funcionalidad de Fabric Asignaciones de columnas Vectores de eliminación Escritura de V-Order Optimización y mantenimiento de tablas Particiones Agrupación en clústeres líquidos TIMESTAMP_NTZ Versión del lector/escritor delta y características predeterminadas de la tabla
Exportación de Delta Lake en un almacenamiento de datos Nombre: Sí
Id. : No
Lectura: N/A (no aplicable)
Escritura: No
No No Lector: 3
Escritor: 7
Vectores de eliminación,
Asignaciones de columnas (nombre)
Punto de conexión de análisis SQL Nombre: Sí
Id. : No
N/A (no aplicable) N/A (no aplicable) Lectura: Sí
Escritura: N/A (no aplicable)
No N/A (no aplicable)
Explorador y versión preliminar de Lakehouse Nombre: Sí
Id. : No
N/A (no aplicable) Lectura: Sí
Escribe: N/A (no aplicable)
N/A (no aplicable)
Fabric Spark Runtime 1.3 Nombre: Sí
Identificador: Sí
Lectura: Sí
Escribir: Sí
Lector: 1
Escritor: 2
Fabric Spark Runtime 1.2 Nombre: Sí
Identificador: Sí
Lectura: Sí
Escribe: Sí
Sí, solo de lectura Lector: 1
Escritor: 2
Fabric Spark Runtime 1.1 Nombre: Sí
Identificador: Sí
No Lectura: Sí
Escritura: Sí
Sí, solo de lectura No Lector: 1
Escritor: 2
Flujos de datos Gen2 Nombre: Sí
Id. : No
No Lectura: Sí
Escribir: Sí
Sí, solo de lectura No Lector: 1
Escritor: 2
Tuberías de datos Nombre: No
Id. : No
No No Lectura: Sí
Escritura: Sí, sobrescribir solo
Sí, solo de lectura No Lector: 1
Escritor: 2
Modelos semánticos de Direct Lake en Power BI Nombre: Sí
Id. : No
N/A (no aplicable) N/A (no aplicable) Lectura: Sí
Escritura: N/A (no aplicable)
No N/A (no aplicable)
Exportación de modelos semánticos de Power BI a OneLake Nombre: Sí
Id. : No
N/A (no aplicable) No Lectura: N/A (no aplicable)
Escritura: No
No No Lector: 2
Escritor: 5
Asignaciones de columnas (nombre)
Bases de datos KQL Nombre: Sí
Id. : No
No No* Lectura: Sí
Escribe: Sí
No No Lector: 1
Escritor: 1
Secuencias de eventos Nombre: No
Id. : No
No No No Lectura: N/A (no aplicable)
Escribir: Sí
No No Lector: 1
Escritor: 2

Las bases de datos KQL * proporcionan ciertas funcionalidades de mantenimiento de tablas, como la de retención. Los datos se eliminan al concluir el periodo de retención en OneLake. Para más información, vea Una copia lógica.

Nota

  • Fabric no escribe asignaciones de columnas de forma predeterminada, excepto donde se indique. La experiencia predeterminada de Fabric genera tablas compatibles con el servicio. Las tablas de Delta Lake producidas por servicios de terceros pueden tener características de tabla incompatibles.
  • Algunas experiencias de Fabric no ofrecen funcionalidades de optimización y mantenimiento de tablas, como la compactación de bins, la ordenación V, la combinación de vectores de eliminación (PURGE) y la limpieza de archivos antiguos sin referencia (VACUUM). Las tablas ingeridas mediante esas experiencias usan las técnicas descritas en Uso de la característica de mantenimiento de tablas para administrar tablas Delta en Fabric para mantener las tablas de Delta Lake en condiciones óptimas para el análisis.

Limitaciones actuales

Actualmente, Fabric no admite estas características de Delta Lake:

  • Los puntos de control V2 no están disponibles uniformemente en todas las experiencias. Solo los cuadernos de Spark y los trabajos de Spark pueden leer y escribir en tablas con puntos de control V2. Lakehouse y SQL Analytics no enumeran correctamente las tablas que contienen archivos de punto de control V2 en la __delta_log carpeta .
  • Delta Lake 3.x UniForm. Esta característica solo es compatible con el Spark-compute de Ingeniería de Datos (Cuadernos, Tareas de Spark).
  • Escritura de columnas de identidad (característica propietaria de Databricks)
  • Delta Live Tables (característica propietaria de Databricks)
  • Características de Delta Lake 4.x: expansión de tipos, intercalaciones, tipo variante, confirmaciones coordinadas.

Caracteres especiales en nombres de tabla

Microsoft Fabric admite caracteres especiales como parte de los nombres de tabla. Esta característica permite el uso de caracteres unicode para crear nombres de tabla en experiencias de Microsoft Fabric.

Los siguientes caracteres especiales son reservados y no son compatibles con al menos una de las tecnologías de Microsoft Fabric y no deben usarse como parte de un nombre de tabla: " (comillas dobles), ' (comillas simples), #, %, +, :, ?, ` (acento grave).