Compartir vía


Disponibilidad de Eventhouse OneLake

Puede crear una copia lógica de los datos de la base de datos KQL en una instancia de Eventhouse mediante la activación de la disponibilidad en OneLake. La activación de la disponibilidad de OneLake significa que puede consultar los datos en su base de datos KQL en formato Delta Lake mediante otros motores de Fabric, como el modo Direct Lake en Power BI, Warehouse, Lakehouse, Notebooks, etc.

Delta Lake es un formato unificado de tabla de lago de datos que proporciona un acceso sin problemas a los datos en todos los motores de proceso de Microsoft Fabric. Para obtener más información sobre Delta Lake, consulte ¿Qué es Delta Lake?

En este artículo, aprenderá a habilitar la disponibilidad de los datos de la base de datos KQL en OneLake.

Funcionamiento

En la tabla siguiente se describe el comportamiento de sus tablas y su base de datos KQL al activar o desactivar la disponibilidad de OneLake.

Activado Desactivado
Base de datos KQL - Las tablas existentes no se ven afectadas. Las nuevas tablas están disponibles en OneLake.
- La Directiva de retención de datos de la base de datos KQL también se aplica a los datos de OneLake. Los datos eliminados de la base de datos de KQL al final del período de retención también se quitan de OneLake.
- Las tablas existentes no se ven afectadas. Las nuevas tablas no estarán disponibles en OneLake.
Una tabla en la base de datos KQL - Los nuevos datos están disponibles en OneLake.
- Los datos existentes no se revierten.
- Los datos no se pueden eliminar, truncar ni purgar.
- No se puede modificar el esquema de tabla y no se puede cambiar el nombre de la tabla.
- La seguridad de nivel de fila no se puede aplicar a la tabla.
- Los nuevos datos no están disponibles en OneLake.
- Los datos se pueden eliminar, truncar o purgar.
- Se puede modificar el esquema de tabla y se puede cambiar el nombre de la tabla.
- Los datos se eliminan temporalmente de OneLake.

Importante

Los datos pueden tardar hasta unas horas en aparecer en OneLake. Para obtener más información, consulte Comportamiento de adaptación.

No hay ningún costo de almacenamiento adicional para activar la disponibilidad de OneLake. Para obtener más información, consulte Consumo de recursos.

Requisitos previos

Activación de la disponibilidad de OneLake

Puede activar la disponibilidad de OneLake en una base de datos KQL o en el nivel de tabla.

  1. Para activar la disponibilidad de OneLake, vaya a la sección OneLake en el panel de detalles de la base de datos o tabla de KQL.

  2. Establezca Disponibilidad en Activado.

    Captura de pantalla de la sección OneLake del panel Detalles de la base de datos en Inteligencia en tiempo real que muestra la opción Disponibilidad resaltada.

  3. La base de datos se actualiza automáticamente.

    Captura de pantalla de los detalles de la sección OneLake en Inteligencia en tiempo real de Microsoft Fabric una vez que la disponibilidad está establecida en Activado. La opción para exponer datos a OneLake está activada.

Ha activado la disponibilidad de OneLake en la base de datos KQL. Ahora puede acceder a todos los datos nuevos agregados a la base de datos en la ruta de acceso de OneLake dada en formato Delta Lake. También puede optar por crear un acceso directo de OneLake desde un Lakehouse, Data Warehouse o consultar los datos directamente mediante el modo Direct Lake de Power BI.

Comportamiento adaptable

Eventhouse ofrece un mecanismo sólido que agrupa inteligentemente los flujos de datos entrantes en uno o varios archivos Parquet, estructurados para su análisis. El procesamiento por lotes de flujos de datos es importante al tratar con datos complicados. Escribir muchos archivos pequeños de Parquet en el lago puede ser ineficaz, lo que da lugar a mayores costos y un rendimiento deficiente.

El mecanismo adaptable de Eventhouse puede retrasar las operaciones de escritura durante hasta unas horas si no hay suficientes datos para crear archivos Parquet óptimos. Esto garantiza que los archivos Parquet sean óptimos en tamaño y se adhieren a los procedimientos recomendados de Delta Lake. El mecanismo adaptable de Eventhouse garantiza que los archivos Parquet están optimizados para el análisis y equilibran la necesidad de solicitar disponibilidad de datos con consideraciones de costo y rendimiento.

Puede supervisar hace cuánto tiempo se agregaron nuevos datos en el lago comprobando la latencia de los datos mediante el comando .show table mirroring operations.

Los resultados se miden a partir de la última vez que se agregaron los datos. Cuando la latencia da como resultado 00:00:00, todos los datos de la base de datos KQL están disponibles en OneLake.

Ver archivos

Al activar la disponibilidad de OneLake en una tabla, se crea una carpeta de registro delta junto con los archivos JSON y Parquet correspondientes. Puedes ver los archivos que estaban disponibles en OneLake y sus propiedades mientras permaneces en inteligencia en tiempo real.

  • Para visualizar los archivos, coloque el cursor sobre una tabla en el panel Explorador y seleccione el menú Más [...]>Ver archivos.

    Captura de pantalla del panel Explorador que muestra la lista desplegable de menú Más de una tabla.

  • Para visualizar las propiedades de la carpeta de registro delta o los archivos individuales, coloque el cursor sobre la carpeta o el archivo y, a continuación, seleccione el menú Más [...]>Propiedades.

  • Para visualizar los archivos de la carpeta de registro delta:

    1. Seleccione la carpeta _delta_log.
    2. Seleccione un archivo para ver los metadatos y el esquema de la tabla. El editor que se abre está en formato de solo lectura.

Directiva de creación de reflejo de acceso

De forma predeterminada, cuando la disponibilidad de OneLake está activada, se habilita una directiva de creación de reflejo. Puede usar la directiva para supervisar la latencia de datos o modificarla para crear particiones de tablas diferenciales.

Nota:

Si desactiva la disponibilidad de OneLake, la propiedad de la directiva de creación de reflejo IsEnabled se establece en falso (IsEnabled=false).

Particiones de tablas delta

Puede crear particiones de las tablas delta para mejorar la velocidad de las consultas. Para obtener información sobre cuándo crear particiones de los archivos de OneLake, consulte Cuándo crear particiones de tablas. Cada partición se representa como una columna independiente mediante PartitionName que se muestra en la lista Particiones. Esto significa que la copia de OneLake tiene más columnas que la tabla de origen.

Para particionar las tablas delta, use el comando .alter-merge table policy mirroring.