¿Qué es OneLake?

Microsoft OneLake es un lago de datos unificado para toda la organización. Cada inquilino de Microsoft Fabric incluye automáticamente OneLake y es el único lugar para todos los datos de análisis. Es un repositorio central en el que puede almacenar, administrar y controlar todos los datos de las cargas de trabajo de análisis e inteligencia artificial en toda la organización.

OneLake está construido sobre Azure Data Lake Storage y almacena tablas en formato Delta Parquet o Iceberg, dos estándares abiertos que cualquier herramienta puede leer. Este enfoque significa que los datos no están bloqueados en formatos propietarios.

OneLake proporciona:

Almacenamiento de datos unificado para toda la organización con gobernanza y seguridad integradas
Una copia de datos que se va a usar con varios motores analíticos sin duplicación
Conectividad flexible mediante el explorador de archivos, las API de ADLS Gen2 y las integraciones del servicio Azure
Protección y supervisión de datos con redundancia integrada, recuperación ante desastres y diagnósticos de acceso

Almacenamiento de datos unificado

Antes de OneLake, las organizaciones a menudo crearon varios lagos para diferentes grupos empresariales, lo que llevó a una sobrecarga adicional para administrar varios recursos. Este enfoque siloado dificultaba la colaboración entre equipos, ralentizaba los proyectos de datos y aumentaba el riesgo de duplicación.

OneLake resuelve estos desafíos al proporcionar un punto de acceso a datos central para toda la organización. Cada tenant de Fabric cuenta con una única instancia de OneLake. No se puede eliminar OneLake ni crear varios OneLakes y no hay ninguna infraestructura para aprovisionar ni administrar. Los departamentos, los equipos y los proyectos pueden almacenar o conectarse a sus datos en este lago unificado y organizarlos mediante dominios de Fabric, subdominios y áreas de trabajo, cada uno con su propio administrador. Este modelo mantiene la propiedad de los datos y permite la gobernanza federada, a la vez que permite a los usuarios autorizados detectar y usar datos sin fricción.

Administrado de forma centralizada con propiedad distribuida

Los datos de Fabric existen en la siguiente jerarquía para la organización y la gobernanza:

Inquilino: las directivas de nivel de inquilino protegen automáticamente los datos que llegan a OneLake para la seguridad, el cumplimiento y la administración de datos.
Área de trabajo: Puede crear cualquier cantidad de áreas de trabajo en su tenant para organizar sus datos. Las áreas de trabajo permiten que diferentes partes de la organización distribuyan las directivas de propiedad y acceso. Cada área de trabajo forma parte de una capacidad asociada a una región específica y facturada por separado.
Elementos de datos: las áreas de trabajo contienen elementos de datos como lakehouses, almacenes, centros de eventos y bases de datos KQL. Cada tipo de elemento está diseñado específicamente para cargas de trabajo específicas, como análisis basados en Spark, consultas de T-SQL, streaming en tiempo real, etc.

Para más información, consulte el artículo sobre las Áreas de trabajo.

Descubrir y gobernar con el catálogo de OneLake

El catálogo de OneLake es el único lugar para que los profesionales de datos y los usuarios empresariales detecten, administren y controlen los datos que poseen y pueden acceder a través de OneLake.

Los usuarios pueden filtrar por dominio, área de trabajo, tipo de elemento, aprobaciones y mucho más para buscar exactamente lo que necesitan, con cada elemento de datos enriquecido por metadatos como descripciones, propietarios, esquema, linaje y métricas de uso.

Los propietarios de datos pueden obtener información y acciones recomendadas para mejorar la calidad y el cumplimiento de los datos, incluida la visibilidad de la cobertura de etiquetas de confidencialidad, el etiquetado, las aprobaciones y la ubicación de los datos.

Para obtener más información, consulte Catálogo de OneLake.

Seguridad

El modelo de seguridad de OneLake le permite compartir datos ampliamente sin exponer información confidencial. Mediante el uso de roles de seguridad de OneLake, puede definir permisos pormenorizados en elementos de datos, hasta carpetas, tablas o incluso filas y columnas específicas. Por ejemplo, podría compartir un conjunto de datos de ventas con un equipo, pero restringir el acceso a la Cost columna, o bien podría permitir que un asociado vea solo las filas donde Region = "US". OneLake almacena estos roles y los aplica automáticamente en todas las experiencias de análisis. Por lo tanto, si un usuario tiene acceso solo a parte de un conjunto de datos, esa regla se aplica si consulta a través de SQL, ejecuta un cuaderno de Spark o ve un informe de Power BI. OneLake garantiza que solo ven lo que se les permite ver.

Este enfoque unificado para la seguridad significa que los usuarios no tienen que mantener permisos independientes en distintos motores. También significa que los propietarios originales de los datos siempre conservan el control sobre quién puede acceder a la fuente de datos, incluso si los datos se transfieren a un lakehouse o a un área de trabajo que pertenece a otra persona.

Puede aplicar etiquetas de confidencialidad a elementos de OneLake como lo haría con un documento y esas etiquetas aplican restricciones de cifrado o acceso incluso si los datos se exportan a Excel u otra herramienta. Del mismo modo, las directivas de prevención de pérdida de datos (DLP) pueden detectar cargas o descargas de datos confidenciales de OneLake y evitar o alertar sobre posibles fugas de datos.

Para obtener más información, consulte Introducción a la protección de los datos en OneLake.

Una copia de los datos

Todos los motores de análisis Fabric funcionan con datos directamente en OneLake. No es necesario copiar datos para usarlos con otro motor ni analizar datos de varios orígenes.

Métodos abreviados

Un acceso directo es una referencia a los datos almacenados en otras ubicaciones de archivos. Estas ubicaciones de archivos pueden estar dentro del mismo área de trabajo, una área de trabajo diferente en OneLake o externa a OneLake. Puede usar accesos directos para OneLake, Azure Data Lake Storage, Azure Blob Storage, Amazon S3 y orígenes compatibles con S3, orígenes compatibles con Iceberg, Microsoft Dataverse, orígenes locales y más. Independientemente de la ubicación, los accesos directos hacen que los archivos y carpetas tengan un aspecto similar al almacenado localmente.

Los accesos directos permiten a su organización unificar los datos entre nubes y dominios sin copiarlos. Los equipos pueden trabajar de forma independiente en espacios de trabajo separados y usar accesos directos para compartir datos entre ellos en lugar de duplicarlos. Por ejemplo, un equipo podría crear un acceso directo a un conjunto de datos en el área de trabajo de otro equipo o a un cubo S3 externo y, a continuación, combinar esos datos con sus propios en OneLake. El acceso directo apunta al origen, por lo que, cuando se actualizan los datos de origen, esos cambios son visibles de inmediato mediante OneLake. De este modo, puede crear productos virtuales o vistas que extraen datos de varios grupos empresariales para adaptarse a una necesidad específica, sin mover ni duplicar los datos. Mediante el uso de transformaciones de acceso directo, incluso puede aplicar cambios automáticos a los datos, como convertir el formato de datos o quitar información de identificación personal (PII).

Para obtener más información sobre cómo usar accesos directos, consulte Accesos directos de OneLake.

Mirroring

La creación de reflejo en Fabric es una solución de bajo coste y baja latencia que replica continuamente datos de varios sistemas en OneLake. Puede conectarse de forma segura a un origen de datos externo y reflejar automáticamente (copiar) bases de datos o tablas seleccionadas en el formato abierto de OneLake, lo que los mantiene sincronizado casi en tiempo real. Los datos reflejados se almacenan como Delta Parquet en OneLake, por lo que está listo inmediatamente para su análisis por cualquier motor de Fabric.

La creación de reflejo admite orígenes como Azure SQL Database, Azure Cosmos DB, Azure Database for PostgreSQL, Azure Databricks (Catálogo de Unity), Snowflake, etc. Los cambios en el origen se propagan continuamente, por lo que la copia de OneLake se mantiene actualizada sin procesos manuales de ETL. Puede ejecutar análisis, inteligencia artificial o informes de Power BI sobre datos actualizados sin realizar consultas directas al origen de producción.

Para obtener más información, consulte ¿Qué es la duplicación en Fabric?

Colabore en varios motores analíticos

Los motores analíticos de Fabric (T-SQL, Apache Spark, Analysis Services y otros) almacenan datos en OneLake en el formato Delta Parquet abierto. Esta estandarización permite usar los mismos datos en varios motores. No es necesario copiar los datos solo para utilizarlos con otro motor, ni sentirse bloqueado con el uso de un motor específico solo porque allí están tus datos.

Por ejemplo, un equipo de ingenieros de SQL crea un almacenamiento de datos totalmente transaccional. Usan el motor de T-SQL para crear tablas, transformar datos y cargar los datos en tablas. Si un científico de datos quiere usar estos datos, puede adjuntar un cuaderno de Spark a OneLake y leer esas tablas directamente. Dado que OneLake almacena las tablas en formato Delta, Spark puede cargarlas sin conectores especiales ni exportaciones de datos. Tanto las consultas SQL como los trabajos de Spark funcionan en una copia de los datos en OneLake.

Además, los usuarios de negocio pueden crear informes de Power BI a partir de OneLake utilizando el modo Direct Lake en el motor de Analysis Services. El modo Direct Lake es un modo de acceso a datos que carga y actualiza grandes volúmenes de datos rápidamente sin realizar una copia. Para obtener más información, consulte Introducción a Direct Lake.

Interoperabilidad de formato de tabla abierta

OneLake es compatible con los formatos de tabla Delta Lake y Apache Iceberg a través de la virtualización de metadatos. Esta característica genera automáticamente metadatos virtuales para que las tablas Iceberg puedan leerse como tablas Delta Lake en todas las cargas de trabajo de Fabric, y para que las tablas Delta Lake puedan ser leídas por lectores externos de Iceberg. Puede escribir tablas de Iceberg directamente en OneLake o crear accesos directos a las tablas de Iceberg almacenadas externamente, y OneLake los pone a disposición de todos los motores de Fabric sin conversión manual. Del mismo modo, cualquier tabla de Delta Lake en OneLake puede ser accedida por servicios compatibles con Iceberg, como Snowflake.

Para obtener más información, consulte Uso de tablas de Iceberg con OneLake.

Conexión a OneLake

Puede acceder a los datos de OneLake desde el portal de Fabric, Windows, las herramientas de Azure existentes o cualquier aplicación que admita las API de ADLS Gen2.

Explorador de archivos de OneLake para Windows

Puede explorar los datos de OneLake desde Windows mediante el explorador de archivos de OneLake para Windows. Puede navegar por todas las áreas de trabajo y los elementos de datos, cargar, descargar o modificar archivos fácilmente como lo hace en Office. El explorador de archivos de OneLake simplifica el trabajo con lagos de datos, por lo que incluso los usuarios empresariales no técnicos pueden usarlos.

Para obtener más información, consulte Explorador de datos de OneLake.

API y SDK de ADLS Gen2

OneLake admite api y SDK de Azure Data Lake Storage (ADLS) Gen2, por lo que puede usar aplicaciones de ADLS Gen2 existentes. Cada área de trabajo aparece como un contenedor y los elementos de datos aparecen como carpetas dentro de esos contenedores. Para obtener más información, consulte Acceso y API de OneLake.

Dado que OneLake es compatible con las aplicaciones de ADLS Gen2, puede conectarse a OneLake desde Azure servicios. Por ejemplo:

Protección y supervisión de datos

OneLake incluye funcionalidades integradas para mantener los datos seguros y proporcionarle visibilidad sobre cómo se usa.

Recuperación ante desastres y protección de datos

OneLake protege automáticamente los datos con redundancia integrada. En regiones que admiten zonas de disponibilidad, OneLake usa almacenamiento con redundancia de zona (ZRS) para replicar datos en varios centros de datos. En otras regiones, usa almacenamiento con redundancia local (LRS). Para obtener protección adicional frente a interrupciones que afecten a toda una región, puede habilitar la continuidad del negocio y la recuperación ante desastres (BCDR) en una capacidad para replicar sus datos geográficamente en una región de Azure emparejada. OneLake también admite la eliminación temporal, que conserva los archivos eliminados durante siete días para que pueda recuperarse de eliminaciones accidentales.

Para más información, consulte Recuperación ante desastres y protección de datos para OneLake.

Diagnósticos

Los diagnósticos de OneLake proporcionan visibilidad sobre cómo se accede a los datos y se usan en el entorno de Fabric. Cuando habilita los diagnósticos en el nivel del área de trabajo, envía eventos de acceso a datos en forma de registros a un lakehouse. Puede realizar un seguimiento de quién accedió a qué datos, cuándo y cómo. Este registro abarca las acciones de usuario en la interfaz de usuario de Fabric, el acceso mediante programación a través de API y motores de análisis, y el acceso entre áreas de trabajo a través de accesos directos.

Para obtener más información, consulte Diagnósticos de OneLake.

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-06-24