Novedades y planeadas para OneLake en Microsoft Fabric
Importante
Los planes de versión describen la funcionalidad que puede haberse publicado o no. Las escalas de tiempo de entrega y la funcionalidad proyectada pueden cambiar o no enviarse. Consulte la directiva de Microsoft para obtener más información.
OneLake es un lago de datos único, unificado y lógico para toda la organización. Al igual que OneDrive, OneLake viene automáticamente con todos los inquilinos de Microsoft Fabric y está diseñado para ser el único lugar para todos los datos de análisis.
Los datos de OneLake funcionan con gobernanza integrada, como linaje de datos, protección de datos, certificación, integración de catálogos, etc. y, en última instancia, bajo el control de un administrador de inquilinos. Dentro de un inquilino, las áreas de trabajo permiten que diferentes partes de la organización funcionen de forma independiente, a la vez que contribuyen al mismo lago de datos.
OneLake está abierto en todos los niveles. OneLake admite las mismas API y SDK de ADLS Gen2 para que sean compatibles con las aplicaciones existentes de ADLS Gen2 y pueden admitir cualquier tipo de archivo, estructurado o no estructurado.
OneLake tiene como objetivo proporcionarle el máximo valor posible de una sola copia de datos. Con los accesos directos de OneLake, puede unificar los datos entre dominios, nubes y cuentas mediante la creación de una referencia a los datos almacenados en otras ubicaciones de archivos, como otras ubicaciones de OneLake o ADLS o S3 sin movimiento o duplicación de datos. También puede usar los mismos datos en varios motores analíticos porque los motores de Fabric almacenan todos los datos tabulares en los formatos parquet abiertos. Ya no es necesario copiar datos solo para usarlos con otro motor.
Para obtener más información, consulte la documentación.
Característica | Escala de tiempo de lanzamiento estimada |
---|---|
Accesos directos de tabla oneLake a los datos de Iceberg | T4 2024 |
Modelo de seguridad de OneLake | Q1 2025 |
Disponibilidad general de los roles de acceso a datos de OneLake | Q1 2025 |
Compatibilidad con la caché para la puerta de enlace de datos local en accesos directos de Onelake | Q1 2025 |
Compatibilidad con CI/CD para accesos directos de Onelake | Q1 2025 |
Fácil administración de accesos directos huérfanos de Onelake | Q1 2025 |
OneLake Encryption con claves administradas por el cliente | Q2 2025 |
Catálogo de Fabric OneLake | Enviado (Q4 2024) |
Compatibilidad del catálogo de Unity de Databricks con OneLake | Enviado (Q3 2024) |
Accesos directos de OneLake a datos locales | Enviado (Q2 2024) |
Accesos directos al almacenamiento en la nube de Google | Enviado (Q1 2024) |
API de accesos directos | Enviado (Q1 2024) |
Almacenamiento en caché inteligente para accesos directos de Amazon S3 | Enviado (Q4 2023) |
Escala de tiempo de lanzamiento estimada: Q4 2024
Tipo de versión: versión preliminar pública
Con Microsoft OneLake, podrá crear métodos abreviados de tabla a los datos de Iceberg en otras ubicaciones y estos datos aparecerán automáticamente con el formato Delta Lake.
OneLake genera automáticamente metadatos de Delta Lake virtualizados y hace que esté disponible a través del acceso directo de OneLake. Esto significa que puede usar los datos de Iceberg con todas las cargas de trabajo de Fabric que funcionan con datos con formato de Delta Lake.
Escala de tiempo de lanzamiento estimada: Q1 2025
Tipo de versión: versión preliminar pública
La administración de la seguridad de los datos en varios motores analíticos y copias de datos es difícil. OneLake y Fabric simplifican esto al habilitar el uso de una sola copia de datos en varios motores analíticos sin ningún movimiento o duplicación de datos. Tomando el concepto de "una copia", OneLake también mejora la seguridad con un modelo más preciso, lo que permite el acceso a tablas y carpetas además de la seguridad de nivel de fila y columna. Estas definiciones de seguridad residen con los datos y viajan a través de accesos directos a donde se usen los datos. La seguridad definida en OneLake se aplica de forma consistente en varios motores analíticos de Fabric.
Escala de tiempo de lanzamiento estimada: Q1 2025
Tipo de versión: disponibilidad general
Los roles de acceso a datos de OneLake se basan en las funcionalidades existentes del modelo de seguridad de OneLake para aumentar la granularidad en la que se puede aplicar la seguridad dentro de un elemento de datos de Fabric. Esta característica agrega un modelo RBAC (control de acceso basado en roles) que simplifica la administración de permisos y usuarios para los datos de OneLake. Puede definir roles de seguridad que concedan acceso de lectura a carpetas específicas en OneLake y asignarlos a usuarios o grupos. Los permisos de acceso determinan qué carpetas ven los usuarios al acceder a la vista de lago de los datos, ya sea mediante la experiencia del usuario de almacén de lago, cuadernos o API de OneLake.
Escala de tiempo de lanzamiento estimada: Q1 2025
Tipo de versión: disponibilidad general
El almacenamiento en caché de acceso directo se puede usar para reducir los costes de salida asociados con el acceso a datos entre nubes. A medida que los archivos se leen a través de un acceso directo externo, los archivos se almacenan en una memoria caché para el área de trabajo de Fabric. Las solicitudes de lectura posteriores se proporcionan desde la memoria caché en lugar del proveedor de almacenamiento remoto. Con la introducción de la compatibilidad con la memoria caché para la puerta de enlace de datos local, puede aprovechar estas funcionalidades al conectarse a datos locales o a datos detrás de un firewall.
Escala de tiempo de lanzamiento estimada: Q1 2025
Tipo de versión: versión preliminar pública
Las herramientas de administración del ciclo de vida de Microsoft Fabric proporcionan un sistema estandarizado para la comunicación y la colaboración entre todos los miembros del equipo de desarrollo a lo largo de la vida útil del producto. Con la introducción de la compatibilidad de CI/CD con los accesos directos de Onelake, puede administrar la implementación,ent de accesos directos de Onelake en todos los entornos.
Escala de tiempo de lanzamiento estimada: Q1 2025
Cuando los usuarios cambian de equipo, deje la organización o pierda cierto acceso, los accesos directos de Onelkae pueden dejarse inutilizables. Con las nuevas funcionalidades de administración de estos accesos directos huérfanos, puede restaurar los accesos directos sin ningún impacto empresarial.
Escala de tiempo de lanzamiento estimada: Q2 2025
Tipo de versión: versión preliminar pública
Como parte de nuestra hoja de ruta estratégica para mejorar la seguridad y el cumplimiento de los datos, estamos planeando introducir compatibilidad con claves administradas por el cliente (CMK) en OneLake. Esto proporcionará a las organizaciones un mayor control sobre sus claves de cifrado de datos. Con CMK, los usuarios podrán administrar sus propias claves de cifrado, asegurándose de que sus datos están protegidos de acuerdo con sus directivas de seguridad específicas y los requisitos normativos. Si se revoca la clave del cliente, Microsoft perderá el acceso a los datos del cliente en OneLake.
Características enviadas
Catálogo de Fabric OneLake
Enviado (Q4 2024)
Tipo de versión: disponibilidad general
OneLake catalog es una solución completa para explorar, administrar y controlar todo el patrimonio de datos de Fabric. El catálogo de OneLake es una evolución de la experiencia del centro de datos de OneLake con mejoras que ayudarán a todos los usuarios de Fabric a detectar y administrar datos de confianza, así como a proporcionar gobernanza a los propietarios de datos con información valiosa, acciones recomendadas y herramientas. El catálogo oneLake incluye dos pestañas: Explorar y gobernar. En la pestaña Explorar, los usuarios pueden explorar y administrar todos los elementos de Fabric a los que tienen acceso en una ubicación central con filtros para dominios, tipo de elemento, propietario, aprobación, etiquetas, etc. Los usuarios pueden hacer doble clic en un elemento de Fabric para realizar acciones o explorar la descripción, el linaje de datos, los permisos y la actividad. Y en la pestaña Gobernanza, los propietarios de datos pueden ver una visión general de sus datos con información sobre las aprobaciones, el etiquetado de datos, el tipo de datos, etc. y obtener acciones recomendadas para mejorar sus datos para mejorar la calidad y el cumplimiento. La pestaña Explorar ahora está disponible con carácter general y la pestaña Govern estará disponible próximamente en versión preliminar.
Compatibilidad del catálogo de Unity de Databricks con OneLake
Enviado (Q3 2024)
Tipo de versión: versión preliminar pública
Integración del catálogo de Unity de Azure Databricks con Microsoft Fabric
Podrá acceder a las tablas del catálogo de Azure Databricks Unity directamente en Microsoft Fabric, lo que facilita aún más la unificación de Azure Databricks con Microsoft Fabric. En el portal de Fabric, puede crear y configurar un nuevo elemento del catálogo de Unity de Azure Databricks en Fabric con tan solo unos clics. Puede agregar un catálogo completo, un esquema o incluso tablas individuales para vincular y la administración de este elemento de Azure Databricks en OneLake( un acceso directo conectado al catálogo de Unity) se encarga automáticamente. Estos datos actúan como cualquier otro dato de OneLake: puede escribir consultas SQL o usarlos con cualquier otra carga de trabajo de Fabric, incluida Power BI a través del modo Direct Lake. Cuando los datos se modifican o se agregan, quitan o cambian de nombre en Azure Databricks, los datos de Fabric permanecerán siempre sincronizados. Esta nueva integración facilita la unificación de datos de Azure Databricks en Fabric y su uso sin problemas en todas las cargas de trabajo de Fabric.
Accesos directos de OneLake a datos locales
Enviado (Q2 2024)
Tipo de versión: versión preliminar pública
Los accesos directos de Microsoft OneLake se están expandiendo para incluir orígenes de datos locales y restringidos a la red. Con esta funcionalidad, puede unificar los datos locales y en la nube en OneLake.
Durante la creación de accesos directos a cubos compatibles con AWS S3, Google Cloud Storage o S3, podrá seleccionar opcionalmente una puerta de enlace de datos local (OPDG) para establecer la conectividad.
Accesos directos al almacenamiento en la nube de Google
Enviado (Q1 2024)
Tipo de versión: versión preliminar pública
OneLake expandirá la compatibilidad con acceso directo a Google Cloud Storage, lo que permite la virtualización de datos sin moverlos ni duplicarlos. Esto permite la integración de datos de Google Cloud Storage con servicios Microsoft como ADLS gen2, OneLake, Dataverse y Amazon S3. Los datos aparecerán y funcionarán como si estuvieran en OneLake y le proporcionarán un lago de datos sencillo que puede abarcar nubes.
API de accesos directos
Enviado (Q1 2024)
Tipo de versión: versión preliminar pública
Una API REST pública para automatizar la creación y administración de escenarios de acceso directo.
Almacenamiento en caché inteligente para accesos directos de Amazon S3
Enviado (Q4 2023)
Tipo de versión: versión preliminar pública
El almacenamiento en caché inteligente para accesos directos de Amazon S3 reduce los costos de salida y mejora el rendimiento al acercar los datos al motor de proceso. El almacenamiento en caché inteligente salida datos de S3 una vez, lo almacenará en caché localmente en OneLake durante un período determinado. De este modo, elimina la necesidad de recuperar datos repetidos de S3. Los datos almacenados en caché se pueden reutilizar en varios usuarios, motores analíticos y escenarios que optimizan el valor de una salida única.