Compartir a través de


¿Qué significa construir una única fuente de valores verdaderos?

El almacen de lago de Databricks elimina la necesidad de crear y sincronizar copias de datos en varios sistemas mediante la unificación del acceso a los datos y el almacenamiento en un único sistema, estableciendo así un lago de datos como el único origen de valores verdaderos (SSOT). La duplicación de datos suele dar lugar a silos de datos, lo que significa que los diferentes equipos de una organización pueden estar trabajando con versiones de los mismos datos que tienen una calidad y actualizaciones distintas.

¿Cómo controla Lakehouse las transacciones y el acceso a los datos?

Las transacciones de Delta Lake usan archivos de registro almacenados junto con archivos de datos, para así proporcionar garantías ACID en un nivel de tabla. Dado que los archivos de datos y de registro que respaldan las tablas de Delta Lake residen juntos en el almacén de objetos en la nube, la lectura y escritura de datos puede producirse simultáneamente sin riesgo de que muchas consultas produzcan una degradación del rendimiento o un interbloqueo para cargas de trabajo críticas para la empresa. Esto significa que los usuarios y las aplicaciones de todo el entorno empresarial pueden conectarse a una misma copia de los datos para usar diversas cargas de trabajo, y así garantizar que todos los visores tengan la versión más actual de los datos en el momento en que se ejecuta su consulta.

Administración del acceso a los datos de producción

Unity Catalog proporciona una solución de gobernanza de datos centralizada que permite a los administradores de datos proporcionar un control de acceso específico a usuarios, grupos y entidades de servicio. Unity Catalog rige los permisos mediante listas de control de acceso (ACL) que proporcionan una configuración flexible y específica de los recursos. Algunos permisos configurables incluyen:

  • Acceso de solo lectura a una serie de tablas.
  • Permisos de creación y modificación de tablas para una base de datos.
  • La capacidad de leer o modificar datos en una ubicación de almacenamiento en la nube específica.
  • Acceso a varios recursos en la nube mediante credenciales de almacenamiento administrado de Unity Catalog.

Para más información, consulte ¿Qué es Unity Catalog?

Aprovechamiento de las vistas en el almacén de lago de datos

Las vistas de Azure Databricks representan las consultas que se guardaron en los datos almacenados en tablas en algún lugar del almacén de lago de datos. Mientras que las consultas que devuelven tablas se ejecutan en tiempo de escritura, las vistas se ejecutan definiendo la lógica cada vez que se ejecuta una consulta en una vista. Esto significa que las vistas pueden proporcionar acceso actualizado a los datos desde una variedad de orígenes, y ese proceso solo se realiza para actualizar los resultados a medida que son necesarios.

Puede usar Unity Catalog para proteger y compartir vistas junto con otros objetos de datos, lo que permite a los usuarios y equipos compartir la lógica que impulsa las decisiones empresariales clave en toda la organización.

Para obtener más información, consulte ¿Qué es una vista?

Uso compartido de datos con colaboradores

Aunque las ACL de Unity Catalog abarcan una amplia gama de casos de uso para compartir datos dentro de una organización empresarial, Delta Sharing amplía aún más esta opción mediante la administración del acceso de solo lectura a los conjuntos de datos que se pueden compartir con colaboradores en cualquier lugar. Los casos de uso que admite Unity Catalog incluyen:

  • La opción para proporcionar acceso en tiempo real a análisis regionales referentes a regiones aisladas de empresas multinacionales.
  • El uso compartido de conjuntos de datos en empresas aisladas que existen bajo el mismo grupo corporativo.
  • La opción para proporcionar acceso seguro a los conjuntos de datos mantenidos por el cliente para consumidores de terceros.

Azure Databricks tiene Delta Sharing viene integrado con Unity Catalog, pero también forma parte del código abierto Delta Lake. Para obtener más información, consulte ¿Qué es Delta Sharing?.