Introducción al almacén de lago de datos de buena arquitectura

Como arquitecto de la nube, al evaluar una implementación del lago de datos en la plataforma Data Intelligence de Databricks, puede que se pregunte “¿Qué es un buen lago de datos?” Los artículos de lago de datos de buena arquitectura proporcionan instrucciones para la implementación de un lago de datos.

Para empezar, es posible que también quiera saber lo siguiente:

  • ¿Cuál es el ámbito del lago de datos, en términos de funcionalidades y roles?
  • ¿Cuál es la visión del lago de datos?
  • ¿Cómo se integra el lago de datos con la arquitectura en la nube del cliente?

Artículos sobre la arquitectura del lago de datos

El ámbito del lago de datos

El primer paso para diseñar la arquitectura de datos con la plataforma Data Intelligence de Databricks es comprender sus pilares básicos y cómo se integrarían con sus sistemas. Consulte Ámbito de la plataforma del lago de datos.

Principios rectores del lago de datos

Reglas básicas que definen e influyen en su arquitectura. Explican la visión detrás de una implementación de lago de datos y forman la base para las decisiones futuras sobre los datos, el análisis y la arquitectura de inteligencia artificial. Consulte Principios rectores del lago de datos.

Arquitecturas de referencia del lago de datos descargables

Los planos técnicos de arquitectura descargables describen la configuración recomendada de la plataforma Data Intelligence de Databricks y su integración con los servicios de proveedores en la nube. Para obtener archivos PDF de arquitectura de referencia en formato 11 x 17 (A3), consulte Descargar arquitecturas de referencia del lago de datos.

Los siete fundamentos de un lago de datos de buena arquitectura, sus principios y procedimientos recomendados

Comprenda las ventajas y desventajas de las decisiones que tome al construir el lago de datos. Este marco proporciona procedimientos recomendados de arquitectura para desarrollar y operar un lago de datos seguro, fiable, eficaz y rentable. Consulte Arquitectura de lago de datos: marco de buena arquitectura de Databricks.