Compartir a través de


Introducción a las arquitecturas

Antes de empezar a crear las arquitecturas de datos del marco de análisis a escala de la nube, revise los artículos de la tabla siguiente.

Sección Descripción
Creación de una estrategia inicial Cómo crear la estrategia de datos y dinamizar para convertirse en una organización guiada por datos.
Definición del plan Desarrollo de un plan para el análisis a escala de la nube.
Preparación del estado de análisis Información general sobre la administración de datos y las zonas de aterrizaje de datos, con consideraciones clave del área de diseño, como la inscripción empresarial, las redes, la administración de identidades y acceso, las directivas, la continuidad empresarial y la recuperación ante desastres.
Gobernanza del análisis Requisitos para gobernar los datos, el catálogo de datos, el linaje, la administración de datos maestros, la calidad de los datos, los contratos de uso compartido de datos y los metadatos.
Asegurar el estado del análisis Protección del estado de análisis con autenticación y autorización, privacidad de datos y administración del acceso a datos.
Organización de personas y equipos Cómo organizar operaciones, roles, equipos y funciones de equipo eficaces.
Administración del estado del análisis Cómo aprovisionar la plataforma y la observabilidad de un escenario.

Arquitectura física

La implementación física del análisis de escala de la nube consta de dos arquitecturas principales: la zona de aterrizaje de administración de datos y la zona de aterrizaje de datos.

Aplicaciones de datos

Las aplicaciones de datos son un concepto básico para entregar un producto de datos y se pueden alinear con patrones de malla de datos y de lakehouse.

Análisis a escala de nube

Puede escalar la implementación de análisis a escala de la nube mediante varias zonas de aterrizaje de datos.

Malla de datos

Implemente la malla de datos mediante el análisis a escala de la nube. Aunque se aplican la mayoría de las instrucciones de análisis a escala de la nube, hay que tener en cuenta algunas diferencias sobre los dominios de datos, las plataformas de datos de autoservicio, la incorporación de productos de datos, la gobernanza, el marketplace de datos y el uso compartido de datos.

Plantillas de implementación para los análisis a escala de la nube

En la tabla siguiente se enumeran las plantillas de referencia que puede implementar.

Repositorio Contenido Obligatorio Modelo de implementación
Plantilla de administración de datos Servicios centrales de administración de datos y servicios de datos compartidos, como el catálogo de datos y el entorno de ejecución de integración auto-hospedado Uno por cada análisis a escala de la nube
Plantilla de zona de aterrizaje de datos Servicios compartidos de zonas de aterrizaje de datos, incluidos los servicios de ingesta, administración y almacenamiento de datos Uno por zona de aterrizaje de datos
Plantilla de integración de datos: procesamiento por lotes Servicios adicionales necesarios para el procesamiento de datos por lotes No Uno o más por zona de aterrizaje de datos
Plantilla de integración de datos: procesamiento de flujos Servicios adicionales necesarios para el procesamiento de flujos de datos No Uno o más por zona de aterrizaje de datos
Plantilla de producto de datos: análisis y ciencia de datos Servicios adicionales necesarios para el análisis de datos y la IA No Uno o más por zona de aterrizaje de datos

Estas plantillas contienen plantillas de Azure Resource Manager y sus archivos de parámetros, así como definiciones de canalizaciones de CI/CD para la implementación de recursos.

Las plantillas pueden cambiar con el tiempo, en función de los nuevos servicios y requisitos de Azure. Proteja la rama principal de cada repositorio, para conservarla sin errores y lista para su consumo e implementación. Use una suscripción de desarrollo para probar los cambios de configuración de la plantilla, antes de combinar de nuevo las mejoras de características en la rama principal.

Conexión a entornos de forma privada

La arquitectura de referencia es segura por diseño. Usa un enfoque de seguridad multicapa para superar los riesgos comunes de filtración de datos.

La solución de seguridad más sencilla es hospedar un jumpbox, en la red virtual de la zona de aterrizaje de administración de datos o de la zona de aterrizaje de datos, para conectarse a los servicios de datos mediante puntos de conexión privados.

Preguntas más frecuentes

Para obtener una lista de preguntas y respuestas sobre el análisis a escala de la nube, consulte Preguntas más frecuentes.

Pasos siguientes

Introducción a la zona de aterrizaje de administración de datos del análisis a escala de la nube