Análisis a escala de nube

Con formas más grandes y sofisticadas de adopción de la nube, el recorrido a la nube se vuelve más complejo. El análisis a escala de nube de Azure es un marco escalable y repetible que satisface las necesidades únicas de su organización para crear plataformas de datos modernas.

El análisis a escala de nube abarca consideraciones técnicas y no técnicas para el análisis y la gobernanza en la nube. Esta guía se esfuerza por ser independiente de la nube para permitir la adopción híbrida y multinube, pero los ejemplos de implementación técnica se centran en los productos de Azure.

El análisis a escala de nube tiene los siguientes objetivos:

  • Suministrar datos como un producto en lugar de como un subproducto.
  • Proporcionar un ecosistema de productos de datos en lugar de un almacenamiento de datos singular, que podría no ser la mejor opción para el escenario de datos.
  • Impulsar un enfoque predeterminado de aplicar la gobernanza y la seguridad de los datos.
  • Impulsar a los equipos a dar prioridad de forma coherente a los resultados empresariales en lugar centrarse solamente en la tecnología subyacente.

El análisis a escala de nube se basa en el marco de adopción de la nube de Microsoft y requiere la comprensión de las zonas de aterrizaje. Si aún no tiene una implementación de zonas de aterrizaje de Azure, consulte con los equipos en la nube sobre cómo cumplir los requisitos previos. Para más información, consulte Asegúrese de que el entorno está preparado para el plan de adopción de la nube.

Las arquitecturas de referencia le permiten comenzar con una superficie pequeña y crecer con el tiempo, adaptando el escenario a sus casos de uso.

El análisis de escala de nube incluye plantillas repetibles que aceleran cinco implementaciones básicas de infraestructura y recursos. También es adaptable para los diferentes tamaños de la organización. Si es una pequeña empresa con recursos limitados, es posible que un modelo de operaciones centralizado, combinado con algunos expertos en la materia de la empresa se ajuste a su situación. Si es una empresa más grande con unidades de negocio autónomas (cada una con sus propios ingenieros de datos y analistas) como objetivo, un modelo operativo distribuido podría satisfacer mejor sus necesidades, por ejemplo, una malla de datos o un tejido de datos.

Objetivos

El análisis a escala de nube proporciona un marco basado en los siguientes principios. Estos principios abordan los desafíos con arquitecturas de datos complejas que no se escalan a las necesidades de las organizaciones.

Principio Descripción
Permitir
  • Escalar sin mayor complejidad
  • Separación de intereses para facilitar la gobernanza
  • Creación de infraestructura de datos de autoservicio
Seguir
  • Procedimientos recomendados para servicios en la nube bien diseñados
Soporte técnico
  • Escenarios locales y multinube
Adoptar
  • Enfoque independiente del producto y del proveedor
  • Plataforma de adopción de la nube
Confirmar
  • Zonas de aterrizaje de Azure como infraestructura de línea de base para todas las cargas de trabajo
  • Modelo operativo
Habilitar
  • Infraestructura de datos común
  • Arquitectura distribuida bajo gobernanza centralizada
  • Línea de visión de red protegida

Guía de implementación

La guía de implementación se pueden dividir en dos secciones:

  • Guía global que se aplica a todas las cargas de trabajo.
  • Guía específica de escala de la nube

Guía global

Documentación Descripción
Cloud Adoption Framework La administración y gobernanza de datos es un proceso del ciclo de vida que comienza con la creación a partir de una estrategia de nube existente y llega hasta las operaciones en curso. Cloud Adoption Framework le ayuda a guiar todo el ciclo de vida del patrimonio de datos.
Marco de arquitectura de Azure Las operaciones y la arquitectura de las cargas de trabajo afectan directamente a los datos. Sepa la forma en que la arquitectura puede mejorar la administración y la gobernanza de los datos de cargas de trabajo.

Guía específica de escala de la nube

Sección Descripción
Creación de una estrategia inicial Cómo crear la estrategia de datos y dinamizar para convertirse en una organización guiada por datos.
Definición del plan Desarrollo de un plan para el análisis a escala de la nube.
Preparación del estado de análisis Información general sobre la administración de datos y las zonas de aterrizaje de datos, con consideraciones clave del área de diseño, como la inscripción empresarial, las redes, la administración de identidades y acceso, las directivas, la continuidad empresarial y la recuperación ante desastres.
Gobernanza del análisis Requisitos para gobernar los datos, el catálogo de datos, el linaje, la administración de datos maestros, la calidad de los datos, los contratos de uso compartido de datos y los metadatos.
Asegurar el estado del análisis Protección del estado de análisis con autenticación y autorización, privacidad de datos y administración del acceso a datos.
Organización de personas y equipos Cómo organizar operaciones, roles, equipos y funciones de equipo eficaces.
Administración del estado del análisis Cómo aprovisionar la plataforma y la observabilidad de un escenario.

Arquitecturas

En esta sección se tratan los detalles de las implementaciones físicas del análisis a escala de la nube. Asigna las arquitecturas físicas de las zonas de aterrizaje de administración de datos y las zonas de aterrizaje de datos.

El análisis a escala de la nube tiene dos conceptos arquitectónicos clave:

  • La zona de aterrizaje de datos.
  • La zona de aterrizaje de administración de datos.

Estas arquitecturas estandarizan los procedimientos recomendados y minimizan los cuellos de botella de la implementación para los equipos de desarrollo. También pueden acelerar la implementación de soluciones comunes de análisis a escala en la nube. Puede adoptar su guía para las arquitecturas de lakehouse y malla de datos. Esa guía resalta las funcionalidades que necesita para una plataforma de análisis bien controlada que escale con sus necesidades.

En el diagrama siguiente encontrará una descripción general que contiene una plataforma de datos con una zona de aterrizaje de administración de datos central y varias zonas de aterrizaje de datos.

Diagrama de un diseño de alto nivel que contiene una zona de aterrizaje de administración de datos y zonas de aterrizaje de datos.

Puede empezar con una sola zona de aterrizaje y escalar a varias zonas de aterrizaje, y controlar todas ellas desde la zona de aterrizaje de administración de datos.

Para más información, consulte: Introducción a las arquitecturas.

Plantillas de implementación

En esta sección se incluyen muchas plantillas de referencia que se pueden implementar.

Repositorio Contenido Obligatorio Modelo de implementación
Plantilla de administración de datos Servicios centrales de administración de datos y servicios de datos compartidos, como el catálogo de datos y el entorno de ejecución de integración auto-hospedado Uno por cada análisis a escala de la nube
Plantilla de zona de aterrizaje de datos Servicios compartidos de zonas de aterrizaje de datos, incluidos los servicios de ingesta, administración y almacenamiento de datos Uno por zona de aterrizaje de datos
Plantilla de integración de datos: procesamiento por lotes Servicios adicionales necesarios para el procesamiento de datos por lotes No Uno o más por zona de aterrizaje de datos
Plantilla de integración de datos: procesamiento de flujos Servicios adicionales necesarios para el procesamiento de flujos de datos No Uno o más por zona de aterrizaje de datos
Plantilla de producto de datos: análisis y ciencia de datos Servicios adicionales necesarios para el análisis de datos y la IA No Uno o más por zona de aterrizaje de datos

Estas plantillas contienen plantillas de Azure Resource Manager y sus archivos de parámetros, así como definiciones de canalizaciones de CI/CD para la implementación de recursos.

Las plantillas pueden cambiar con el tiempo, en función de los nuevos servicios y requisitos de Azure. Proteja la rama principal de cada repositorio, para conservarla sin errores y lista para su consumo e implementación. Use una suscripción de desarrollo para probar los cambios de configuración de la plantilla, antes de combinar de nuevo las mejoras de características en la rama principal.

Para más información, vea Plantillas de implementación.

Aceleradores de soluciones

Los aceleradores de soluciones son proyectos de código abierto en GitHub. Estos repositorios contienen recursos e información que simplifican y aceleran la capacidad de resolver problemas mediante tecnología.

Para más información, vea la Aceleradores de soluciones.

Procedimientos recomendados

Los siguientes artículos de la tabla de contenido de análisis a escala de nube tienen un nivel superior a 300 y pueden ayudar a los equipos de TI centrales a implementar las herramientas y administrar los procesos para la administración y gobernanza de los datos:

Expanda la sección Productos destacados de Azure en la tabla de contenido de análisis a escala de nube para obtener información sobre los productos de Azure que admiten análisis a escala de nube.

Recorridos comunes de clientes

Los siguientes recorridos del cliente habituales admiten el análisis a escala de nube:

  • Preparación del entorno. Use los artículos Preparación del entorno como recursos. Establezca procesos y enfoques que admitan toda la cartera de cargas de trabajo en todo su patrimonio de datos.

  • Mejore los controles a lo largo del patrimonio de datos. Céntrese en los artículos Gobernanza del patrimonio de datos y Protección del patrimonio de datos para integrar el análisis a escala de nube en sus operaciones existentes.

  • Influir en los cambios en las cargas de trabajo individuales. A medida que mejoren los procesos de análisis a escala de nube, los equipos centrales de gobernanza de datos encontrarán requisitos que dependan del conocimiento de la arquitectura que hay tras las cargas de trabajo individuales. Use los artículos arquitectura para comprender cómo puede usar los escenarios dentro de su caso de uso.

  • Optimice las cargas de trabajo individuales y los equipos de cargas de trabajo. Comience con la guía del Marco de buena arquitectura de Azure para integrar las estrategias de análisis a escala de nube en las cargas de trabajo individuales. En la guía se describen los procedimientos recomendados y las arquitecturas que los equipos centrales de TI y gobernanza deben usar para acelerar el desarrollo de cargas de trabajo individuales.

  • Use los procedimientos recomendados para incorporar recursos individuales. Expanda la sección Procedimientos recomendados de la tabla de contenido de análisis a escala de nube para encontrar artículos sobre los procesos para incorporar todo el patrimonio de datos en un plano de control de análisis a escala de nube.

  • Use productos específicos de Azure. Acelere y mejore las funcionalidades del análisis a escala de nube mediante los productos de Azure que se describen en la sección Productos destacados de Azure de la tabla de contenido del análisis a escala de nube.

Realizar acción

Para más información sobre cómo planear la implementación del análisis a escala de nube, consulte:

Pasos siguientes

Comience el recorrido del análisis a escala de nube: