Cómo funciona Azure Synapse Analytics

Completado

Para admitir las necesidades de análisis de las organizaciones actuales, Azure Synapse Analytics combina un servicio centralizado para el almacenamiento y el procesamiento de datos con una arquitectura extensible mediante la cual los servicios vinculados permiten integrar los almacenes de datos, las plataformas de procesamiento y las herramientas de visualización que se usan habitualmente.

Creación y uso de un área de trabajo de Azure Synapse Analytics

Un área de trabajo de Synapse Analytics define una instancia del servicio Synapse Analytics en la que se pueden administrar los servicios y los recursos de datos necesarios para la solución de análisis. Puede crear un área de trabajo de Synapse Analytics en una suscripción de Azure de forma interactiva mediante Azure Portal o automatizar la implementación mediante Azure PowerShell, la interfaz de línea de comandos (CLI) de Azure o con una plantilla de Azure Resource Manager o Bicep.

Una vez creada el área de trabajo de Synapse Analytics, puede administrar los servicios en ella y realizar tareas de análisis de datos con los servicios mediante Synapse Studio (un portal basado en la web para Azure Synapse Analytics).

Screenshot of Azure Synapse Studio.

Trabajo con archivos en un lago de datos

Uno de los recursos principales de un área de trabajo de Synapse Analytics es el lago de datos, donde los archivos de datos se pueden almacenar y procesar a gran escala. Normalmente, un área de trabajo tiene un lago de datos predeterminado, que se implementa como servicio vinculado a un contenedor de Azure Data Lake Storage Gen2. Puede agregar servicios vinculados para varios lagos de datos basados en distintas plataformas de almacenamiento, según sea necesario.

Screenshot of a data lake linked service in Azure Studio.

Ingesta y transformación de datos con canalizaciones

En la mayoría de las soluciones de análisis de datos empresariales, los datos se extraen de varios orígenes operativos y se transfieren a un lago de datos central o almacenamiento de datos para el análisis. Azure Synapse Analytics incluye compatibilidad integrada para crear, ejecutar y administrar canalizaciones que orquesten las actividades necesarias para recuperar datos de una variedad de orígenes, transformar los datos según sea necesario y cargar los datos transformados resultantes en un almacén analítico.

Screenshot of a pipeline in Azure Synapse Studio.

Nota:

Las canalizaciones de Azure Synapse Analytics se basan en la misma tecnología subyacente que Azure Data Factory. Si ya está familiarizado con Azure Data Factory, puede aprovechar las aptitudes existentes para crear soluciones de ingesta y transformación de datos en Azure Synapse Analytics.

Consulta y manipulación de datos con SQL

El lenguaje de consulta estructurado (SQL) es un lenguaje omnipresente para consultar y manipular datos, y es la base de las bases de datos relacionales, incluida la popular plataforma de base de datos Microsoft SQL Server. Azure Synapse Analytics admite la consulta y manipulación de datos basados en SQL mediante dos tipos de grupo de SQL basados en el motor de base de datos relacional de SQL Server:

  • Un grupo sin servidor integrado optimizado para usar la semántica de SQL relacional para consultar los datos basados en archivos en un lago de datos.
  • Los grupos de SQL dedicados personalizados que hospedan almacenes de datos relacionales.

El sistema Azure Synapse SQL usa un modelo de procesamiento de consultas distribuidas para paralelizar las operaciones SQL, lo que da lugar a una solución altamente escalable para el procesamiento de datos relacionales. Puede usar el grupo sin servidor integrado para el análisis y el procesamiento rentables de los datos de archivo en el lago de datos, y grupos de SQL dedicados, para crear almacenes de datos relacionales para el modelado y los informes de datos empresariales.

Screenshot of a SQL query and databases in Azure Synapse Studio.

Procesamiento y análisis de datos con Apache Spark

Apache Spark es una plataforma de código abierto para el análisis de macrodatos. Spark realiza el procesamiento distribuido de archivos en un lago de datos mediante la ejecución de trabajos que se pueden implementar con cualquiera de una variedad de lenguajes de programación admitidos. Entre los lenguajes admitidos en Spark se incluyen Python, Scala, Java, SQL y C#.

En Azure Synapse Analytics, puede crear uno o varios grupos de Spark y usar cuadernos interactivos para combinar código y notas a medida que crea soluciones para el análisis de datos, el aprendizaje automático y la visualización de datos.

Screenshot of a Spark notebook in Azure Synapse Studio.

Exploración de datos con el explorador de datos

El explorador de datos de Azure Synapse es un motor de procesamiento de datos en Azure Synapse Analytics que se basa en el servicio Azure Data Explorer. El explorador de datos usa una sintaxis de consulta intuitiva denominada Lenguaje de consulta Kusto (KQL) para habilitar el análisis de alto rendimiento y baja latencia de los datos por lotes y de streaming.

Screenshot of a Kusto Query Language script in Azure Synapse Studio.

Integración con otros servicios de datos de Azure

Azure Synapse Analytics se puede integrar con otros servicios de datos de Azure para soluciones de análisis integrales. Entre las soluciones integradas se incluyen:

  • Azure Synapse Link permite la sincronización casi en tiempo real entre los datos operativos en Azure Cosmos DB, Azure SQL Database, SQL Server y Microsoft Power Platform Dataverse y el almacenamiento de datos analíticos que se puede consultar en Azure Synapse Analytics.
  • La integración de Microsoft Power BI permite a los analistas de datos integrar un área de trabajo de Power BI en un área de trabajo de Synapse y realizar una visualización interactiva de datos en Azure Synapse Studio.
  • La integración de Microsoft Purview permite a las organizaciones catalogar los recursos de datos en Azure Synapse Analytics y facilita a los ingenieros de datos encontrarlos y realizar un seguimiento del linaje de datos al implementar canalizaciones de datos que ingieren datos en Azure Synapse Analytics.
  • La integración de Azure Machine Learning permite a los analistas de datos y a los científicos de datos integrar el entrenamiento y el consumo predictivos del modelo en soluciones analíticas.