Appliquer l’Engineering données avec des pools Azure Synapse Apache Spark

Intermédiaire
Ingénieur Data
Azure Synapse Analytics

Apache Spark est une solution de traitement distribué hautement scalable pour l’analytique et la transformation du Big Data. Vous pouvez tirer parti de sa puissance dans Azure Synapse Analytics en utilisant des pools Spark.

Prérequis

Avant de commencer ce parcours d’apprentissage, vous devez être familiarisé avec Azure Synapse Analytics. Il peut être préférable de suivre d’abord le module Introduction à Azure Synapse Analytics.

Modules de ce parcours d’apprentissage

Apache Spark est une technologie de base pour l’analytique des données à grande échelle. Découvrez comment utiliser Spark dans Azure Synapse Analytics pour analyser et visualiser des données dans un lac de données.

Les ingénieurs Données doivent généralement transformer de gros volumes de données. Les pools Apache Spark dans Azure Synapse Analytics fournissent une plateforme de traitement distribué qui leur permet d’atteindre cet objectif.

Delta Lake est une zone de stockage relationnelle open source pour Spark que vous pouvez utiliser pour implémenter une architecture de lakehouse de données dans Azure Synapse Analytics.