Surveiller et gérer les charges de travail d’engineering données avec Apache Spark dans Azure Synapse Analytics
Intermédiaire
Ingénieur Data
Azure Synapse Analytics
Découvrez comment surveiller et gérer les charges de travail d’engineering données avec Apache Spark dans Azure Synapse Analytics.
Objectifs d’apprentissage
À la fin de ce module, vous serez en mesure de :
- Surveiller les pools Spark dans Azure Synapse Analytics
- Comprendre l’utilisation des ressources des pools Spark dans Azure Synapse Analytics
- Surveiller l’activité des requêtes des pools Spark dans Azure Synapse Analytics
- Référencer les performances d'Apache Spark avec Apache Spark History Server dans Azure Synapse Analytics
- Optimiser les travaux Apache Spark dans Azure Synapse Analytics
- Mettre à l’échelle des pools Apache Spark automatiquement dans Azure Synapse Analytics
Prérequis
Avant de suivre ce module, il est recommandé d’avoir suivi les modules suivants :
- Principes de base des données
- Présentation d’Azure Data Factory
- Présentation d’Azure Synapse Analytics