Génération de solutions d’analytique OSS (Open Source Software) avec Azure HDInsight

Intermédiaire
Ingénieur Data
Data Scientist
Azure HDInsight

Dans ce parcours d’apprentissage, l’apprenant découvre HDInsight et la façon d’appliquer cette technologie pour résoudre une série de défis concrets.

Prérequis

Les prérequis suivants doivent être remplis

  • Se connecter au portail Azure
  • Comprendre les options de stockage Azure
  • Comprendre les options de calcul Azure

Modules de ce parcours d’apprentissage

À la fin de ce module, vous saurez qu’Azure HDInsight est un service cloud complètement managé qui vous permet de traiter efficacement de gros volumes de données à l’aide des infrastructures open source les plus populaires.

Dans ce module, vous découvrez les différentes configurations permettant de garantir une utilisation optimale de HDInsight, en termes de coûts et de performances.

Dans ce module, vous apprenez à créer un cluster HDInsight, à surveiller un cluster et à connaître les problèmes d’approvisionnement courants.

Découvrez comment HBase fournit un accès aléatoire et une forte cohérence pour de vastes quantités de données non structurées et semi-structurées, dans une base de données sans schéma, organisée par familles de colonnes.

Dans ce module, vous découvrez comment créer des pipelines et des applications d’analyse de données de streaming en temps réel dans le cloud en utilisant Azure HDInsight avec Apache Kafka et Apache Spark.

À la fin de ce module, vous pouvez effectuer des requêtes ad hoc sur un jeu de données Big Data. L’utilisation de HDInsight Interactive Query permet d’obtenir des latences de requête inférieures à une seconde.

Azure HDInsight avec d’autres services Azure offrent une solution de sécurité multiniveau complète, dont la responsabilité est partagée par Microsoft et le client.