Introduction

Effectué

De nombreuses organisations travaillent aujourd’hui avec le Big Data. L’énorme volume et la diversité des données, ainsi que leur vitesse de génération, demandent des systèmes offrant une gestion et un contrôle aisés. Auparavant, les organisations utilisaient des systèmes de gestion de bases de données relationnelles pour contrôler les données. Maintenant, les organisations veulent les fonctionnalités des logiciels open source combinées aux avantages des plateformes hébergées. Azure HDInsight est l’exemple parfait de ce partenariat. HDInsight vous permet de traiter des Big Data dans de nombreux scénarios, à l’aide de données historiques ou en temps réel.

Le graphique suivant illustre une vue d’ensemble de la façon dont vous pouvez utiliser HDInsight. Il représente plusieurs sources de données, notamment des capteurs IoT (Internet des objets), des bases de données et plusieurs magasins de données Azure. HDInsight traite les données à partir de tout cela. Il les met ensuite à disposition dans un stockage à long terme pour les applications en temps réel et d’autres analyses.

Diagram of the architecture of HDInsight in a typical organization, depicting several data sources from which it manages big data.

Exemple de scénario

Supposons que vous travaillez pour une organisation qui génère des charges de travail ingérant des données pour créer des rapports historiques et procéder à une analytique avancée. Vous avez peut-être aussi des données de streaming qui demandent à être analysées. Dans ce cas, vous pouvez envisager d’utiliser HDInsight. Il permet d’ingérer toutes les données dans un seul emplacement Data Lake. Vous pouvez ensuite l’utiliser pour gérer les charges de travail suivantes :

  • Traitement par lots
  • Entrepôt de données
  • Opérations de science des données
  • Streaming

Qu’allez-vous faire ?

À la fin de ce module, vous serez en mesure de déterminer si HDInsight peut aider votre organisation à traiter du Big Data. Vous pourrez également décrire comment HDInsight utilise des frameworks open source populaires qui prennent en charge de nombreux scénarios de données.

Quel est l’objectif principal ?

L’objectif principal est de déterminer si HDInsight est un choix approprié pour vos besoins de traitement de Big Data.