Effectuer une analyse Zero ETL avec HDInsight Interactive Query

Débutant
Ingénieur Data
Data Scientist
Azure HDInsight

À la fin de ce module, vous pourrez effectuer des requêtes ad hoc sur un jeu de données volumineux. L’utilisation de HDInsight Interactive Query permet d’obtenir des latences de requête inférieures à une seconde.

Objectifs d’apprentissage

Dans ce module, découvrez :

  • les scénarios appropriés pour déployer des clusters HDInsight Interactive Query.
  • Explorez les modèles architecturaux.
  • Déployez un cluster pour votre application immobilière et interroger les données.
  • Apprenez à intégrer des requêtes Apache Spark et Hive LLAP à l’aide de Hive Warehouse Connector.
  • Créez un tableau de bord de requête interactive à grande échelle pour évaluer les valeurs et emplacements du parc immobilier.

Prérequis

Les prérequis suivants doivent être remplis :

  • Se connecter au portail Azure.
  • Comprendre les options de stockage Azure.
  • Comprendre les options de calcul Azure.
  • Créez et configurez un cluster HDInsight dans le Portail Azure.