Eliminare l'esecuzione di analisi ETL con HDInsight Interactive Query

Principiante
Data engineer
Data scientist
Azure HDInsight

Al termine di questo modulo, l'utente sarà in grado di eseguire query ad hoc su un set di dati di grandi dimensioni. L'uso di HDInsight Interactive Query consente di ottenere latenze di query inferiori al secondo.

Obiettivi di apprendimento

Contenuto del modulo:

  • Scenari appropriati per la distribuzione di cluster HDInsight Interactive Query.
  • Informazioni sui modelli architettonici.
  • Distribuzione di un cluster per un'app per il settore immobiliare ed esecuzione di query sui dati.
  • Informazioni su come integrare query di Apache Spark e Hive LLAP con Hive Warehouse Connector.
  • Creazione di un dashboard di query interattive su larga scala per valutare i valori e le località immobiliari.

Prerequisiti

Devono essere soddisfatti i prerequisiti seguenti:

  • Accesso al portale di Azure.
  • Conoscenza delle opzioni di archiviazione di Azure.
  • Conoscenza delle opzioni di calcolo di Azure.
  • Creazione e configurazione di un cluster HDInsight nel portale di Azure.