Realización de análisis ETL sin código con HDInsight Interactive Query

Principiante
Ingeniero de datos
Científico de datos
HDInsight de Azure

Al final de este módulo, podrá realizar consultas ad hoc en un conjunto de macrodatos. El uso de HDInsight Interactive Query ayuda a lograr latencias de consulta inferiores a un segundo.

Objetivos de aprendizaje

En este módulo aprenderá:

  • Los escenarios adecuados para implementar clústeres de HDInsight Interactive Query.
  • Obtendrá información sobre los patrones arquitectónicos.
  • Implementará un clúster para una aplicación inmobiliaria y consultará los datos.
  • Aprenderá a integrar Apache Spark y consultas LLAP de Hive mediante Hive Warehouse Connector.
  • Creará un panel de consultas interactivas a gran escala para evaluar las ubicaciones y el valor de propiedades inmobiliarias.

Requisitos previos

Es necesario satisfacer los siguientes requisitos previos:

  • Inicio de sesión correcto en Azure Portal.
  • Descripción de las opciones de almacenamiento de Azure.
  • Descripción de las opciones de procesamiento de Azure.
  • Creará y configurará un clúster de HDInsight en Azure Portal.