Qu'est-ce qu'Interactive Query dans Azure HDInsight

Le cluster Interactive Query (également appelé Apache Hive LLAP ou Low Latency Analytical Processing) est un type de cluster Azure HDInsight. Interactive Query prend en charge la mise en mémoire cache, ce qui accélère les requêtes Apache Hive et les rend beaucoup plus interactives. Les clients utilisent Interactive Query pour interroger des données stockées dans le stockage Azure et Azure Data Lake Storage de manière extrêmement rapide. Une requête interactive permet facilement aux développeurs et scientifiques des données de travailler avec des données volumineuses (big data) à l’aide des outils décisionnels qu’ils préfèrent. HDInsight Interactive Query prend en charge plusieurs outils pour accéder aux données volumineuses de façon facile.

Les clusters Interactive Query sont différents des clusters Apache Hadoop. Ils contiennent uniquement le service Hive.

Vous pouvez accéder au service Hive dans le cluster Interactive Query uniquement par le biais de la vue Apache Ambari Hive, de Beeline et du pilote ODBC Microsoft Hive. Vous ne pouvez pas y accéder via la console Hive, Templeton, Azure Classic CLI ou Azure PowerShell.

Créer un cluster Interactive Query

Pour obtenir des informations sur la création d’un cluster HDInsight, consultez Créer des clusters Apache Hadoop dans HDInsight. Choisissez le type de cluster Interactive Query.

Important

La taille minimale du nœud principal pour les clusters Interactive Query est Standard_D13_v2. Pour plus d’informations, consultez le Tableau de dimensionnement des machines virtuelles Azure.

Exécuter des requêtes Apache Hive à partir du cluster Interactive Query

Pour exécuter des requêtes Hive, vous disposez des options suivantes :

Méthode Description
Microsoft Power BI Consultez Visualiser des données Interactive Query Apache Hive à l’aide de Power BI dans Azure HDInsight et Visualiser des données volumineuses (« Big Data ») avec Power BI dans Azure HDInsight.
Visual Studio Consultez Se connecter à Azure HDInsight et exécuter des requêtes Apache Hive avec Data Lake Tools pour Visual Studio.
Visual Studio Code Consultez Utiliser Visual Studio Code pour Apache Hive, LLAP ou pySpark.
Vue Apache Ambari Hive Consultez Utiliser la vue Apache Hive avec Apache Hadoop dans Azure HDInsight. La vue Hive n’est pas disponible pour HDInsight 4.0.
Apache Beeline Consultez Utiliser Apache Hive avec Apache Hadoop dans HDInsight via Beeline. Vous pouvez utiliser Beeline à partir du nœud principal ou d’un nœud de périphérie vide. L’utilisation de Beeline à partir d’un nœud de périphérie vide est recommandée. Pour plus d’informations sur la création d’un cluster HDInsight avec un nœud de périphérie vide, consultez Utiliser des nœuds de périphérie vides dans HDInsight.
Hive ODBC Consultez Connexion d’Excel à Apache Hadoop à l’aide du pilote ODBC Microsoft Hive.

Pour rechercher la chaîne de connexion Java Database Connectivity (JDBC) :

  1. Dans un navigateur web, accédez à https://CLUSTERNAME.azurehdinsight.net/#/main/services/HIVE/summary, où CLUSTERNAME est le nom de votre cluster.

  2. Pour copier l’URL, sélectionnez l’icône du Presse-papiers :

    HDInsight Hadoop Interactive Query LLAP JDBC.

Étapes suivantes