Interactive Query in Azure HDInsight

Interactive Query (auch Apache Hive LLAP oder Low Latency Analytical Processing genannt) ist ein Azure HDInsight-Clustertyp. Interactive Query unterstützt speicherinternes Zwischenspeichern, wodurch Apache Hive-Abfragen schneller und viel interaktiver werden. Kunden verwenden Interactive Query, um Daten, die in Azure Storage und Azure Data Lake Storage gespeichert sind, äußerst schnell abzufragen. Interactive Query erleichtert Entwicklern und Data Scientists die Arbeit mit Big Data mit den BI-Tools, die sie am meisten lieben. HDInsight Interactive Query unterstützt verschiedene Tools für den mühelosen Zugriff auf Big Data.

Ein Interactive Query-Cluster unterscheidet sich von einem Apache Hadoop-Cluster. Er enthält nur den Hive-Dienst.

Sie können im Interactive Query-Cluster nur über die Apache Ambari-Hive-Ansicht, Beeline und den Microsoft Hive Open Database Connectivity-Treiber (Hive ODBC) auf den Hive-Dienst zugreifen. Sie können nicht über die Hive-Konsole, Templeton, die klassische Azure-Befehlszeilenschnittstelle oder Azure PowerShell darauf zugreifen.

Erstellen eines Interactive Query-Clusters

Informationen zum Erstellen eines HDInsight-Clusters finden Sie unter Einrichten von Clustern in HDInsight mit Hadoop, Spark, Kafka usw. Wählen Sie den Clustertyp „Interactive Query“ aus.

Wichtig

Die minimale Hauptknotengröße für interaktive Abfragecluster ist Standard_D13_v2. Weitere Informationen finden Sie unter Azure Virtual Machine Dimensionierungscharts.

Ausführen von Apache Hive-Abfragen über Interactive Query

Um Hive-Abfragen auszuführen, können Sie folgende Optionen nutzen:

Methode BESCHREIBUNG
Microsoft Power BI Weitere Informationen finden Sie unter Visualisieren von Interactive Query-Hive-Daten mit Power BI mithilfe direkter Abfragen in Azure HDInsight sowie unter Visualisieren von Apache Hive-Daten mit Microsoft Power BI mithilfe von ODBC in Azure HDInsight.
Visual Studio Siehe Verbinden mit Azure HDInsight und Ausführen von Apache Hive-Abfragen mithilfe von Data Lake-Tools für Visual Studio
Visual Studio Code Weitere Informationen finden Sie unter Verwenden von Visual Studio Code für Apache Hive, LLAP oder pySpark.
Apache Ambari-Hive-Ansicht Siehe Verwenden der Apache Ambari-Hive-Ansicht mit Apache Hadoop in HDInsight Die Hive-Ansicht ist für HDInsight 4.0 nicht verfügbar.
Apache Beeline Informationen finden Sie unter Verwenden des Apache Beeline-Clients mit Apache Hive. Sie können Beeline entweder über den Hauptknoten oder von einem leeren Edgeknoten aus verwenden. Am besten verwenden Sie Beeline von einem leeren Edgeknoten aus. Informationen zum Erstellen eines HDInsight-Clusters mit einem leeren Edgeknoten finden Sie unter Verwenden leerer Edgeknoten in Hadoop-Clustern in HDInsight.
Hive ODBC Informationen finden Sie unter Verbinden von Excel mit Apache Hadoop in Azure HDInsight mithilfe des Microsoft Hive ODBC-Treibers.

So suchen Sie die Verbindungszeichenfolge für die Java Database Connectivity (JDBC):

  1. Navigieren Sie in einem Webbrowser zu https://CLUSTERNAME.azurehdinsight.net/#/main/services/HIVE/summary, wobei CLUSTERNAME der Name Ihres Clusters ist.

  2. Wählen Sie das Symbol für die Zwischenablage zum Kopieren der URL aus:

    HDInsight Hadoop Interactive Query LLAP JDBC.

Nächste Schritte