O que é a Consulta Interativa no Azure HDInsight

A Consulta Interativa (também chamada de Apache Hive LLAP, ou Processamento Analítico de Baixa Latência) é um tipo de cluster do Azure HDInsight. O Interactive Query suporta cache na memória, o que torna as consultas do Apache Hive mais rápidas e muito mais interativas. Os clientes usam a Consulta Interativa para consultar dados armazenados no armazenamento do Azure & Armazenamento do Azure Data Lake de maneira super-rápida. A consulta interativa torna mais fácil para desenvolvedores e cientistas de dados trabalharem com o big data usando ferramentas de BI que eles mais amam. O HDInsight Interactive Query suporta várias ferramentas para acessar big data de forma fácil.

Um cluster de Consulta Interativa é diferente de um cluster Apache Hadoop. Ele contém apenas o serviço Hive.

Você pode acessar o serviço Hive no cluster de Consulta Interativa somente por meio do Apache Ambari Hive View, Beeline e do driver Microsoft Hive Open Database Connectivity (Hive ODBC). Você não pode acessá-lo por meio do console do Hive, do Templeton, da CLI Clássica do Azure ou do Azure PowerShell.

Criar um cluster de Consulta Interativa

Para obter informações sobre como criar um cluster HDInsight, consulte Criar clusters Apache Hadoop no HDInsight. Escolha o tipo de cluster de Consulta Interativa.

Importante

O tamanho mínimo do nó principal para clusters de Consulta Interativa é Standard_D13_v2. Para obter mais informações, consulte o Gráfico de dimensionamento de máquina virtual do Azure.

Executar consultas do Apache Hive a partir do Interactive Query

Para executar consultas do Hive, você tem as seguintes opções:

Método Description
Microsoft Power BI Consulte Visualizar dados do Apache Hive de consulta interativa com o Power BI no Azure HDInsight e Visualizar big data com o Power BI no Azure HDInsight.
Visual Studio Consulte Conectar-se ao Azure HDInsight e executar consultas do Apache Hive usando o Data Lake Tools for Visual Studio.
Visual Studio Code Consulte Usar o código do Visual Studio para Apache Hive, LLAP ou pySpark.
Apache Ambari Hive Vista Consulte Usar o Apache Hive View com o Apache Hadoop no Azure HDInsight. O Hive View não está disponível para o HDInsight 4.0.
Apache Beeline Consulte Usar o Apache Hive com o Apache Hadoop no HDInsight com Beeline. Você pode usar Beeline a partir do nó principal ou de um nó de borda vazio. Recomendamos o uso de Beeline a partir de um nó de borda vazio. Para obter informações sobre como criar um cluster HDInsight usando um nó de borda vazio, consulte Usar nós de borda vazios no HDInsight.
Hive ODBC Consulte Conectar o Excel ao Apache Hadoop com o driver ODBC do Microsoft Hive.

Para localizar a cadeia de conexão JDBC (Java Database Connectivity):

  1. Em um navegador da Web, navegue até https://CLUSTERNAME.azurehdinsight.net/#/main/services/HIVE/summary, onde CLUSTERNAME é o nome do cluster.

  2. Para copiar o URL, selecione o ícone da área de transferência:

    HDInsight Hadoop Interactive Query LLAP JDBC.

Próximos passos