Share via


Guia de início rápido: consultar o Apache HBase no Azure HDInsight usando o Shell do HBase

Neste início rápido, você aprenderá a usar o Shell do Apache HBase para criar uma tabela do HBase, inserir dados e, em seguida, consultar a tabela.

Se você não tiver uma assinatura do Azure, crie uma conta gratuita antes de começar.

Pré-requisitos

Criar uma tabela e manipular dados

Para a maioria das pessoas, os dados aparecem no formato de tabela:

HDInsight Apache HBase tabular data.

No HBase (uma implementação do Cloud BigTable), os mesmos dados se parecem com:

HDInsight Apache HBase BigTable data.

Você pode usar o SSH para se conectar aos clusters do HBase e, em seguida, usar o Shell do Apache HBase para criar tabelas do HBase, inserir dados e consultar dados.

  1. Use o comando ssh para se conectar ao cluster HBase. Edite o comando abaixo substituindo CLUSTERNAME pelo nome do cluster e, em seguida, digite o comando:

    ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
    
  2. Use o comando hbase shell para iniciar o shell interativo do HBase. Digite o seguinte comando em sua conexão de SSH:

    hbase shell
    
  3. Use o comando create para criar uma tabela do HBase com famílias de duas colunas. Insira o seguinte comando:

    create 'Contacts', 'Personal', 'Office'
    
  4. Use o comando list para listar todas as tabelas no HBase. Insira o seguinte comando:

    list
    
  5. Use o comando put para inserir valores em uma coluna e linha especificadas em uma determinada tabela. Digite o seguinte comando:

    put 'Contacts', '1000', 'Personal:Name', 'John Dole'
    put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001'
    put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002'
    put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
    
  6. Use o comando scan para verificar e retornar os dados da tabela Contacts. Insira o seguinte comando:

    scan 'Contacts'
    
  7. Use o comando get para buscar o conteúdo de uma linha. Insira o seguinte comando:

    get 'Contacts', '1000'
    

    Você vê resultados semelhantes usando o comando scan porque há apenas uma linha de comando.

  8. Use o comando delete para excluir um valor de célula na tabela. Digite o seguinte comando:

    delete 'Contacts', '1000', 'Office:Address'
    
  9. Use o comando disable para desabilitar a tabela. Digite o seguinte comando:

    disable 'Contacts'
    
  10. Use o comando drop para remover uma tabela do HBase. Digite o seguinte comando:

    drop 'Contacts'
    
  11. Use o comando exit para interromper o shell interativo do HBase. Insira o seguinte comando:

    exit
    

Para saber mais sobre o esquema da tabela HBase, confira Introdução ao projeto de esquema do Apache HBase. Para obter mais comandos HBase, confira Guia de referência do Apache HBase.

Limpar os recursos

Após concluir o início rápido, poderá ser conveniente excluir o cluster. Com o HDInsight, seus dados são armazenados no Armazenamento do Azure, assim você poderá excluir, com segurança, um cluster quando ele não estiver em uso. Você também é cobrado por um cluster HDInsight, mesmo quando ele não está em uso. Como os encargos para o cluster são muitas vezes maiores do que os encargos para armazenamento, faz sentido, do ponto de vista econômico, excluir os clusters quando não estiverem em uso.

Para excluir um cluster, confira Delete an HDInsight cluster using your browser, PowerShell, or the Azure CLI (Excluir um cluster HDInsight usando o navegador, o PowerShell ou a CLI do Azure).

Próximas etapas

Neste início rápido, você aprendeu como usar o Shell do Apache HBase para criar uma tabela do HBase, inserir dados e, em seguida, consultar a tabela. Para saber mais sobre os dados armazenados no HBase, o próximo artigo mostrará como executar consultas com o Apache Spark.