Schnellstart: Abfragen von Apache HBase in Azure HDInsight mit HBase Shell

In diesem Schnellstart erfahren Sie, wie Sie mit Apache HBase Shell HBase-Tabellen erstellen, Daten einfügen und dann die Tabelle abfragen.

Wenn Sie kein Azure-Abonnement besitzen, können Sie ein kostenloses Konto erstellen, bevor Sie beginnen.

Voraussetzungen

Erstellen einer Tabelle und Bearbeiten von Daten

Den meisten Benutzern werden die Daten im Tabellenformat angezeigt:

HDInsight Apache HBase tabular data.

In HBase (eine Implementierung von Cloud BigTable) sehen die gleichen Daten wie folgt aus:

HDInsight Apache HBase BigTable data.

Sie können SSH verwenden, um eine Verbindung mit Apache HBase-Clustern herzustellen, und dann mithilfe von Apache HBase Shell HBase-Tabellen erstellen, Daten einfügen und Daten abfragen.

  1. Verwenden Sie zum Herstellen der Verbindung mit Ihrem HBase-Cluster ssh. Bearbeiten Sie den unten angegebenen Befehl, indem Sie CLUSTERNAME durch den Namen Ihres Clusters ersetzen, und geben Sie den Befehl dann ein:

    ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
    
  2. Verwenden Sie den Befehl hbase shell, um die interaktive HBase-Shell zu starten. Geben Sie den folgenden Befehl in Ihrer SSH-Verbindung ein:

    hbase shell
    
  3. Verwenden Sie den Befehl create, um eine HBase-Tabelle mit zwei Spaltenfamilien zu erstellen. Geben Sie den folgenden Befehl ein:

    create 'Contacts', 'Personal', 'Office'
    
  4. Verwenden Sie den Befehl list, um alle Tabellen in HBase aufzulisten. Geben Sie den folgenden Befehl ein:

    list
    
  5. Verwenden Sie den Befehl put, um Werte in einer angegebenen Spalte einer angegebenen Zeile in einer bestimmten Tabelle einzufügen. Geben Sie den folgenden Befehl ein:

    put 'Contacts', '1000', 'Personal:Name', 'John Dole'
    put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001'
    put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002'
    put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
    
  6. Verwenden Sie den Befehl scan, um die Daten der Tabelle Contacts zu überprüfen und zurückzugeben. Geben Sie den folgenden Befehl ein:

    scan 'Contacts'
    
  7. Verwenden Sie den Befehl get, um den Inhalt einer Zeile abzurufen. Geben Sie den folgenden Befehl ein:

    get 'Contacts', '1000'
    

    Sie erhalten ähnliche Ergebnisse wie mit dem Befehl scan, da nur eine Zeile vorhanden ist.

  8. Verwenden Sie den Befehl delete, um einen Zellenwert in einer Tabelle zu löschen. Geben Sie den folgenden Befehl ein:

    delete 'Contacts', '1000', 'Office:Address'
    
  9. Verwenden Sie den Befehl disable, um die Tabelle zu deaktivieren. Geben Sie den folgenden Befehl ein:

    disable 'Contacts'
    
  10. Verwenden Sie den Befehl drop, um eine Tabelle in HBase zu löschen. Geben Sie den folgenden Befehl ein:

    drop 'Contacts'
    
  11. Verwenden Sie den Befehl exit, um die interaktive HBase-Shell zu beenden. Geben Sie den folgenden Befehl ein:

    exit
    

Weitere Informationen zum HBase-Tabellenschema finden Sie unter Einführung in das Apache HBase-Schemadesign. Beschreibungen weiterer HBase-Befehle finden Sie im Apache HBase-Referenzhandbuch.

Bereinigen von Ressourcen

Nachdem Sie den Schnellstart abgeschlossen haben, können Sie den Cluster löschen. Mit HDInsight werden Ihre Daten im Azure-Speicher gespeichert, sodass Sie einen Cluster problemlos löschen können, wenn er nicht verwendet wird. Für einen HDInsight-Cluster fallen auch dann Gebühren an, wenn er nicht verwendet wird. Da die Gebühren für den Cluster erheblich höher sind als die Kosten für den Speicher, ist es sinnvoll, nicht verwendete Cluster zu löschen.

Informationen zum Löschen eines Clusters finden Sie unter Löschen eines HDInsight-Clusters mit Ihrem Browser, PowerShell oder der Azure CLI.

Nächste Schritte

In diesem Schnellstart haben Sie erfahren, wie Sie mit Apache HBase Shell HBase-Tabellen erstellen, Daten einfügen und dann die Tabelle abfragen. Im nächsten Artikel erfahren Sie, wie Sie Abfragen mit Apache Spark ausführen können, um mehr Informationen zu in HBase gespeicherten Daten zu erhalten.