Schnellstart: Abfragen von Apache HBase in Azure HDInsight mit HBase Shell
In diesem Schnellstart erfahren Sie, wie Sie mit Apache HBase Shell HBase-Tabellen erstellen, Daten einfügen und dann die Tabelle abfragen.
Wenn Sie kein Azure-Abonnement besitzen, können Sie ein kostenloses Konto erstellen, bevor Sie beginnen.
Voraussetzungen
Ein Apache HBase-Cluster. Weitere Informationen zum Erstellen eines HDInsight-Clusters finden Sie unter Erstellen von Clustern. Stellen Sie sicher, dass Sie den Clustertyp HBase auswählen.
Einen SSH-Client. Weitere Informationen finden Sie unter Herstellen einer Verbindung mit HDInsight (Hadoop) per SSH.
Erstellen einer Tabelle und Bearbeiten von Daten
Den meisten Benutzern werden die Daten im Tabellenformat angezeigt:
In HBase (eine Implementierung von Cloud BigTable) sehen die gleichen Daten wie folgt aus:
Sie können SSH verwenden, um eine Verbindung mit Apache HBase-Clustern herzustellen, und dann mithilfe von Apache HBase Shell HBase-Tabellen erstellen, Daten einfügen und Daten abfragen.
Verwenden Sie zum Herstellen der Verbindung mit Ihrem HBase-Cluster
ssh
. Bearbeiten Sie den unten angegebenen Befehl, indem SieCLUSTERNAME
durch den Namen Ihres Clusters ersetzen, und geben Sie den Befehl dann ein:ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
Verwenden Sie den Befehl
hbase shell
, um die interaktive HBase-Shell zu starten. Geben Sie den folgenden Befehl in Ihrer SSH-Verbindung ein:hbase shell
Verwenden Sie den Befehl
create
, um eine HBase-Tabelle mit zwei Spaltenfamilien zu erstellen. Geben Sie den folgenden Befehl ein:create 'Contacts', 'Personal', 'Office'
Verwenden Sie den Befehl
list
, um alle Tabellen in HBase aufzulisten. Geben Sie den folgenden Befehl ein:list
Verwenden Sie den Befehl
put
, um Werte in einer angegebenen Spalte einer angegebenen Zeile in einer bestimmten Tabelle einzufügen. Geben Sie den folgenden Befehl ein:put 'Contacts', '1000', 'Personal:Name', 'John Dole' put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001' put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002' put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
Verwenden Sie den Befehl
scan
, um die Daten der TabelleContacts
zu überprüfen und zurückzugeben. Geben Sie den folgenden Befehl ein:scan 'Contacts'
Verwenden Sie den Befehl
get
, um den Inhalt einer Zeile abzurufen. Geben Sie den folgenden Befehl ein:get 'Contacts', '1000'
Sie erhalten ähnliche Ergebnisse wie mit dem Befehl
scan
, da nur eine Zeile vorhanden ist.Verwenden Sie den Befehl
delete
, um einen Zellenwert in einer Tabelle zu löschen. Geben Sie den folgenden Befehl ein:delete 'Contacts', '1000', 'Office:Address'
Verwenden Sie den Befehl
disable
, um die Tabelle zu deaktivieren. Geben Sie den folgenden Befehl ein:disable 'Contacts'
Verwenden Sie den Befehl
drop
, um eine Tabelle in HBase zu löschen. Geben Sie den folgenden Befehl ein:drop 'Contacts'
Verwenden Sie den Befehl
exit
, um die interaktive HBase-Shell zu beenden. Geben Sie den folgenden Befehl ein:exit
Weitere Informationen zum HBase-Tabellenschema finden Sie unter Einführung in das Apache HBase-Schemadesign. Beschreibungen weiterer HBase-Befehle finden Sie im Apache HBase-Referenzhandbuch.
Bereinigen von Ressourcen
Nachdem Sie den Schnellstart abgeschlossen haben, können Sie den Cluster löschen. Mit HDInsight werden Ihre Daten im Azure-Speicher gespeichert, sodass Sie einen Cluster problemlos löschen können, wenn er nicht verwendet wird. Für einen HDInsight-Cluster fallen auch dann Gebühren an, wenn er nicht verwendet wird. Da die Gebühren für den Cluster erheblich höher sind als die Kosten für den Speicher, ist es sinnvoll, nicht verwendete Cluster zu löschen.
Informationen zum Löschen eines Clusters finden Sie unter Löschen eines HDInsight-Clusters mit Ihrem Browser, PowerShell oder der Azure CLI.
Nächste Schritte
In diesem Schnellstart haben Sie erfahren, wie Sie mit Apache HBase Shell HBase-Tabellen erstellen, Daten einfügen und dann die Tabelle abfragen. Im nächsten Artikel erfahren Sie, wie Sie Abfragen mit Apache Spark ausführen können, um mehr Informationen zu in HBase gespeicherten Daten zu erhalten.