Quickstart: Query's uitvoeren op Apache HBase in Azure HDInsight met HBase Shell
In deze quickstart leert u hoe u Apache HBase Shell kunt gebruiken om een HBase-tabel te maken, gegevens in te voegen en een query uit te voeren op de tabel.
Als u geen Azure-abonnement hebt, maakt u een gratis account voordat u begint.
Vereisten
Een Apache HBase-cluster. Raadpleeg Cluster maken voor het maken van een HDInsight-cluster. Zorg ervoor dat u het clustertype HBase kiest.
Een SSH-client. Zie voor meer informatie Verbinding maken met HDInsight (Apache Hadoop) via SSH.
Een tabel maken en gegevens bewerken
Voor de meeste mensen worden de gegevens weergegeven in een tabelindeling:
In HBase (een implementatie van Cloud BigTable) zien dezelfde gegevens er als volgt uit:
U kunt SSH gebruiken om verbinding te maken met HBase-clusters, en vervolgens Apache HBase Shell gebruiken om HBase-tabellen te maken, gegevens in te voegen en gegevens te doorzoeken.
Gebruik de opdracht
ssh
om verbinding te maken met uw HBase-cluster. Bewerk de onderstaande opdracht doorCLUSTERNAME
te vervangen door de naam van uw cluster.Voer vervolgens deze opdracht in:ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
Gebruik de opdracht
hbase shell
om de interactieve HBase-shell te starten. Voer de volgende opdracht in uw SSH-verbinding in:hbase shell
Gebruik de opdracht
create
om een HBase-tabel met twee kolomfamilies te maken. Voer de volgende opdracht in:create 'Contacts', 'Personal', 'Office'
Gebruik de opdracht
list
om alle tabellen in HBase weer te geven. Voer de volgende opdracht in:list
Gebruik de opdracht
put
om in een opgegeven rij in een bepaalde tabel waarden in te voegen voor een opgegeven kolom. Voer de volgende opdracht in:put 'Contacts', '1000', 'Personal:Name', 'John Dole' put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001' put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002' put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
Gebruik de opdracht
scan
om deContacts
-tabelgegevens te scannen en te retourneren. Voer de volgende opdracht in:scan 'Contacts'
Gebruik de opdracht
get
om de inhoud van een rij op te halen. Voer de volgende opdracht in:get 'Contacts', '1000'
U ziet soortgelijke resultaten als bij de opdracht
scan
, omdat er maar één rij is.Gebruik de opdracht
delete
om een celwaarde in een tabel te verwijderen. Voer de volgende opdracht in:delete 'Contacts', '1000', 'Office:Address'
Gebruik de opdracht
disable
om de tabel uit te schakelen. Voer de volgende opdracht in:disable 'Contacts'
Gebruik de opdracht
drop
om een tabel uit HBase neer te zetten. Voer de volgende opdracht in:drop 'Contacts'
Gebruik de opdracht
exit
om de interactieve HBase-shell te stoppen. Voer de volgende opdracht in:exit
Zie Inleiding tot het Apache HBase-schemaontwerp voor meer informatie over het HBase-tabelschema. Raadpleeg de Snelzoekgids voor Apache HBase voor meer HBase-opdrachten.
Resources opschonen
Nadat u de quickstart hebt voltooid, kunt u het cluster verwijderen. Met HDInsight worden uw gegevens opgeslagen in Azure Storage zodat u een cluster veilig kunt verwijderen wanneer deze niet wordt gebruikt. Voor een HDInsight-cluster worden ook kosten in rekening gebracht, zelfs wanneer het niet wordt gebruikt. Aangezien de kosten voor het cluster vaak zoveel hoger zijn dan de kosten voor opslag, is het financieel gezien logischer clusters te verwijderen wanneer ze niet worden gebruikt.
Als u een cluster wilt verwijderen, raadpleegt u HDInsight-cluster verwijderen met behulp van uw browser, PowerShell of de Azure CLI.
Volgende stappen
In deze quickstart hebt u geleerd hoe u Apache HBase Shell kunt gebruiken om een HBase-tabel te maken, gegevens in te voegen en een query uit te voeren op de tabel. Meer informatie over in HBase opgeslagen gegevens vindt u in het volgende artikel. Hierin wordt uitgelegd hoe u query's kunt uitvoeren met Apache Spark.