Udostępnij przez


Szybki start: zapytania do Apache HBase w usłudze Azure HDInsight przy użyciu HBase Shell

W tym przewodniku szybkiego startu dowiecie się, jak w powłoce Apache HBase utworzyć tabelę HBase, wprowadzić dane, a następnie wykonać zapytanie względem tabeli.

Jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto.

Wymagania wstępne

Tworzenie tabeli i manipulowanie danymi

Dla większości użytkowników dane są wyświetlane w formacie tabelarycznym:

Dane tabelaryczne bazy danych Apache HBase w usłudze HDInsight.

W bazie danych HBase (implementacja rozwiązania Cloud BigTable) te same dane wyglądają następująco:

Dane Apache HBase BigTable w usłudze HDInsight.

Za pomocą protokołu SSH możesz nawiązać połączenie z klastrami HBase, a następnie użyć powłoki Apache HBase do tworzenia tabel HBase, wstawiania danych i wykonywania zapytań o dane.

  1. Użyj ssh polecenia , aby nawiązać połączenie z klastrem HBase. Zmodyfikuj poniższe polecenie, zastępując CLUSTERNAME nazwą twojego klastra, a następnie wykonaj polecenie.

    ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
    
  2. Aby uruchomić interaktywną powłokę HBase, użyj polecenia hbase shell. Wprowadź następujące polecenie w połączeniu SSH:

    hbase shell
    
  3. Użyj create polecenia , aby utworzyć tabelę HBase z dwiema rodzinami kolumn. Wprowadź następujące polecenie:

    create 'Contacts', 'Personal', 'Office'
    
  4. Użyj list polecenia , aby wyświetlić listę wszystkich tabel w bazie danych HBase. Wprowadź następujące polecenie:

    list
    
  5. Użyj put polecenia , aby wstawić wartości w określonej kolumnie w określonym wierszu w określonej tabeli. Wprowadź następujące polecenie:

    put 'Contacts', '1000', 'Personal:Name', 'John Dole'
    put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001'
    put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002'
    put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
    
  6. Użyj scan polecenia , aby skanować i zwracać Contacts dane tabeli. Wprowadź następujące polecenie:

    scan 'Contacts'
    
  7. Użyj get polecenia , aby pobrać zawartość wiersza. Wprowadź następujące polecenie:

    get 'Contacts', '1000'
    

    Wyniki są podobne jak w przypadku użycia scan polecenia , ponieważ istnieje tylko jeden wiersz.

  8. Użyj delete polecenia , aby usunąć wartość komórki w tabeli. Wprowadź następujące polecenie:

    delete 'Contacts', '1000', 'Office:Address'
    
  9. Użyj disable polecenia , aby wyłączyć tabelę. Wprowadź następujące polecenie:

    disable 'Contacts'
    
  10. Użyj drop polecenia , aby usunąć tabelę z bazy danych HBase. Wprowadź następujące polecenie:

    drop 'Contacts'
    
  11. Użyj polecenia exit, aby zatrzymać interaktywną powłokę HBase. Wprowadź następujące polecenie:

    exit
    

Aby uzyskać więcej informacji na temat schematu tabeli HBase, zobacz Wprowadzenie do projektu schematu bazy danych Apache HBase. Więcej poleceń bazy danych HBase można znaleźć w Podręczniku bazy danych Apache HBase.

Czyszczenie zasobów

Po ukończeniu procedury szybkiego startu możesz usunąć klaster. W usłudze HDInsight dane są przechowywane w usłudze Azure Storage, dzięki czemu można bezpiecznie usunąć klaster, gdy nie jest używany. Opłaty są również naliczane za klaster usługi HDInsight, nawet jeśli nie jest używany. Ponieważ opłaty za klaster są wielokrotnie większe niż opłaty za magazyn, warto usunąć klastry, gdy nie są używane.

Aby usunąć klaster, zobacz Usuwanie klastra usługi HDInsight przy użyciu przeglądarki, programu PowerShell lub interfejsu wiersza polecenia platformy Azure.

Następne kroki

W tym krótkim przewodniku nauczyłeś się, jak używać powłoki Apache HBase do tworzenia tabeli HBase, wstawiania danych, a następnie wyszukiwania w tabeli. Aby dowiedzieć się więcej o danych przechowywanych w bazie danych HBase, w następnym artykule przedstawiono sposób wykonywania zapytań za pomocą platformy Apache Spark.