Compartir vía


Inicio rápido: Consulta de Apache HBase en Azure HDInsight con el shell de HBase

En este inicio rápido, aprenderá a usar el shell de Apache HBase para crear una tabla de HBase, insertar datos y, luego, consultar la tabla.

Si no tiene una suscripción a Azure, cree una cuenta gratuita antes de empezar.

Requisitos previos

Creación de una tabla y manipulación de los datos

Para la mayoría de las personas, los datos aparecen en formato tabular:

HDInsight Apache HBase tabular data.

En HBase (una implementación de Cloud BigTable), los mismos datos tienen un aspecto similar al siguiente:

HDInsight Apache HBase BigTable data.

Puede usar SSH para conectarse a clústeres de HBase y, después, usar el shell de Apache HBase para crear tablas de HBase e insertar y consultar datos.

  1. Use el comando ssh para conectarse al clúster de HBase. Modifique el comando siguiente: reemplace CLUSTERNAME por el nombre del clúster y, luego, escriba el comando:

    ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
    
  2. Use el comando hbase shell para iniciar el shell interactivo de HBase. Escriba el siguiente comando en la conexión SSH:

    hbase shell
    
  3. Use el comando create para crear una tabla de HBase con dos familias de columnas. Escriba el comando siguiente:

    create 'Contacts', 'Personal', 'Office'
    
  4. Use el comando list para mostrar todas las tablas de HBase. Escriba el comando siguiente:

    list
    
  5. Use el comando put para insertar valores en una columna especificada en una fila especificada de una tabla determinada. Escriba el comando siguiente:

    put 'Contacts', '1000', 'Personal:Name', 'John Dole'
    put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001'
    put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002'
    put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
    
  6. Use el comando scan para buscar y devolver los datos de tabla Contacts. Escriba el comando siguiente:

    scan 'Contacts'
    
  7. Use el comando get para capturar el contenido de una fila. Escriba el comando siguiente:

    get 'Contacts', '1000'
    

    Observará que los resultados son similares al uso del comando scan porque solo hay una fila.

  8. Use el comando delete para eliminar un valor de celda de una tabla. Escriba el comando siguiente:

    delete 'Contacts', '1000', 'Office:Address'
    
  9. Use el comando disable para deshabilitar la tabla. Escriba el comando siguiente:

    disable 'Contacts'
    
  10. Use el comando drop para quitar una tabla de HBase. Escriba el comando siguiente:

    drop 'Contacts'
    
  11. Use el comando exit para detener el shell interactivo de HBase. Escriba el comando siguiente:

    exit
    

Para más información sobre el esquema de tabla de HBase, consulte Introduction to Apache HBase Schema Design (Introducción al diseño de esquema de Apache HBase). Para ver más comandos de HBase, consulte Guía de referencia de Apache HBase.

Limpieza de recursos

Después de completar el inicio rápido, puede ser conveniente eliminar el clúster. Con HDInsight, los datos se almacenan en Azure Storage, por lo que puede eliminar un clúster de forma segura cuando no se esté usando. También se le cobrará por un clúster de HDInsight aunque no se esté usando. Como en muchas ocasiones los cargos por el clúster son mucho más elevados que los cargos por el almacenamiento, desde el punto de vista económico tiene sentido eliminar clústeres cuando no se estén usando.

Para eliminar un clúster, consulte Eliminación de un clúster de HDInsight con el explorador, PowerShell o la CLI de Azure.

Pasos siguientes

En este inicio rápido, aprendió a usar el shell de Apache HBase para crear una tabla de HBase, insertar datos y, luego, consultar la tabla. Para más información sobre los datos almacenados en HBase, en el siguiente artículo se muestra cómo ejecutar consultas con Apache Spark.