Administración de clústeres de Apache Hadoop en HDInsight mediante Azure Portal
En Azure Portal, puede administrar clústeres de Apache Hadoop en Azure HDInsight. Use el selector de pestañas para obtener información sobre cómo administrar clústeres de Hadoop en HDInsight con otras herramientas.
Requisitos previos
Un clúster existente de Apache Hadoop en HDInsight. Consulte Crear clústeres basados en Linux en HDInsight con Azure Portal.
Introducción
Inicie sesión en https://portal.azure.com.
Enumeración y visualización de clústeres
En la página de clústeres de HDInsight se muestran los clústeres existentes. En el portal:
- En el menú izquierdo, seleccione Todos los servicios.
- Seleccione Clústeres de HDInsight en ANALYTICS.
Página principal del clúster
Seleccione el nombre del clúster en la página Clústeres de HDInsight. Se abre la vista de Información general, que se parece a la siguiente imagen:
Menú superior:
Elemento | Descripción |
---|---|
Move | mueve el clúster a otro grupo de recursos o a otra suscripción. |
Eliminar | elimina el clúster. |
Actualizar | Actualiza la vista. |
Menú de la izquierda:
Menú de la parte superior izquierda
Elemento Descripción Información general proporciona información general del clúster. Registro de actividades muestra y consulta los registros de actividad. Control de acceso (IAM) usa asignaciones de roles. Consulte Asignación de roles de Azure mediante Azure Portal. Etiquetas las etiquetas permiten establecer pares clave-valor para definir una taxonomía personalizada de Cloud Services. Por ejemplo, puede crear una clave denominada proyectoy luego usar un valor común para todos los servicios asociados a un proyecto específico. Diagnosticar y solucionar problemas muestra información de solución de problemas. Guía de inicio rápido muestra información que lo ayuda a empezar a usar HDInsight. Herramientas información de ayuda para herramientas relacionadas con HDInsight. Menú Configuración
Elemento Descripción Tamaño del clúster comprueba, aumenta o reduce el número de nodos de trabajo del clúster. Consulte Escalado de clústeres. Límites de cuota muestra los núcleos utilizados y disponibles de la suscripción. SSH e inicio de sesión del clúster muestra las instrucciones para conectarse al clúster mediante la conexión de Secure Shell (SSH). Para más información, consulte Uso SSH con HDInsight. Data Lake Storage Gen2 Configure el acceso a Data Lake Storage Gen2. Consulte Quickstart: Configuración de clústeres en HDInsight. Cuentas de almacenamiento muestra las cuentas de almacenamiento y las claves. Las cuentas de almacenamiento se configuran durante el proceso de creación del clúster. APLICACIONES agrega o quita aplicaciones de HDInsight. Vea Instalación de aplicaciones de HDInsight personalizadas. Acciones de script ejecuta scripts de Bash en el clúster. Consulte Personalización de clústeres de HDInsight mediante la acción de scripts (Linux). Tiendas de metadatos externas consulte las tiendas de metadatos de Apache Hive y Apache Oozie. Las tiendas de metadatos solo pueden configurarse durante el proceso de creación del clúster. Asociado de HDInsight agrega o quita el asociado de HDInsight actual. Propiedades vea las propiedades del clúster. Bloqueos agrega bloqueos para evitar la modificación o eliminación del clúster. Exportación de la plantilla muestra y exporta la plantilla de Azure Resource Manager para el clúster. Actualmente, solo se puede exportar la cuenta de Azure Storage dependiente. Consulte Creación de clústeres de Apache Hadoop basados en Linux en HDInsight con plantillas de Azure Resource Manager. Menú Supervisión
Elemento Descripción Alertas administra las alertas y acciones. Métricas Supervise las métricas del clúster en los registros de Azure Monitor. Configuración de diagnóstico configuración donde almacenar las métricas de diagnóstico. Azure Monitor Supervise el clúster en Azure Monitor Menú Soporte y solución de problemas
Elemento Descripción Estado de los recursos consulte Introducción a Azure Resource Health. Nueva solicitud de soporte permite crear una incidencia de soporte técnico con el soporte técnico de Microsoft.
Propiedades de clúster
En la página principal del clúster, en Configuración, seleccione Propiedades.
Elemento | Descripción |
---|---|
NOMBRE DE HOST | Nombre del clúster. |
DIRECCIÓN URL DEL CLÚSTER | La dirección URL para la interfaz web de Ambari. |
Punto de conexión privado | El punto de conexión privado del clúster. |
Secure Shell (SSH) | el nombre de usuario y el nombre de host que se usarán para acceder al clúster mediante SSH. |
STATUS | Uno de: Aborted, Accepted, ClusterStorageProvisioned, AzureVMConfiguration, HDInsightConfiguration, Operational, Running, Error, Deleting, Deleted, Timeout, DeleteQueued, DeleteTimeout, DeleteError, PatchQueued, CertRolloverQueued, ResizeQueued o ClusterCustomization. |
REGIÓN | ubicación de Azure. Para ver una lista de ubicaciones de Azure admitidas, consulte el cuadro de lista desplegable Región en Precios de HDInsight. |
FECHA DE CREACIÓN | la fecha en que se implementó el clúster. |
SISTEMA OPERATIVO | Windows o Linux. |
TYPE | Hadoop, HBase, Spark. |
Versión | Consulte Versiones de HDInsight. |
Versión de TLS mínima | Versión de TLS. |
SUSCRIPCIÓN | el nombre de la suscripción. |
ORIGEN DE DATOS PREDETERMINADO | el sistema de archivos predeterminado del clúster. |
Tamaño de los nodos de trabajo | el tamaño de máquina virtual seleccionado de los nodos de trabajo. |
Tamaño del nodo principal | el tamaño de máquina virtual seleccionado de los nodos principales. |
Virtual network | El nombre de la red virtual en la que se implementa el clúster (en caso de haber seleccionado uno durante la implementación). |
Mover clústeres
Puede mover un clúster de HDInsight a otro grupo de recursos de Azure u otra suscripción.
En la página principal del clúster:
- Seleccione Mover en el menú superior.
- Seleccione Mover a otro grupo de recursos o Mover a otra suscripción.
- Siga las instrucciones de la nueva página.
Eliminación de clústeres
Al eliminar un clúster, no se elimina la cuenta de almacenamiento predeterminada ni otras cuentas de almacenamiento vinculadas. Puede volver a crear el clúster con las mismas cuentas de almacenamiento y las mismas tiendas de metadatos. Se recomienda usar un nuevo contenedor de blobs predeterminado cuando vuelva a crear el clúster.
En la página principal del clúster:
- Seleccione Eliminar en el menú.
- Siga las instrucciones de la nueva página.
Vea también Pausa o apagado de clústeres.
Adición de cuentas de almacenamiento adicionales
Después de crear el clúster, puede agregar más cuentas de Azure Storage y cuentas de Azure Data Lake Storage. Para más información, consulte Adición de más cuentas de almacenamiento a HDInsight.
Escalado de clústeres
La característica de escalado de clústeres permite cambiar el número de nodos de trabajo que usa un clúster de Azure HDInsight sin necesidad de volver a crear el clúster.
Consulte Escalabilidad de clústeres de HDInsight para tener información completa.
Pausa o apagado de clústeres
La mayoría de los trabajos de Hadoop son trabajos por lotes que se ejecutan solo ocasionalmente. En la mayoría de los clústeres de Hadoop, hay grandes períodos de tiempo en los que el clúster no se usa para el procesamiento. Con HDInsight, los datos se almacenan en Azure Storage, por lo que puede eliminar un clúster de forma segura cuando no se esté usando. Los clústeres de HDInsight se cobran aunque no se estén usando. Como en muchas ocasiones los cargos por el clúster son mucho más elevados que los cargos por el almacenamiento, desde el punto de vista económico tiene sentido eliminar clústeres cuando no se usen.
Hay muchas maneras de programar el proceso:
- Usar Azure Data Factory. Consulte Creación de clústeres de Apache Hadoop basados en Linux en HDInsight a petición con Azure Data Factory para crear servicios vinculados a HDInsight a petición.
- Usar Azure PowerShell. Vea Análisis de datos de retrasos de vuelos.
- Uso de CLI de Azure. Consulte Administración de clústeres de Azure HDInsight mediante la CLI de Azure.
- Usar .NET SDK de HDInsight. Consulte Envío de trabajos de Apache Hadoop.
Para información sobre precios, vea Precios de HDInsight. Para eliminar un clúster desde el portal, vea Eliminación de clústeres
Actualización de clústeres
Vea Actualización del clúster de HDInsight a una versión más reciente.
Apertura de la interfaz de usuario web de Apache Ambari
Ambari proporciona una intuitiva y sencilla interfaz de usuario web de administración de Hadoop respaldada por sus API RESTful. Ambari permite a los administradores de sistema administrar y supervisar clústeres de Hadoop.
En la página principal del clúster:
Seleccione Paneles de clúster.
Seleccione Inicio de Ambari en la nueva página.
Escriba el nombre de usuario y la contraseña del clúster. El nombre de usuario predeterminado del clúster es admin.
Para obtener más información, consulte Administración de clústeres de HDInsight con la interfaz de usuario web de Apache Ambari.
Cambio de contraseñas
Un clúster de HDInsight puede tener dos cuentas de usuario. La cuenta de usuario del clúster de HDInsight (cuenta de usuario HTTP) y la cuenta de usuario de SSH se crean durante el proceso de creación. Puede usar el portal para cambiar la contraseña de la cuenta de usuario del clúster, y las acciones de script para cambiar la cuenta de usuario de SSH.
Cambio de la contraseña de usuario del clúster
Nota
El cambio de la contraseña de usuario (admin) del clúster puede provocar que las acciones de script que se ejecutan en este clúster no lo hagan correctamente. Si tiene cualquier acción de script persistente cuyo destino son nodos de trabajo, estos scripts pueden producir un error al agregar nodos al clúster a través de operaciones de cambio de tamaño. Para más información sobre acciones de script, consulte Personalización de clústeres de HDInsight mediante la acción de scripts (Linux).
En la página principal del clúster:
- Seleccione SSH + Cluster login (SSH e inicio de sesión del clúster) en Configuración.
- Seleccione Restablecer credenciales.
- Escriba y confirme la nueva contraseña en los cuadros de texto.
- Seleccione Aceptar.
La contraseña se cambia en todos los nodos del clúster.
Cambio de la contraseña de usuario o la clave pública de SSH
Con un editor de texto, guarde el texto siguiente como un archivo llamado changecredentials.sh.
Importante
Debe utilizar un editor que use LF como final de líneas. Si el editor utiliza CRLF, el script no funcionará.
#! /bin/bash USER=$1 PASS=$2 usermod --password $(echo $PASS | openssl passwd -1 -stdin) $USER
Cargue el archivo en una ubicación de almacenamiento a la que pueda accederse desde HDInsight con una dirección HTTP o HTTPS. Por ejemplo, un almacén de archivos público como OneDrive o Almacenamiento de blobs de Azure. Guarde el identificador URI (dirección HTTP o HTTPS) en el archivo, ya que este URI se necesitará en el paso siguiente.
En la página principal del clúster, seleccione Acciones de script en Configuración.
En la página Acciones de script, seleccione Enviar nuevo.
En la página Enviar acción de script, escriba la siguiente información:
Nota
Las contraseñas SSH no pueden contener los siguientes caracteres:
" ' ` / \ < % ~ | $ & ! #
Campo | Value |
---|---|
Tipo de script | Seleccione - Personalizado en la lista desplegable. |
Nombre | "Change ssh credentials" |
URI de script de Bash | El URI para el archivo changecredentials.sh |
Tipos de nodo: (principal, de trabajo, nimbus, supervisor, zookeeper, etc.) | ✓ para todos los tipos de nodo indicados |
Parámetros | Escriba el nombre de usuario de SSH y la contraseña nueva. Debe haber un espacio entre el nombre de usuario y la contraseña. |
Conservar esta acción de script... | Deje este campo en sin activar. |
- Seleccione Crear para aplicar el script. Una vez que finalice el script, puede conectarse al clúster mediante SSH con las nuevas credenciales.
Búsqueda del identificador de la suscripción
Cada clúster está asociado a una suscripción de Azure. El identificador de la suscripción de Azure es visible desde la página principal del clúster.
Búsqueda del grupo de recursos
En el modo de Azure Resource Manager, cada clúster de HDInsight se crea con un grupo de Azure Resource Manager. El grupo de Resource Manager es visible desde la página principal del clúster.
Búsqueda de las cuentas de almacenamiento
Los clústeres de HDInsight usan una cuenta de Azure Storage o Azure Data Lake Storage para almacenar los datos. Cada clúster de HDInsight puede tener una cuenta de almacenamiento predeterminada y una serie de cuentas de almacenamiento vinculadas. Para enumerar las cuentas de almacenamiento, en la página principal del clúster, en Configuración, seleccione Cuentas de almacenamiento.
Supervisión de trabajos
Consulte Administración de clústeres de HDInsight con la interfaz de usuario web de Apache Ambari.
Tamaño del clúster
El icono Tamaño del clúster de la página principal del clúster muestra el número de núcleos asignados a este clúster y cómo se asignan a los nodos de este clúster.
Importante
Para supervisar los servicios que proporciona el clúster de HDInsight, debe usar la web de Ambari o la API de REST de Ambari. Para más información sobre el uso de Ambari, consulte Administración de clústeres de HDInsight con Apache Ambari.
Conectarse a un clúster
Pasos siguientes
En este artículo ha aprendido algunas funciones administrativas básicas. Para más información, vea los siguientes artículos:
- Administración de HDInsight con PowerShell de Azure
- Administración de HDInsight con la CLI de Azure
- Creación de clústeres de HDInsight
- Detalles sobre el uso de la API REST de Apache Ambari
- Uso de Apache Hive en HDInsight
- Uso de Apache Sqoop en HDInsight
- Uso de funciones definidas por el usuario (UDF) de Python con Apache Hive y Apache Pig en HDInsight
- ¿Qué versión de Apache Hadoop tiene en Azure HDInsight?