Creación de clústeres basados en Linux en HDInsight mediante Azure Portal
El Portal de Azure es una herramienta de administración basada en web para servicios y recursos hospedados en la nube de Microsoft Azure. En este artículo aprenderá a crear clústeres de Azure HDInsight basados en Linux mediante el portal. Puede encontrar más detalles en Creación de clústeres de HDInsight.
Advertencia
La facturación de los clústeres de HDInsight se prorratea por minuto, tanto si se usan como si no. Por consiguiente, asegúrese de eliminar el clúster cuando termine de usarlo. Consulte Eliminación de un clúster de HDInsight.
El Portal de Azure expone la mayor parte de las propiedades del clúster. Mediante las plantillas de Azure Resource Manager puede ocultar una gran cantidad de detalles. Para más información, consulte Creación de clústeres de Apache Hadoop en HDInsight con plantillas de Resource Manager.
Si no tiene una suscripción a Azure, cree una cuenta gratuita antes de empezar.
Creación de clústeres
Nota
La característica que requiere una transferencia segura aplica todas las solicitudes a su cuenta mediante una conexión segura. Esta característica solo es compatible con la versión de clúster de HDInsight 3.6 o posterior. Para más información, consulte Creación de un clúster de Apache Hadoop con cuentas de almacenamiento de transferencia segura en Azure HDInsight.
Inicie sesión en Azure Portal.
En el menú superior, seleccione + Crear un recurso.
Seleccione Analytics>Azure HDInsight para ir a la página Crear clúster de HDInsight.
Aspectos básicos
En la pestaña Básico, especifique la siguiente información:
Propiedad | Descripción |
---|---|
Subscription | En la lista desplegable, seleccione la suscripción de Azure que se usa para el clúster. |
Resource group | En la lista desplegable, seleccione el grupo de recursos existente o seleccione Crear. |
Nombre del clúster | Escriba un nombre único global. |
Region | En la lista desplegable, seleccione una región donde crear el clúster. |
Zona de disponibilidad | Opcionalmente, puede especificar una zona de disponibilidad en la que implementar el clúster. |
Tipo de clúster | Haga clic en Seleccionar tipo de clúster para abrir una lista. En la lista, seleccione el tipo de clúster que desee. Los clústeres de HDInsight se presentan en distintos tipos. Estos corresponden a la carga de trabajo o la tecnología para los que el clúster está optimizado. No hay ningún método compatible para crear un clúster que combine varios tipos. |
Versión | En la lista desplegable, seleccione una versión. Use la versión predeterminada si no sabe qué opción elegir. Para obtener más información, consulte Versiones de clústeres de HDInsight. |
Nombre de usuario de inicio de sesión del clúster | Proporcione el nombre de usuario; el valor predeterminado es admin. |
Contraseña de inicio de sesión de clúster | Proporcione la contraseña. |
Confirmar la contraseña de inicio de sesión del clúster | Reescriba la contraseña. |
Nombre de usuario de Secure Shell (SSH) | Proporcione el nombre de usuario; el valor predeterminado es sshuser. |
Uso de la contraseña de inicio de sesión del clúster para SSH | Si desea la misma contraseña de SSH que la contraseña de administrador que especificó anteriormente, active la casilla Usar la contraseña de inicio de sesión del clúster para SSH. De no ser así, especifique una CONTRASEÑA o CLAVE PÚBLICA para autenticar al usuario de SSH. Es recomendable usar una clave pública. Elija Seleccionar en la parte inferior para guardar la configuración de las credenciales. Para más información, consulte Connect to HDInsight (Apache Hadoop) by using SSH (Conexión a través de SSH con HDInsight [Apache Hadoop]). |
Seleccione Siguiente: Almacenamiento >> para avanzar a la pestaña siguiente.
Storage
Advertencia
A partir del 15 de junio de 2020 los clientes no podrán crear una nueva entidad de servicio mediante HDInsight. Consulte Creación de una entidad de servicio y certificados mediante Microsoft Entra ID.
Almacenamiento principal
En la lista desplegable de Tipo de almacenamiento principal, seleccione el tipo de almacenamiento predeterminado. Los campos siguientes que va a completar variarán en función de la selección. Para Azure Storage:
En Método de selección, elija Seleccionar un elemento de la lista o Usar clave de acceso.
- En Seleccionar un elemento de la lista, seleccione la Cuenta de almacenamiento principal en la lista desplegable o seleccione Crear.
- En Usar clave de acceso, escriba su Nombre de la cuenta de almacenamiento. A continuación, proporcione la Clave de acceso.
En Contenedor, acepte el valor predeterminado o escriba uno nuevo.
Azure Storage adicional
Opcional: Seleccione Agregar Azure Storage para un almacenamiento de clúster adicional. No se admite el uso de una cuenta de almacenamiento adicional en una región diferente a la del clúster de HDInsight.
Configuración de metastores
Opcional: Especifique una instancia existente de SQL Database para guardar los metadatos de Apache Hive, Apache Oozie o Apache Ambari fuera del clúster. La instancia de Azure SQL Database usada para el metastore debe permitir la conectividad con otros servicios de Azure, incluido Azure HDInsight. Al crear una instancia de Metastore, no asigne nombre a una base de datos con guiones. Estos caracteres podrían provocar que el proceso de creación del clúster produzca errores.
Importante
En el caso de las formas de clúster que admiten metastores, el metastore predeterminado proporciona una instancia de Azure SQL Database con un límite de 5 DTU de nivel básico (no actualizable) . Esto resulta adecuado para la realización de pruebas básicas. En el caso de las cargas de trabajo de producción o de gran volumen, se recomienda migrar a un metastore externo.
Seleccione Seguridad y redes >> para avanzar a la pestaña siguiente.
Seguridad y redes
En la pestaña Seguridad y redes, especifique la información siguiente:
Propiedad | Descripción |
---|---|
Paquete de seguridad de la empresa | Opcional: Active la casilla para usar Enterprise Security Package. Para más información, consulte Configuración de clúster de HDInsight con Enterprise Security Package mediante Microsoft Entra Domain Services. |
TLS | Opcional: Seleccione una versión de TLS de la lista desplegable. Para más información, consulte Seguridad de la capa de transporte. |
Virtual network | Opcional: Seleccione una red virtual y una subred existentes de la lista desplegable. Para obtener más información, consulte Planeamiento de la implementación de una red virtual para clústeres de Azure HDInsight. El artículo incluye los requisitos de configuración específicos de la red virtual. |
Configuración de cifrado de disco | Opcional: Active la casilla para usar el cifrado. Para obtener más información, consulte Cifrado de disco mediante claves administradas por el cliente. |
Proxy de REST de Kafka | Esta opción solo está disponible para el tipo de clúster Kafka. Para más información, consulte Uso de un proxy de REST. |
Identidad | Opcional: Seleccione una identidad de servicio asignada por el usuario existente de la lista desplegable. Para obtener más información, consulte Identidades administradas en Azure HDInsight. |
Seleccione Siguiente: Configuración y precios >> para avanzar a la pestaña siguiente.
Configuración y precios
En la pestaña Configuración y precios, especifique la información siguiente:
Propiedad | Descripción |
---|---|
+ Agregar aplicación | Opcional: Seleccione las aplicaciones que desee. De Microsoft, de proveedores de software independientes (ISV) o también puede desarrollarlas. Para más información, consulte Instalación de aplicaciones durante la creación del clúster. |
Tamaño del nodo | Opcional: Seleccione un nodo de otro tamaño. |
Número de nodos | Opcional: Especifique el número de nodos para el tipo de nodo especificado. Si planea crear más de 32 nodos de trabajo, seleccione un tamaño de nodo principal con al menos ocho núcleos y 14 GB de RAM. Planee los nodos al crear el clúster o mediante el escalado del clúster después de la creación. |
Habilitar escalado automático | Opcional: Active la casilla para habilitar la característica. Para más información, consulte Escalado automático de clústeres de Azure HDInsight. |
+ Agregar acción de script | Opcional: Esta opción funciona si quiere usar un script personalizado para personalizar un clúster, conforme se crea el clúster. Para más información sobre las acciones de script, consulte Personalización de clústeres de HDInsight basados en Linux mediante acciones de script. |
Seleccione Revisar y crear >> para validar la configuración del clúster y avanzar a la pestaña final.
Etiquetas
En la página Etiquetas, proporcione la siguiente información:
Propiedad | Descripción |
---|---|
Nombre | Opcional. Escriba un nombre de su elección para identificar fácilmente todos los recursos. |
Valor | Déjelo en blanco. |
Resource | Seleccione Todos los recursos. |
Revisar y crear
Revise la configuración. Seleccione Crear para crear el clúster.
El clúster tarda algo de tiempo en crearse, normalmente unos 20 minutos. Supervise las notificaciones para comprobar el proceso de aprovisionamiento.
Después de la creación
Una vez completado el proceso de creación, seleccione Ir al recurso en la notificación Implementación correcta. La ventana del clúster ofrece la siguiente información.
Algunos de los iconos de la ventana se explican de la siguiente manera:
Propiedad | Descripción |
---|---|
Información general | Proporciona toda la información esencial sobre el clúster. Algunos ejemplos son el nombre, el grupo de recursos al que pertenece, la ubicación, el sistema operativo y la dirección URL del panel del clúster. |
Paneles de clúster | Le dirige al portal de Ambari asociado al clúster. |
SSH e inicio de sesión del clúster | Proporciona la información necesaria para acceder al clúster mediante SSH. |
Eliminar | Elimina el clúster de HDInsight. |
Eliminación del clúster
Consulte Eliminación de un clúster de HDInsight con el explorador, PowerShell o la CLI de Azure.
Solución de problemas
Si experimenta problemas con la creación de clústeres de HDInsight, consulte los requisitos de control de acceso.
Pasos siguientes
Ha creado correctamente un clúster de HDInsight. Ahora puede aprender a trabajar con el clúster.