Compartir a través de


Solución de problemas de instalación de la extensión del agente de nodo de proceso de Linux con errores

En este artículo se describe cómo solucionar un escenario en el que la extensión del agente de nodo linux de HPC Pack no se instala correctamente en un nodo de un clúster de informática de alto rendimiento (HPC).

Lista de comprobación para la solución de problemas

Para solucionar problemas de una instalación errónea de la extensión Microsoft.HpcPack.LinuxNodeAgent2016U1 en un nodo de proceso de Linux, examine el archivo de registro de extensión y, a continuación, instale un nuevo nodo de proceso linux en una máquina virtual (VM) de infraestructura como servicio (IaaS).

Paso 1: Examinar el registro de extensiones

El archivo de registro de extensiones podría ayudarle a determinar por qué el agente de nodo no se instaló correctamente. Para buscar y ver el archivo de registro de extensiones, siga estos pasos:

  1. Abra una consola de administración de PowerShell.

  2. Ejecute los siguientes comandos para habilitar la característica de conexión de Secure Shell (SSH) en el nodo principal:

    dism /Online /Add-Capability /CapabilityName:OpenSSH.Server~~~~0.0.1.0
    Start-Service sshd
    Set-Service -Name sshd -StartupType 'Automatic'
    Set-Service -Name ssh-agent -StartupType 'Automatic'
    Start-Service ssh-agent
    
  3. En el nodo principal, ejecute el siguiente comando para iniciar sesión en el nodo de proceso de Linux:

    ssh <domain-administrator-name>@<private-ip-address-of-linux-compute-node>
    
  4. Escriba la contraseña de la cuenta del administrador de dominio.

  5. Ejecute el siguiente comando para comprobar que el archivo de registro de extensión existe en el nodo:

    sudo su ls -la /var/log/azure/Microsoft.HpcPack.LinuxNodeAgent2016U1/extension.log
    
  6. Ejecute o abra el editor o visor de texto que prefiera y, a continuación, muestre el contenido del archivo de registro de extensión.

Paso 2: Realizar una prueba local para expandir a una máquina virtual IaaS

Para probar localmente cómo expandir a una máquina virtual IaaS, siga estos pasos:

  1. Siga los pasos para crear una plantilla de nodo de IaaS de Azure. Cuando llegue a la sección Especificar imagen de máquina virtual del Asistente para la creación de plantillas, especifique la siguiente configuración antes de terminar de crear la plantilla de nodo.

    Nombre del campo Valor
    Tipo de imagen MarketplaceImage
    Tipo de sistema operativo Linux
    Etiqueta de imagen Red Hat Enterprise Linux 7.8
  2. Siga los pasos para crear los nodos de proceso de IaaS y administrarlos. Cuando llegue a la sección Especificar nuevos nodos del Asistente para agregar nodo, especifique la siguiente configuración antes de terminar de agregar el nodo.

    Nombre del campo Valor
    Plantilla de nodo Nombre de la plantilla de nodo que creó anteriormente.
    Número de nodos 1
    Tamaño de máquina virtual de los nodos A1 (1 núcleo, 1,75 GB de memoria)
  3. Siga los pasos para crear un nuevo trabajo en el Administrador de clústeres de HPC. Cuando llegue a la sección Selección de recursos, seleccione LinuxNodes en la lista Grupos de nodos disponibles y, a continuación, seleccione el botón Agregar para mover el elemento a la lista Grupos de nodos seleccionados . Después de enviar el nuevo trabajo, el nodo de Linux se aprovisionará correctamente.

Ponte en contacto con nosotros para obtener ayuda

Si tiene preguntas o necesita ayuda, cree una solicitud de soporte o busque consejo en la comunidad de Azure. También puede enviar comentarios sobre el producto con los comentarios de la comunidad de Azure.