Compartir a través de


Paso 5: Adición de nodos de Linux al clúster

Después de configurar el clúster, puede agregar opcionalmente nodos de proceso de HPC Linux. Estos son los pasos generales para preparar y agregar nodos de proceso de Linux.

Importante

Todos los clústeres de HPC Pack 2016 y 2019 Update 2 y versiones anteriores, incluidos los clústeres solo de Windows, deben hacer referencia a Administrar la clave de autenticación de Linux para HPC Pack establecer una clave de autenticación de Linux para abordar la vulnerabilidad crítica CVE-2025-21198 antes de agregar nodos de Linux al clúster. Actualice el archivo setup.py para que acepte el parámetro authenticationkey.

5.1: Instalación del sistema operativo Linux en los equipos

Para implementar nodos de proceso de HPC Linux, debe instalar una distribución compatible en los equipos. Para obtener más información, consulte requisitos del sistema de para Microsoft HPC Pack 2019

5.2: Captura de archivos binarios de instalación de nodos de proceso de Linux

Después de implementar el nodo principal, busque los archivos binarios de instalación de nodos de Linux locales en el recurso compartido de instalación de HPC Pack.

Para obtener la ruta de acceso del recurso compartido de instalación de HPC Pack, ejecute los siguientes comandos de PowerShell:

Add-PSSnapin microsoft.hpc 

Get-HpcClusterRegistry -PropertyName InstallShare

La ruta de acceso se devuelve en la salida del comando.

Los archivos hpcnodeagent.tar.gz y setup.py son los archivos binarios necesarios para instalar nodos de proceso de Linux locales.

5.3: Configuración de un recurso compartido de archivos para compartir archivos binarios de instalación en nodos de proceso de Linux

Tiene varias opciones, incluido un recurso compartido SMB o un recurso compartido NFS, para mover datos entre el nodo principal y los nodos de proceso de Linux. Los pasos siguientes configuran un recurso compartido SMB en el nodo principal para compartir los archivos binarios con nodos de proceso de Linux. 

También puede copiar los archivos binarios en un recurso compartido centralizado. Solo tiene que asegurarse de que los archivos de instalación son accesibles desde los nodos de proceso de Linux y los usuarios que necesitan iniciar sesión en los nodos de proceso de Linux. 

Propina

Puede omitir las instrucciones siguientes si sabe cómo implementar los archivos binarios en un recurso compartido de archivos al que se puede acceder desde los nodos de proceso de Linux.

Para configurar un recurso compartido SMB en el nodo principal

  1. Cree una carpeta en el nodo principal y compártala en Todos con el nivel de permisos lectura y escritura. Por ejemplo, comparta C:\SmbShare en el nodo principal como \\<HeadNodeName>\SmbShare. Ejemplo: \\LN15-UB14-HN1\SmbShare.

  2. Monte el recurso compartido SMB en cada nodo de Linux. Por ejemplo, use los siguientes comandos para montar el recurso compartido en la ruta de acceso osmbshare:

    mkdir –p /smbshare  
    
    mount -t cifs //LN15-UB14-HN1/SmbShare /smbshare -o vers=2.1,domain=<domainname>,username=<username>,password='<password>',dir_mode=0777,file_mode=0777  
    
    

    Nota

    Debe usar cifs-utils para montar el recurso compartido SMB desde los nodos de proceso de Linux. En las distribuciones de CentOS y Red Hat, instale el paquete cifs-utils ejecutando yum install.

  3. Copie los archivos binarios hpcnodeagent.tar.gz y setup.py en \\LN15-UB14-HN1\SmbShare en el nodo principal y compruebe que los archivos se pueden ver en la ruta de acceso osmbshare desde los nodos de proceso de Linux.

5.4: Instalación del certificado usado para proteger la comunicación entre nodos de HPC

Si el certificado de para el nodo principal está autofirmado, debe instalar el certificado público para el nodo principal en el equipo Linux como Entidades de certificación raíz de confianza. El certificado público denominado HpcHnPublicCert.cer se encuentra en la carpeta certificados de del recurso compartido de instalación.
El método para completar este paso es diferente para diferentes distribuciones de Linux. Consulte la guía de administración de la distribución de Linux para obtener más información.

Por ejemplo, en Ubuntu 14.04 LTS, convierta el certificado de formato CER sin clave privada para el nodo principal en formato CRT con openssl, guárdelo en el directorio /usr/local/share/ca-certificate y ejecute el siguiente binario:

/usr/sbin/update-ca-certificates

5.5: Instalación del agente de nodo de proceso de Linux en los equipos

Instale los nodos de proceso de Linux ejecutando el script de Python setup.py. Asegúrese de que Python esté instalado en los nodos de Linux e instálelo si no es así.

Para el uso detallado de setup.py, escriba python setup.py --help.

Por ejemplo, para agregar un nodo de Linux al clúster, escriba un comando similar al siguiente comando en un shell de Bash en cada nodo de Linux.

python setup.py -install -connectionstring:'<connection string of the cluster>' -certfile:'<path to PFX certificate>'  -authenticationkey '<your Linux authentication key>'

5.6: Comprobación de la configuración

Después de instalar correctamente los nodos de Linux, abra el Administrador de clústeres de HPC para comprobar el estado del clúster de HPC Pack.

  • En resource Management, enumere los nodos de Linux haciendo clic en Plantilla de nodo -> Plantilla de LinuxNode.

  • Vea un mapa térmico de los nodos de Linux cambiando a la vista mapa térmico de en Resource Management.

  • Envíe trabajos a los nodos de Linux mediante las acciones de Administración de trabajos.

Para enviar un trabajo de barrido paramétrico de prueba a los nodos de Linux

  1. Después de seleccionar los nodos de Linux en administración de recursos, active Administración de trabajos, y haga clic en nuevo trabajo de barrido paramétrico.

  2. En el cuadro de diálogo Nuevo trabajo de barrido paramétrico, especifique una línea de comandos sencilla, como hostname. Acepte los valores predeterminados de la configuración restante y, a continuación, haga clic en Enviar.

  3. Una vez finalizado el trabajo, haga doble clic en el elemento para ver la salida de cada tarea. En este ejemplo, cada nodo de Linux devuelve su nombre de host.