Configuración de la programación de aplicación de revisiones del SO para clústeres de HDInsight basado en Linux

Importante

Las imágenes de Ubuntu estarán disponibles para la creación del clúster de HDInsight tres meses después de publicarse. Los clústeres en ejecución no se revisan automáticamente. Los clientes deben usar acciones de script u otros mecanismos para revisar un clúster en ejecución. Como procedimiento recomendado, puede ejecutar estas acciones de script y aplicar las actualizaciones de seguridad justo después de crear el clúster.

HDInsight le permite realizar tareas comunes en su clúster, como instalar revisiones y actualizaciones del sistema operativo y reiniciar nodos. Estas tareas se realizan mediante los dos scripts siguientes que se pueden ejecutar como acciones de script y que se pueden configurar con parámetros:

  • schedule-reboots.sh - Realice un reinicio inmediato o programe un reinicio en los nodos de clúster.
  • install-updates-schedule-reboots.sh - Instale todas las actualizaciones, solo las actualizaciones del kernel más las de seguridad o solo las actualizaciones del kernel.

Nota

Las acciones de script no aplicarán automáticamente actualizaciones en todos los ciclos futuros de actualización. Ejecute los scripts cada vez que se deban aplicar nuevas actualizaciones para instalar las actualizaciones y, luego, reinicie la máquina virtual.

Si usa un firewall para la restricción de red, la siguiente dirección URL debe estar en la lista de permitidos.

Preparación

Realice la revisión en un entorno representativo que no sea de producción antes de la implementación en producción. Desarrolle un plan para probar adecuadamente el sistema antes de la revisión real.

De vez en cuando, desde una sesión de SSH con el clúster, puede que reciba un mensaje que indica que hay actualizaciones de seguridad disponibles. El mensaje puede parecerse a este:

89 packages can be updated.
82 updates are security updates.

*** System restart required ***

Welcome to Spark on HDInsight.

La revisión es opcional y según su criterio.

Reinicio de nodos

El script schedule-reboots establece el tipo de reinicio que se realizará en las máquinas en el clúster. Al enviar la acción de script, configúrela para que se aplique en los tres tipos de nodo: nodo principal, nodo de trabajo y ZooKeeper. Si el script no se aplica a un tipo de nodo, las máquinas virtuales de ese tipo de nodo no se actualizarán ni se reiniciarán.

El script schedule-reboots script acepta un parámetro numérico:

Parámetro Valores aceptados Definición
Tipo de reinicio que se va a realizar 1 o 2 Un valor de 1 habilita el reinicio programado (en 12 o 24 horas). Un valor de 2 habilita el reinicio inmediato (en 5 minutos). Si no se especifica ningún parámetro, el valor predeterminado es 1.

Instalación de actualizaciones y reinicio de nodos

El script install-updates-schedule-reboots.sh proporciona opciones para instalar distintos tipos de actualizaciones y reiniciar la máquina virtual.

El script install-updates-schedule-reboots acepta dos parámetros numéricos, como se describe en la siguiente tabla:

Parámetro Valores aceptados Definición
Tipo de actualizaciones que se van a instalar 0, 1 o 2 Un valor de 0 instala solo las actualizaciones del kernel. Un valor de 1 instala las actualizaciones de kernel y seguridad, y un valor de 2 instala todas las actualizaciones. Si no se proporciona ningún parámetro, el predeterminado es 0.
Tipo de reinicio que se va a realizar 0, 1 o 2 Un valor de 0 deshabilita el reinicio. Un valor de 1 habilita el reinicio programado y un valor de 2 habilita el reinicio inmediato. Si no se proporciona ningún parámetro, el predeterminado es 0. El usuario debe cambiar el parámetro de entrada 1 por el parámetro de entrada 2.

Nota

Debe marcar un script como persistente después de aplicarlo a un clúster existente. De lo contrario, en todos los nodos que se creen mediante operaciones de escalado se usará la programación de aplicación de revisión predeterminada. Si aplica el script como parte del proceso de creación del clúster, se marcará como persistente de forma automática.

Nota

La opción Reinicio programado realiza un reinicio automático gradual de los nodos de clúster con revisiones durante un período de 12 a 24 horas y tiene en cuenta las consideraciones de alta disponibilidad, dominio de actualización y dominio de error. El reinicio programado no termina las cargas de trabajo en ejecución, pero puede quitar provisionalmente la capacidad del clúster cuando los nodos no están disponibles, lo que produce tiempos de procesamiento más largos.

Pasos siguientes

Para conocer los pasos específicos sobre cómo usar las acciones de script, consulte las secciones siguientes en Personalización de los clústeres de HDInsight basado en Linux mediante acciones de script: