Directiva de mantenimiento del clúster

Define una directiva de mantenimiento que se usa para evaluar el estado del clúster o de un nodo de clúster.

Propiedades

Nombre Tipo Obligatorio
ConsiderWarningAsError boolean No
MaxPercentUnhealthyNodes integer No
MaxPercentUnhealthyApplications integer No
ApplicationTypeHealthPolicyMap matriz de ApplicationTypeHealthPolicyMapItem No
NodeTypeHealthPolicyMap matriz de NodeTypeHealthPolicyMapItem No

ConsiderWarningAsError

Tipo: booleano
Obligatoria: no
Predeterminado:

Indica si las advertencias se tratan con el mismo nivel de gravedad que los errores.


MaxPercentUnhealthyNodes

Tipo: entero
Obligatoria: no
Predeterminado:

El porcentaje máximo permitido de nodos en mal estado antes de informar de un error. Por ejemplo, para permitir el 10 % de los nodos en mal estado, este valor sería 10.

El valor representa el porcentaje máximo tolerado de nodos que pueden ser incorrectos antes de que el clúster se considere erróneo. Si se respeta el porcentaje, pero hay al menos un nodo en mal estado, el estado se evalúa como Warning. El porcentaje se calcula dividiendo el número de nodos en mal estado sobre el número total de nodos del clúster. El cálculo se redondea hacia arriba para tolerar un error en números reducidos de nodos. El porcentaje predeterminado es cero.

En los clústeres grandes, siempre habrá nodos inactivos o inoperativos debido a reparaciones, por lo que este porcentaje debe configurarse para tolerar ese hecho.


MaxPercentUnhealthyApplications

Tipo: entero
Obligatoria: no
Predeterminado:

El porcentaje máximo permitido de aplicaciones en mal estado antes de informar de un error. Por ejemplo, para permitir el 10 % de las aplicaciones en mal estado, este valor sería 10.

El valor representa el porcentaje máximo tolerado de aplicaciones que pueden ser incorrectas antes de que el clúster se considere erróneo. Si se respeta el porcentaje, pero hay al menos una aplicación en mal estado, el estado se evalúa como Warning. Esto se calcula dividiendo el número de aplicaciones en mal estado sobre el número total de instancias de la aplicación en el clúster, excluidas las aplicaciones de los tipos de aplicación que se incluyen en ApplicationTypeHealthPolicyMap. El cálculo se redondea hacia arriba para tolerar un error en números reducidos de aplicaciones. El porcentaje predeterminado es cero.


ApplicationTypeHealthPolicyMap

Tipo: matriz de ApplicationTypeHealthPolicyMapItem
Obligatoria: no

Define un asignación con un porcentaje máximo de aplicaciones en mal estado para tipos de aplicación específicos. Cada entrada especifica como clave el nombre del tipo de aplicación y como valor un entero que representa el porcentaje de MaxPercentUnhealthyApplications usado para evaluar las aplicaciones del tipo de aplicación especificado.

La asignación de directiva de mantenimiento de tipo de aplicación se puede usar durante la evaluación de mantenimiento del clúster para describir tipos de aplicación especiales. Los tipos de aplicación incluidos en la asignación se evalúan con el porcentaje especificado en la asignación y no con el MaxPercentUnhealthyApplications global definido en la directiva de mantenimiento de clúster. Las aplicaciones de tipos de aplicación especificados en la asignación no se incluyen en el grupo global de aplicaciones. Por ejemplo, si algunas aplicaciones de un tipo son vitales, el administrador de clústeres puede agregar una entrada a la asignación para ese tipo de aplicación y asignarle un valor del 0 % (es decir, no tolerar errores). Todas las demás aplicaciones se pueden evaluar con MaxPercentUnhealthyApplications establecido en el 20 % para tolerar algunos errores entre las miles de instancias de la aplicación. La asignación de directiva de mantenimiento de tipo de aplicación se usa únicamente si el manifiesto de clúster permite la evaluación de mantenimiento de tipo de aplicación con la entrada de configuración para HealthManager/EnableApplicationTypeHealthEvaluation.


NodeTypeHealthPolicyMap

Tipo: matriz de NodeTypeHealthPolicyMapItem
Obligatoria: no

Define un mapa con un porcentaje máximo de nodos incorrectos para tipos de nodo específicos. Cada entrada especifica como clave el nombre del tipo de nodo y como valor un entero que representa el porcentaje MaxPercentUnhealthyNodes usado para evaluar los nodos del tipo de nodo especificado.

La asignación de directiva de mantenimiento de tipo de nodo se puede usar durante la evaluación del mantenimiento de clúster para describir tipos de nodo especiales. Se evalúan con respecto a los porcentajes asociados con su nombre de tipo de nodo en el mapa. Establecer esto no tiene ningún impacto en el grupo global de nodos que se usan para MaxPercentUnhealthyNodes. La asignación de directivas de mantenimiento del tipo de nodo solo se usa si el manifiesto del clúster habilita la evaluación de estado del tipo de nodo mediante la entrada de configuración de HealthManager/EnableNodeTypeHealthEvaluation.

Por ejemplo, dado un clúster con muchos nodos de diferentes tipos, con un trabajo importante hospedado en el tipo de nodo "SpecialNodeType" que no debe tolerar ningún nodo inactivo. Puede especificar MaxPercentUnhealthyNodes global en un 20 % para tolerar algunos errores para todos los nodos, pero para el tipo de nodo "SpecialNodeType", establezca MaxPercentUnhealthyNodes en 0 estableciendo el valor en el par de valores clave en NodeTypeHealthPolicyMapItem. La clave es el nombre del tipo de nodo. De este modo, siempre que ningún nodo del tipo "SpecialNodeType" esté en estado Error, incluso si algunos de los muchos nodos del grupo global están en estado Error, pero por debajo del porcentaje global incorrecto, el clúster se evaluaría como Advertencia. Un estado de mantenimiento de advertencia no afecta a la actualización del clúster u otra supervisión desencadenada por estado de mantenimiento del error. Pero incluso un nodo de tipo SpecialNodeType en Error haría que el clúster no sea correcto (en Error en lugar de Advertencia/Aceptar), que desencadena la reversión o pausa la actualización del clúster, en función de la configuración de actualización.

Por el contrario, al establecer maxPercentUnhealthyNodes global en 0, y al establecer el porcentaje máximo de nodos incorrectos de SpecialNodeType en 100, con un nodo de tipo SpecialNodeType en estado Error seguiría colocando el clúster en un estado Error, ya que la restricción global es más estricta en este caso.