Udostępnij za pośrednictwem


Zasady kondycji klastra

Definiuje zasady kondycji używane do oceny kondycji klastra lub węzła klastra.

Właściwości

Nazwa Typ Wymagane
ConsiderWarningAsError boolean Nie
MaxPercentUnhealthyNodes liczba całkowita Nie
MaxPercentUnhealthyApplications liczba całkowita Nie
ApplicationTypeHealthPolicyMap tablica parametru ApplicationTypeHealthPolicyMapItem Nie
NodeTypeHealthPolicyMap tablica nodeTypeHealthPolicyMapItem Nie

ConsiderWarningAsError

Typ: wartość logiczna
Wymagane: Nie
Ustawienie domyślne: false

Wskazuje, czy ostrzeżenia są traktowane z taką samą ważnością jak błędy.


MaxPercentUnhealthyNodes

Typ: liczba całkowita
Wymagane: Nie
Ustawienie domyślne: 0

Maksymalna dozwolona wartość procentowa węzłów w złej kondycji przed zgłoszeniem błędu. Na przykład aby zezwolić 10% węzłów na złą kondycję, ta wartość będzie wynosić 10.

Wartość procentowa reprezentuje maksymalną tolerowaną wartość procentową węzłów, które mogą być w złej kondycji, zanim klaster zostanie uznany za błąd. Jeśli wartość procentowa jest przestrzegana, ale istnieje co najmniej jeden węzeł w złej kondycji, kondycja jest oceniana jako Ostrzeżenie. Wartość procentowa jest obliczana przez podzielenie liczby węzłów w złej kondycji na łączną liczbę węzłów w klastrze. Obliczenia są zaokrąglone w górę, aby tolerować jedną awarię na małej liczbie węzłów. Wartość procentowa domyślna to zero.

W dużych klastrach niektóre węzły będą zawsze wyłączane lub wyłączane w celu naprawy, więc ta wartość procentowa powinna być skonfigurowana tak, aby to tolerowała.


MaxPercentUnhealthyApplications

Typ: liczba całkowita
Wymagane: Nie
Ustawienie domyślne: 0

Maksymalny dozwolony procent aplikacji w złej kondycji przed zgłoszeniem błędu. Na przykład aby zezwolić 10% aplikacji na złą kondycję, ta wartość będzie wynosić 10.

Wartość procentowa reprezentuje maksymalną tolerowaną wartość procentową aplikacji, które mogą być w złej kondycji, zanim klaster zostanie uznany za błąd. Jeśli wartość procentowa jest przestrzegana, ale istnieje co najmniej jedna aplikacja w złej kondycji, kondycja jest oceniana jako Ostrzeżenie. Jest to obliczane przez podzielenie liczby aplikacji w złej kondycji na łączną liczbę wystąpień aplikacji w klastrze, z wyłączeniem aplikacji typów aplikacji uwzględnionych w metryce ApplicationTypeHealthPolicyMap. Obliczenia są zaokrąglone w górę, aby tolerować jedną awarię na małej liczbie aplikacji. Wartość procentowa domyślna to zero.


ApplicationTypeHealthPolicyMap

Typ: tablica applicationTypeHealthPolicyMapItem
Wymagane: Nie

Definiuje mapę z maksymalną wartością procentową złej kondycji aplikacji dla określonych typów aplikacji. Każdy wpis określa jako klucz nazwę typu aplikacji i jako wartość całkowitą reprezentującą wartość procentową MaxPercentUnhealthyApplications używaną do oceny aplikacji określonego typu aplikacji.

Mapa zasad kondycji typu aplikacji może być używana podczas oceny kondycji klastra w celu opisania specjalnych typów aplikacji. Typy aplikacji uwzględnione w mapie są oceniane względem wartości procentowej określonej na mapie, a nie globalnej wartości MaxPercentUnhealthyApplications zdefiniowanej w zasadach kondycji klastra. Aplikacje typów aplikacji określonych na mapie nie są liczone względem globalnej puli aplikacji. Jeśli na przykład niektóre aplikacje typu są krytyczne, administrator klastra może dodać wpis do mapy dla tego typu aplikacji i przypisać mu wartość 0% (czyli nie tolerować żadnych błędów). Wszystkie inne aplikacje można ocenić za pomocą parametru MaxPercentUnhealthyApplications ustawionego na 20%, aby tolerować niektóre błędy z tysięcy wystąpień aplikacji. Mapa zasad kondycji typu aplikacji jest używana tylko wtedy, gdy manifest klastra umożliwia ocenę kondycji typu aplikacji przy użyciu wpisu konfiguracji HealthManager/EnableApplicationTypeHealthEvaluation.


NodeTypeHealthPolicyMap

Typ: tablica NodeTypeHealthPolicyMapItem
Wymagane: Nie

Definiuje mapę z maksymalnym procentem złej kondycji węzłów dla określonych typów węzłów. Każdy wpis określa jako klucz nazwę typu węzła i jako wartość całkowitą reprezentującą wartość procentową MaxPercentUnhealthyNodes używaną do oceny węzłów określonego typu węzła.

Mapa zasad kondycji typu węzła może być używana podczas oceny kondycji klastra w celu opisania specjalnych typów węzłów. Są one oceniane względem wartości procentowych skojarzonych z nazwą typu węzła na mapie. Ustawienie tego ustawienia nie ma wpływu na globalną pulę węzłów używanych dla węzłów MaxPercentUnhealthyNodes. Mapa zasad kondycji typu węzła jest używana tylko wtedy, gdy manifest klastra włączy ocenę kondycji typu węzła przy użyciu wpisu konfiguracji HealthManager/EnableNodeTypeHealthEvaluation.

Na przykład, biorąc pod uwagę klaster z wieloma węzłami różnych typów, z ważną pracą hostowaną na typie węzła "SpecialNodeType", który nie powinien tolerować żadnych węzłów w dół. Globalne węzły MaxPercentUnhealthyNodes można określić na 20%, aby tolerować niektóre błędy dla wszystkich węzłów, ale dla typu węzła "SpecialNodeType" ustaw wartość MaxPercentUnhealthyNodes na 0, ustawiając wartość w parze wartości klucza w nodeTypeHealthPolicyMapItem. Klucz jest nazwą typu węzła. W ten sposób, o ile żadne węzły typu "SpecialNodeType" nie są w stanie Błąd, nawet jeśli niektóre z wielu węzłów w puli globalnej są w stanie Błąd, ale poniżej globalnej wartości procentowej złej kondycji, klaster zostanie oceniony na Ostrzeżenie. Stan kondycji ostrzeżenia nie ma wpływu na uaktualnienie klastra ani inne monitorowanie wyzwalane przez stan kondycji błędu. Jednak nawet jeden węzeł typu SpecialNodeType w błędzie spowodowałby złą kondycję klastra (w obszarze Błąd, a nie Ostrzeżenie/Ok), co wyzwala wycofywanie lub wstrzymuje uaktualnienie klastra w zależności od konfiguracji uaktualnienia.

Z drugiej strony ustawienie globalnego węzła MaxPercentUnhealthyNodes na wartość 0 i ustawienie maksymalnej kondycji węzłów o wartości procentu złej kondycji elementu SpecialNodeType na 100, przy użyciu jednego węzła typu SpecialNodeType w stanie Błąd nadal umieszcza klaster w stanie Błąd, ponieważ w tym przypadku ograniczenie globalne jest bardziej rygorystyczne.