Definirea clusterelor de reluare în caz de nereușită Windows Server

Finalizat

Majoritatea organizațiilor și firmelor, inclusiv Contoso, se străduiesc să asigure o disponibilitate ridicată a sarcinilor sale de lucru critice pentru misiune. Contoso ar putea lua în considerare utilizarea clusterelor de reluare în caz de nereușită Windows Server. Aceasta este o caracteristică Windows Server care oferă o disponibilitate ridicată a volumului de lucru comun bazat pe Windows, inclusiv partajările de fișiere, mașinile virtuale (mașini virtuale), sistemele de gestionare a bazelor de date și serviciile de mesagerie.

Prezentare generală a clusterelor de reluare în caz de nereușită

Pentru a realiza o disponibilitate ridicată a volumului de lucru, creați un cluster de reluare în caz de nereușită constând din mai multe computere Windows Server. Dacă un server care face parte dintr-un cluster de reluare în caz de nereușită sau devine indisponibil, un alt server din același cluster de reluare în caz de nereușită preia serviciile oferite de nodul nereușit. Acest lucru se numește reluare în caz de nereușită și are ca rezultat întreruperi minime de serviciu pentru clienții care accesează serviciul.

Cele mai comune utilizări ale clusterelor de reluare în caz de nereușită includ:

  • Partajările de fișiere disponibile foarte sau continuu găzduiesc bazele de date Microsoft SQL Server și configurația și fișierele disc ale Microsoft Hyper-V VMS.
  • Servicii și aplicații foarte disponibile care rulează pe servere fizice sau în mașini virtuale invitate găzduite pe servere Hyper-V grupate.

Componente de grupare în caz de nereușită

Un cluster de reluare în caz de nereușită constă în componentele descrise în tabelul următor.

Componentă Descriere
Noduri Computerele Windows Server care sunt membri ai unui cluster de reluare în caz de nereușită. Aceste computere au instalată caracteristica de grupare în caz de nereușită Windows Server și rulează sarcini de lucru foarte disponibile, constând în servicii, aplicații și resurse.
Clientii Computerele care consumă servicii și aplicații foarte disponibile care rulează într-un cluster de reluare în caz de nereușită. Ar trebui să existe mai multe căi de rețea între clienți și cluster.
Reţele Activați comunicarea între noduri și computere care consumă sarcini de lucru grupate. În plus, nodurile accesează frecvent spațiul de stocare partajat.
Rol grupat Un rol sau un serviciu foarte disponibil care rulează pe nodul de cluster. Clienții consumă acest serviciu conectându-se la nodul de cluster. Dacă un astfel de serviciu devine indisponibil pe un nod, clusterul de reluare în caz de nereușită nu reușește automat la alt nod.
Resurse Elemente fizice sau logice, cum ar fi un folder partajat, un disc sau o adresă IP, pe care clusterul de reluare în caz de nereușită le gestionează. Resursele pot oferi servicii clienților sau pot fi părți integrale ale aplicațiilor extrem de disponibile. O resursă poate rula numai pe un singur nod în orice moment dat.
Stocare cluster În plus față de propriul spațiu de stocare local, unde este instalat sistemul de operare Windows Server, fiecare nod de cluster are acces la stocarea partajată foarte disponibilă, unde se află configurația aplicației și datele. De exemplu, datele de configurare ale gazdelor de stocare în clustere și hard diskurile virtuale ale mașinilor virtuale invitat foarte disponibile.

O descriere a arhitecturii unui cluster de reluare în caz de nereușită cu două noduri și spațiu de stocare partajat.

Notă

Spațiul de stocare partajat nu trebuie atașat direct la mai multe noduri. Tehnologia Storage Spaces Direct introdusă în Windows Server 2016 permite partajarea discurilor atașate la noduri individuale.

Niveluri funcționale de grupare în caz de nereușită

Capacitățile clusterelor de reluare în caz de nereușită Windows Server depind de nivelul funcțional al clusterului. În general, se recomandă să vă asigurați că clusterul utilizează cel mai înalt nivel funcțional posibil. Cu toate acestea, suportul pentru nivelurile funcționale mai mici din Windows Server 2016 și Windows Server 2025 vă permite să efectuați upgrade-uri cu rulare ale clusterelor de reluare în caz de nereușită care rulează versiuni anterioare ale sistemului de operare. Astfel, în timpul unui upgrade, este posibil să aveți noduri Windows Server 2016 și Windows Server 2025 în același cluster de reluare în caz de nereușită, eliminând nevoia de întreruperi.

Sfat

După ce toate nodurile care rulau Windows Server 2016 au fost înlocuite cu noduri Windows Server 2025, puteți actualiza nivelul funcțional al clusterului.

Cvorum de grupare în caz de nereușită

Într-un cluster de reluare în caz de nereușită, cvorumul de termeni reprezintă numărul de componente de grupare care trebuie să fie disponibile pentru ca clusterul respectiv să rămână online. Aceste componente pot include nodurile cluster și, opțional, un martor. Termenul martor desemnează o resursă a cărei rol este să stabilească și să mențină un cvorum. În acest scop, un cluster de reluare în caz de nereușită se poate utiliza:

  • O partajare de fișiere
  • Un disc
  • Un blob în Spațiul de stocare Azure

Cvorumul este determinat pe baza numărului de voturi asociate nodurilor cluster și martorului. Scopul cvorumului este de a preveni scenariul "creierului scindat". În acest scenariu, ca urmare a problemelor de conectivitate internode, două seturi de noduri dintr-un cluster ar putea începe să funcționeze independent unul de celălalt, rezultând deteriorarea stării clusterului și a resurselor sale.

Modelul cvorumului definește alocarea voturilor. Clusterele de reluare în caz de nereușită Windows Server oferă gestionare dinamică a cvorumului. Acest lucru oferă o disponibilitate mai mare într-un cluster de reluare în caz de nereușită, prin monitorizarea continuă și ajustarea modelului cvorum pe baza nodurilor cluster disponibile.

Calculul cvorumului de cluster este ajustat atunci când se modifică numărul de noduri. Chiar dacă un cluster de reluare în caz de nereușită are mai puțin de 50% din numărul inițial de noduri, clusterul de reluare în caz de nereușită continuă să funcționeze și rolurile de cluster sunt încă disponibile. Cu cvorumul dinamic activat, un cluster de reluare în caz de nereușită poate supraviețui cu un singur nod în sus și în rulare.

Notă

Modelul cvorum dinamic este activat în mod implicit.

Gruparea în caz de nereușită acceptă, de asemenea, următoarele capacități legate de cvorum:

  • Greutăți de nod. Windows Server utilizează greutatea nodului de cluster în principal în mediile în care nodurile de reluare în caz de nereușită se află în mai multe locații fizice. În astfel de medii, se recomandă ca clusterul de reluare în caz de nereușită să continue să ruleze fără întreruperi la locația primară, chiar dacă mai multe noduri din locația secundară devin indisponibile. Pentru a realiza acest lucru, puteți atribui o grosime de nod de 0 nodurilor clusterului de reluare în caz de nereușită din locația secundară, ceea ce elimină în mod eficient impactul acestora asupra stării cvorumului.
  • Martor dinamic. În mod implicit, Windows Server ajustează dinamic votul martor pe baza numărului de noduri de votare din clusterul de reluare în caz de nereușită. Dacă clusterul de reluare în caz de nereușită are un număr impar de voturi, martorul cvorumului nu are un vot. În cazul în care clusterul de reluare în caz de nereușită are un număr par de voturi, martorul cvorumului are un vot. Votul martorilor din cvorum este, de asemenea, ajustat dinamic pe baza stării resursei martorului. Dacă resursa martor este offline sau nu a reușit, martorul nu are un vot.
  • Legați separatorul pentru scindarea nodului de 50%. Clusterul de reluare în caz de nereușită poate ajusta dinamic votul unui nod pentru a menține un număr impar de voturi totale. Pentru a realiza acest lucru, clusterul de reluare în caz de nereușită ajustează întâi votul martorului cvorum, prin valorificarea funcționalității martor dinamice. Dacă un martor cvorum nu este disponibil, atunci clusterul de reluare în caz de nereușită poate ajusta votul unui nod. De asemenea, există o proprietate cluster de reluare în caz de nereușită pe care o puteți utiliza pentru a determina ce site supraviețuiește dacă există o scindare de nod de 50% și niciun site nu are un cvorum.

Funcționalitatea unui cluster de reluare în caz de nereușită depinde nu numai de un cvorum, ci și de resursele disponibile nodurilor cluster și de capacitatea lor de a rula sarcini de lucru grupate care nu reușesc la acel nod. De exemplu, un cluster cu cinci noduri va avea în continuare cvorum chiar dacă două noduri eșuează. Cu toate acestea, fiecare nod de cluster rămas continuă să deservească clienții numai dacă are suficiente resurse pentru a rula roluri de cluster care au eșuat la cele trei noduri rămase. Aceste resurse includ stocarea, puterea de procesare, lățimea de bandă a rețelei și memoria. Puteți configura prioritatea mașinii virtuale, ordinea de pornire, gazdele preferate și afinitatea anti-afinitate pentru a decide nodurile pe care poate rula rolul de cluster.

Tipuri martor de grupare în caz de nereușită

Există trei tipuri de martori ai cvorumului disponibili pentru gruparea în caz de nereușită.

  • Martor disc utilizează o resursă de disc grupată în același cluster de reluare în caz de nereușită. Toate nodurile trebuie să aibă acces la discul partajat.
  • Martorul partajare fișiere utilizează o partajare de fișiere externe. Este posibil să implementați acest lucru utilizând o unitate USB atașată la un comutator de rețea.
  • Martorul cloud utilizează un blob într-un cont Azure Storage.

Important

Atunci când selectați tipul martorului cvorum, trebuie să vă asigurați că martorul rămâne accesibil pentru majoritatea scenariilor care afectează disponibilitatea nodurilor clusterului.