Implementați clustere de extindere
În mod tradițional, clusterele de reluare în caz de nereușită au furnizat protecție de disponibilitate ridicată împotriva erorilor localizate către unul sau mai multe noduri de cluster care se află în aceeași locație fizică. Puteți utiliza clustere de extindere atunci când este necesar să furnizați funcționalitatea echivalentă în mai multe locații fizice.
Ce sunt clusterele întinse?
Un cluster de întindere implementează o disponibilitate ridicată și recuperare în caz de dezastru în două locații fizice separate. Ambele locații găzduiesc un sistem de stocare separat, cu replicare unidirecțională, sincronă de la site-ul principal la site-ul secundar. Dacă o eroare afectează disponibilitatea site-ului principal, pentru a minimiza timpul de nefuncțiune, clusterul își face automat tranziții volumul de lucru la nodurile din site-ul secundar. Pentru evenimentele de întreținere planificată de pe site-ul principal, puteți utiliza Hyper-V Migrare în direct pentru a face tranziția fără sincope a volumului de lucru la celălalt site, ceea ce evită cu totul întreruperile.
Utilizarea clusterelor de întindere oferă mai multe avantaje față de menținerea manuală a unui site de recuperare în caz de dezastru:
- Reproducerea automată și reluarea automată în caz de nereușită a volumului de lucru grupat.
- Reduceți suprapunerea administrativă.
- Minimizați posibilitatea erorilor umane, inerentă proceselor manuale.
Pe de altă parte, clusterele de întindere sunt mai complexe pentru proiectare și implementare. De asemenea, acestea necesită de obicei o investiție suplimentară în infrastructura de stocare și de rețea.
Prezentare generală a reproducerii de stocare
Lărgiți clusterele utilizează reproducerea stocării, o caracteristică Windows Server care oferă replicarea volumelor între servere sau clustere pentru recuperarea în caz de dezastru. Prin utilizarea reproducerii de stocare, clusterele de extindere pot sincroniza volumele de stocare atașate la nodurile de extindere a clusterului în două locații separate.
Reproducerea de stocare acceptă replicarea sincronă și asincronă:
- Replicarea sincronă reproduce datele într-o rețea cu latență scăzută, în milisecunde de timp dus-întors, asigurând nicio pierdere de date la nivelul sistemului de fișiere în timpul unei reluări în caz de nereușită.
- Reproducerea asincronă a datelor pe distanțe mai lungi care sunt supuse unor latențe mai mari, dar fără o garanție că ambele site-uri au copii identice ale datelor în momentul unei reluări în caz de nereușită.
Important
Clusterele de extindere necesită reproducere sincronă. Această cerință impune limita de latență de rețea de 5-ms dus-întors între două grupuri de noduri de cluster din site-urile reproduse. În funcție de caracteristicile de conectivitate a rețelei fizice, această restricție se traduce de obicei într-o distanță de aproximativ 20-30 mile.
Caracteristici reproducere spațiu de stocare
Principalele caracteristici ale reproducerii de stocare sunt listate în tabelul următor.
| Caracteristică | Descriere |
|---|---|
| Reproducerea la nivel de bloc | Cu reproducerea la nivel de bloc, nu există nicio posibilitate de blocare a fișierelor. |
| Simplitate | Vă puteți baza pe Centrul de administrare Windows pentru a vă ghida prin procesul de creare a unui parteneriat de reproducere între două servere. Pentru a implementa un cluster de extindere, puteți utiliza un expert bazat pe Managerul de clustere în caz de nereușită. |
| Utilizarea Server Message Block (SMB) 3.0 | Reproducerea de stocare se bazează pe SMB 3.x, introdusă în Windows Server 2012 și îmbunătățită considerabil în versiunile ulterioare de Windows Server. Toate caracteristicile avansate ale SMB, cum ar fi SMB Multichannel și SMB Direct, sunt disponibile pentru reproducerea stocării. |
| Securitate | Reproducerea stocării oferă o gamă largă de mecanisme de securitate, inclusiv semnarea pachetelor, criptare completă AES-128-GCM, suport pentru accelerarea criptării de la terți și prevenirea integrității de pre-autentificare de tip man-in-the-middle attack. Replica de stocare se bazează, de asemenea, pe Kerberos AES256 pentru toate autentificările între noduri. |
| Restricții de rețea | În cazurile în care există mai multe căi de rețea între volumele reproduse, puteți configura traficul de reproduceri de stocare pentru a utiliza adaptoare de rețea desemnate. Acest lucru vă permite să minimizați impactul potențial al traficului de reproducere asupra volumului de lucru de producție. |
| Asigurare acces subțire | Aveți opțiunea de a implementa asigurarea accesului subțire în Storage Spaces Direct, minimizând timpul de reproducere inițială. |
Cerințe preliminare pentru implementarea clusterelor de extindere
Cerințele preliminare pentru implementarea clusterelor întinse includ:
Nodurile cluster trebuie să fie membri ai aceleiași păduri AD DS sau de încredere.
Fiecare nod de cluster ar trebui să aibă cel puțin 2 GB de RAM și două nuclee CPU pentru fiecare server.
Fiecare nod de cluster ar trebui să ruleze Ediția Datacenter Windows Server 2025 sau Windows Server 2016 Datacenter. Este posibil să utilizați ediția Windows Server 2025 Standard, dar o astfel de configurație acceptă reproducerea unui singur volum de până la 2 teraocteți (TB) doar în dimensiune.
Fiecare nod de cluster ar trebui să aibă cel puțin 1 adaptor Gigabit Ethernet pentru replicare sincronă, deși Accesul direct la memorie la distanță (RDMA) este preferabil.
Două seturi de volume (unul pentru date și celălalt pentru jurnale) la site-ul principal și secundar, cu următoarele setări:
Discurile trebuie inițializate ca tabel de partiții GUID (GPT), nu ca înregistrare de boot coordonator (MBR).
- Volumele ar trebui să fie formatate cu ReFS sau NTFS.
- Dimensiunile volumelor de date și dimensiunile sectorului trebuie să corespundă.
- Dimensiunile volumelor jurnalului și dimensiunile sectorului trebuie să corespundă.
- Volumele jurnalului ar trebui să utilizeze o stocare mai rapidă decât volumele de date.
- Volumele jurnalului nu trebuie utilizate pentru alte sarcini de lucru.
Conectivitate bidirecțională prin Internet Control Message Protocol (ICMP), SMB (portul 445, plus portul 5445 pentru SMB Direct) și web Services-Management (WS-MAN) (portul 5985) între cele două site-uri.
O rețea între servere cu lățime de bandă suficientă pentru a corespunde scrierilor I/O ale sarcinilor de lucru grupate și mai puțin de 5-ms latență dus-întors.
Considerații pentru implementarea unui cluster de extindere
Clusterele de extindere nu sunt potrivite pentru fiecare volum de lucru și pentru fiecare scenariu. Atunci când proiectați o soluție de cluster de extindere, identificați clar cerințele și așteptările organizaționale. În plus, rețineți că întinderea clusterelor impune mai multe suprapunere de gestionare decât clusterele tradiționale în care toate nodurile se află în aceeași locație fizică. De asemenea, ar trebui să luați în considerare alegerea optimă a martorului cvorum pentru a maximiza disponibilitatea acestuia în cazul unui dezastru care afectează întregul sit fizic.
Important
Aplicațiile și serviciile de stare, cum ar fi Microsoft SQL Server, Hyper-V, Microsoft Exchange Server și AD DS ar trebui să utilizeze propriile mecanisme native de reziliență, în loc să se bazeze pe clustere de extindere pentru o disponibilitate ridicată.
Considerații pentru reluarea în caz de nereușită și reluarea în caz de nereușită într-un cluster de extindere
Ca parte a planificării pentru implementarea unui cluster extins, trebuie să definiți configurația de reluare în caz de nereușită și reluare în caz de nereușită, luând în considerare următoarele aspecte:
- Dependențe de infrastructură. Ar trebui să definiți clar serviciile critice, cum ar fi AD DS, DNS și DHCP, care ar trebui să rămână disponibile ca urmare a unei reluări în caz de nereușită la site-ul secundar.
- Model cvorum. Este important să alegeți modelul de cvorum care păstrează funcționalitatea clusterului după o reluare în caz de nereușită.
- Publicarea serviciului și rezoluția numelui. Dacă aveți servicii publicate pentru utilizatorii interni sau externi, cum ar fi e-mailul și paginile web, rețineți că, în unele cazuri, reluarea în caz de nereușită la alt site necesită modificări ale numelui sau adresei IP. În acest caz, ar trebui să aveți o procedură pentru modificarea înregistrărilor DNS în DNS intern sau public. Pentru a reduce timpul de nefuncție, vă recomandăm să reduceți valoarea Time to Live (TTL) a înregistrărilor DNS critice.
- Conectivitate client. În caz de dezastru, un plan de reluare în caz de nereușită trebuie să găzduiască conectivitatea de la aplicațiile client la sarcinile de lucru grupate. Aceasta include atât clienții interni, cât și cei externi.
- Procedura de reluare în caz de nereușit. Ar trebui să planificați și să implementați un proces de reluare în caz de nereușit pentru a-l efectua după ce site-ul principal revine online. Reluarea în caz de nereușită este la fel de importantă ca o reluare în caz de nereușită, deoarece dacă o efectuați incorect, puteți provoca pierderi de date și întreruperi ale serviciului.
Crearea unui cluster de extindere
Puteți crea un cluster de extindere utilizând Centrul de administrare Windows, Manager clustere de reluare în caz de nereușită sau Windows PowerShell. Centrul de administrare Windows simplifică implementarea clusterelor întinse, ghidându-vă prin procesul de asigurare a accesului și prin automatizarea majorității activităților de configurare. Aceasta include asistență pentru:
- Clustere hiperconverizate (clustere de reluare în caz de nereușită, Hyper-V și Storage Spaces Direct).
- Clustere de stocare (reluare în caz de nereușită și Stocare Spaces Direct).
Notă
Crearea unui cluster de extindere utilizând Manager clustere de reluare în caz de nereușită sau Windows PowerShell este mai complexă. Ambele metode necesită efectuarea fiecăruia dintre pașii intermediari de implementare. În cei mai simpli termeni, acest lucru începe cu crearea unui cluster de reluare în caz de nereușită tradițional, fără extindere, constând din toate nodurile din site-ul principal și secundar. După ce creați clusterul și finalizați validarea, în fiecare site, creați un set separat de volume de stocare. În sfârșit, configurați Reproducere spațiu de stocare pentru a reproduce volumele de stocare dintre cele două site-uri.