Ridimensionamento di cluster di Azure Service Fabric

Articolo
06/01/2023

Un cluster di Service Fabric è un set di computer fisici o macchine virtuali connessi in rete, in cui vengono distribuiti e gestiti i microservizi. Un computer o una macchina virtuale che fa parte di un cluster viene detto nodo. I cluster possono contenere migliaia di nodi. Dopo aver creato un cluster di Service Fabric, è possibile scalare il cluster in orizzontale (modificare il numero di nodi) o in verticale (modificare le risorse dei nodi). È possibile ridimensionare il cluster in qualsiasi momento, anche quando sono in esecuzione carichi di lavoro nel cluster. Quando si ridimensiona il cluster, vengono automaticamente ridimensionate anche le applicazioni.

Perché ridimensionare il cluster? Le richieste delle applicazioni cambiano nel tempo. Potrebbe essere necessario aumentare le risorse del cluster per supportare l'aumento del carico di lavoro delle applicazioni o del traffico di rete oppure ridurre le risorse del cluster quando le richieste si riducono.

Ridimensionamento orizzontale

Modifica il numero di nodi nel cluster. Dopo che i nuovi nodi sono stati aggiunti al cluster, Gestione risorse cluster sposta i servizi nei nuovi nodi, riducendo il carico totale sui nodi esistenti. È anche possibile ridurre il numero di nodi del cluster, se le risorse del cluster non vengono usate in modo efficiente. Quando i nodi vengono rimossi dal cluster, i servizi vengono spostati da tali nodi e il carico nei nodi rimanenti aumenta. La riduzione del numero di nodi in un cluster in esecuzione in Azure consente un risparmio, poiché il pagamento è basato sul numero di macchine virtuali usate, non sul carico di lavoro in tali macchine virtuali.

Vantaggi: scalabilità infinita, in teoria. Se l'applicazione è progettata per la scalabilità, è possibile abilitare una crescita illimitata aggiungendo più nodi. Gli strumenti disponibili negli ambienti cloud consentono di aggiungere o rimuovere facilmente i nodi, in modo da regolare la capacità e pagare solo per le risorse usate.
Svantaggi: le applicazioni devono essere progettate per la scalabilità. Anche la persistenza e i database delle applicazioni possono richiedere attività aggiuntive a livello di architettura per la scalabilità. Le raccolte Reliable Collections nei servizi con stato di Service Fabric, comunque, rendono molto più semplice ridimensionare i dati delle applicazioni.

I set di scalabilità di macchine virtuali sono una risorsa di calcolo di Azure che è possibile usare per distribuire e gestire una raccolta di macchine virtuali come set. Ogni tipo di nodo definito in un cluster di Azure viene configurato come set di scalabilità di macchine virtuali separato. Ogni tipo di nodo può quindi essere aumentato o ridotto in modo indipendente, avere diversi set di porte aperte e avere metriche per la capacità diverse.

Quando si ridimensiona un cluster di Azure, tenere presenti le linee guida seguenti:

I tipi di nodo primario che eseguono carichi di lavoro di produzione devono contenere sempre cinque o più nodi.
I tipi di nodo non primario che eseguono carichi di lavoro di produzione con stato devono contenere sempre cinque o più nodi.
I tipi di nodo non primario che eseguono carichi di lavoro di produzione senza stato devono contenere sempre due o più nodi.
Qualsiasi tipo di nodo del livello di durabilità Gold or Silver deve sempre contenere cinque o più nodi.
Non rimuovere istanze/nodi vm casuali da un tipo di nodo, usare sempre la scalabilità del set di scalabilità di macchine virtuali nella funzionalità. L'eliminazione di istanze di VM casuali può influenzare negativamente la capacità dei sistemi di eseguire il bilanciamento del carico in modo corretto.
Se si usano regole di scalabilità automatica, impostare le regole in modo che la riduzione (rimozione di istanze di VM) venga eseguita un nodo alla volta. La riduzione delle prestazioni di più di un'istanza per volta non è sicura.

Poiché i tipi di nodi di Service Fabric nel cluster sono costituiti da set di scalabilità di macchine virtuali nel back-end, è possibile configurare regole di ridimensionamento automatico o ridimensionare manualmente ogni tipo di nodo o set di scalabilità di macchine virtuali.

Scalabilità a livello di codice

In molti scenari, le opzioni di ridimensionamento di un cluster in modo manuale o mediante regole di scalabilità automatica rappresentano soluzioni valide. In scenari più avanzati, tuttavia, potrebbero non essere la scelta adatta. Alcuni potenziali svantaggi di questi approcci sono:

Il ridimensionamento manuale richiede l'accesso e richiedere in modo esplicito le operazioni di ridimensionamento. Questo approccio potrebbe non essere una soluzione valida se le operazioni di scalabilità vengono richieste di frequente oppure in momenti imprevisti.
Quando le regole di scalabilità automatica rimuovono un'istanza da un set di scalabilità di macchine virtuali, non rimuovono automaticamente le informazioni di questo nodo dal cluster Service Fabric associato, a meno che il tipo di nodo non disponga di un livello di durabilità Silver o Gold. Poiché funzionano a livello di set di scalabilità anziché a livello di Service Fabric, le regole di scalabilità automatica possono rimuovere i nodi Service Fabric senza arrestarli in modo normale. Questo tipo di rimozione dei nodi lascerà il nodo Service Fabric nello stato "ghost" dopo le operazioni di riduzione delle istanze. Un utente o un servizio dovrà pulire periodicamente lo stato del nodo rimosso nel cluster Service Fabric.
Un tipo di nodo con un livello di durabilità Gold o Silver esegue automaticamente la pulizia dei nodi rimossi. Non è necessaria una pulizia aggiuntiva.
Anche se le regole di scalabilità automatica supportano molte metriche, si tratta comunque di un set limitato. Se lo scenario richiede la scalabilità basata su alcune metriche non incluse in questo set, le regole di scalabilità automatica potrebbero non essere una soluzione valida.

L'approccio da scegliere per la scalabilità di Service Fabric dipende dallo scenario specifico. Se la scalabilità non è comune, la possibilità di aggiungere o rimuovere nodi manualmente è probabilmente sufficiente. Per gli scenari più complessi, gli SDK e le regole di scalabilità automatica che espongono la capacità di eseguire la scalabilità a livello di codice offrono alternative molto efficaci.

Esistono API Azure che consentono alle applicazioni di usare a livello di codice i set di scalabilità di macchine virtuali e i cluster Service Fabric. Se le opzioni di scalabilità automatica esistenti non funzionano per lo scenario specifico, queste API consentono di implementare una logica di scalabilità personalizzata.

Un approccio all'implementazione di questa funzionalità di scalabilità automatica "interna" consiste nell'aggiungere un nuovo servizio senza stato all'applicazione Service Fabric per gestire le operazioni di scalabilità. La creazione di un proprio servizio di scalabilità offre il massimo livello di controllo e personalizzazione sul comportamento di scalabilità dell'applicazione. Questo può essere utile per gli scenari che richiedono un controllo preciso su quando o su come un'applicazione viene ridimensionata o disattivata. Tuttavia, questo controllo include un compromesso della complessità del codice. Questo approccio richiede un codice di scalabilità proprio, il che non è semplice. All'interno del metodo RunAsync del servizio, un set di trigger può determinare se la scalabilità è necessaria, inclusi i parametri di controllo, come la dimensione massima di un cluster e i tempi di raffreddamento della scalabilità.

L'API usata per le interazioni del set di scalabilità di macchine virtuali (sia per controllare il numero corrente di istanze di macchina virtuale che per modificarla) è la libreria di calcolo fluente di Gestione di Azure. La libreria Fluent fornisce un'API facile da usare per l'interazione con i set di scalabilità di macchine virtuali. Per interagire con il cluster Service Fabric, usare System.Fabric.FabricClient.

Tuttavia, non è necessario che il codice di scalabilità sia in esecuzione come servizio nel cluster di cui modificare la scalabilità. Sia IAzure sia FabricClient possono connettersi in remoto alle risorse di Azure associate; il servizio di scalabilità può quindi essere facilmente un'applicazione console o il servizio Windows in esecuzione dall'esterno dell'applicazione Service Fabric.

Considerando queste limitazioni, è consigliabile implementare più modelli di scalabilità automatica personalizzati.

Ridimensionamento verticale

Modifica le risorse (CPU, memoria o archiviazione) dei nodi nel cluster.

Vantaggi: il software e l'architettura dell'applicazione rimangono inalterati.
Svantaggi: scalabilità finita, dal momento che la possibilità di aumento delle risorse nei singoli nodi è limitata. Tempo di inattività, perché sarà necessario portare offline i computer fisici o le macchine virtuali per aggiungere o rimuovere le risorse.

I set di scalabilità di macchine virtuali sono una risorsa di calcolo di Azure che è possibile usare per distribuire e gestire una raccolta di macchine virtuali come set. Ogni tipo di nodo definito in un cluster di Azure viene configurato come set di scalabilità di macchine virtuali separato. Ogni tipo di nodo può essere gestito separatamente. Il ridimensionamento di un tipo di nodo verso l'alto o il basso comporta l'aggiunta di un nuovo tipo di nodo (con SKU di macchina virtuale aggiornata) e la rimozione del tipo di nodo precedente.

Quando si ridimensiona un cluster di Azure, tenere presenti le linee guida seguenti:

Se si riducono le prestazioni di un tipo di nodo primario, è consigliabile non ridurle mai più di quanto consentito dal livello di affidabilità.

Il processo di ridimensionamento verticale di un tipo di nodo varia a seconda del fatto che si tratti di un tipo di nodo primario o non primario.

Ridimensionamento di tipi di nodo non primari

Creare un nuovo tipo di nodo con le risorse necessarie. Aggiornare i vincoli di posizionamento dei servizi in esecuzione in modo da includere il nuovo tipo di nodo. Gradualmente (una alla volta), ridurre a zero il numero di istanze del tipo di nodo precedente, in modo che l'affidabilità del cluster rimanga invariata. I servizi eseguiranno gradualmente la migrazione al nuovo tipo di nodo perché il tipo di nodo precedente viene rimosso.

Ridimensionamento del tipo di nodo primario

Distribuire un nuovo tipo di nodo primario con SKU di macchina virtuale aggiornato, quindi disabilitare le istanze del tipo di nodo primario originale una alla volta in modo che i servizi di sistema vengano migrati al nuovo set di scalabilità. Verificare che il cluster e i nuovi nodi siano integri, quindi rimuovere lo stato originale del set di scalabilità e del nodo per i nodi eliminati.

Se non è possibile, è possibile creare un nuovo cluster e ripristinare lo stato dell'applicazione (se applicabile) dal cluster precedente. Non è necessario ripristinare lo stato dei servizi di sistema, perché verrà ricreato quando si distribuiscono le applicazioni nel nuovo cluster. Se nel cluster venivano eseguite solo applicazioni senza stato, è sufficiente distribuire le applicazioni nel nuovo cluster, non sono necessarie operazioni di ripristino.

Passaggi successivi

Informazioni sulla scalabilità delle applicazioni.
Ridimensionamento orizzontale di un cluster di Azure.
Ridimensionamento di un cluster di Azure a livello di codice tramite l'SDK di calcolo di Azure Fluent.
Ridimensionamento orizzontale di un cluster autonomo.

Condividi tramite