Regole di scalabilità automatica

Completato

In questa unità vengono illustrati i concetti delle regole di scalabilità automatica. Quindi, nell'esercizio successivo vengono attivate le regole.

Regole

La scalabilità automatica si basa su un set di condizioni, regole e limiti di scalabilità. Una condizione di scalabilità combina un orario con un set di regole di scalabilità. Se l'ora corrente rientra nel periodo definito nella condizione di scalabilità, vengono valutate le regole di scalabilità della condizione. I risultati di questa valutazione determinano se aggiungere o rimuovere istanze. La condizione di scalabilità definisce anche i limiti di scalabilità, per il numero massimo e minimo di istanze.

La scalabilità automatica di Azure Spring Apps consente di aumentare o ridurre il numero di istanze in esecuzione in base alle metriche. Le regole di scalabilità automatica elaborano queste metriche. È possibile creare regole complesse sovrapposte, secondo le esigenze della situazione locale.

Condizioni di scalabilità automatica

Esistono due tipi di regole:

  • Regole basate sulle metriche
  • Regole basate sulla pianificazione

Nei tipi basati sulle metriche il numero di app e risorse viene aumentato fino alla quantità necessaria per gestire il carico, senza superare i limiti massimi stabiliti. Analogamente, il numero di app e risorse viene ridotto fino alla quantità necessaria per supportare il carico, senza scendere al di sotto dei valori minimi impostati.

Nelle regole basate sulla pianificazione la capacità delle app viene aumentata e ridotta in base alla pianificazione e ai limiti predefiniti. Questo tipo di regola è utile per i casi che spesso seguono un modello prevedibile e per stabilire una linea di base per il ridimensionamento basato sulle metriche.

È possibile creare più condizioni di scalabilità automatica per gestire diverse metriche e pianificazioni. Azure ridimensiona automaticamente il servizio quando si applica una di queste condizioni. È anche possibile definire una condizione predefinita che viene usata se nessuna delle altre condizioni è applicabile. Questa condizione è sempre attiva e non dispone di una pianificazione.

Azioni di scalabilità automatica

Quando una regola di scalabilità automatica rileva che una metrica ha superato una soglia, esegue un'azione di scalabilità automatica. Un'azione di scalabilità automatica può essere di aumento del numero di istanze o di riduzione del numero di istanze. Un'azione di aumento aumenta il numero di istanze e un'azione di riduzione riduce il numero di istanze. Un'azione di scalabilità automatica usa un operatore (ad esempio, minore di, maggiore di, uguale a e così via) per determinare come rispondere alla soglia. Le azioni di aumento del numero di istanze in genere usano l'operatore maggiore di per confrontare il valore della metrica con la soglia. Le azioni di riduzione del numero di istanze tendono a confrontare il valore della metrica con la soglia usando l'operatore minore di. Un'azione di scalabilità automatica può inoltre impostare il numero di istanze su un livello specifico, anziché incrementare o ridurre il numero disponibile.

Un'azione di scalabilità automatica ha un periodo di disattivazione, espresso in minuti. Durante questo intervallo, la regola di scalabilità non può essere attivata nuovamente. Il periodo di disattivazione consente al sistema di stabilizzarsi tra gli eventi di scalabilità automatica. Tenere presente che è necessario tempo per avviare o arrestare le istanze, pertanto le metriche raccolte potrebbero non mostrare modifiche significative per diversi minuti.

La stima per la riduzione del numero di istanze è prevista per evitare situazioni di instabilità in cui le azioni di aumento e riduzione vengono continuamente invertite. Tenere presente questo comportamento quando si scelgono le stesse soglie per l'aumento e la riduzione della capacità.