Piani di ridimensionamento automatico e scenari di esempio in Desktop virtuale Azure

La scalabilità automatica consente di ridimensionare le macchine virtuali (VM) dell'host di sessione in un pool di host in base alla pianificazione per ottimizzare i costi di distribuzione.

Nota

  • Desktop virtuale Azure (versione classica) non supporta la scalabilità automatica.
  • La scalabilità automatica non è supportata in Desktop virtuale Azure per Azure Stack HCI.
  • Non è possibile usare la scalabilità automatica e ridimensionare gli host di sessione usando Automazione di Azure nello stesso pool di host. È necessario usare uno o l'altro.
  • La scalabilità automatica è disponibile in Azure e Azure per enti pubblici nelle stesse aree in cui è possibile creare pool di host.

Per ottenere risultati ottimali, è consigliabile usare la scalabilità automatica con le macchine virtuali distribuite con modelli di Azure Resource Manager (ARM) di Desktop virtuale Azure o strumenti di prima parte di Microsoft.

Funzionamento di un piano di ridimensionamento

Prima di creare il piano, tenere presente quanto segue:

  • È possibile assegnare un piano di ridimensionamento a uno o più pool di host dello stesso tipo di pool di host. Le pianificazioni del piano di ridimensionamento verranno applicate a tutti i pool di host assegnati.

  • È possibile associare un solo piano di ridimensionamento per ogni pool di host. Se si assegna un singolo piano di ridimensionamento a più pool di host, tali pool di host non possono essere assegnati a un altro piano di ridimensionamento.

  • Hibernate (anteprima) è disponibile per i pool di host personali. Per altre informazioni, vedere ibernazione nelle macchine virtuali.

  • Un piano di ridimensionamento può funzionare solo nel fuso orario configurato.

  • Un piano di ridimensionamento può avere una o più pianificazioni. Ad esempio, pianificazioni diverse durante i giorni feriali rispetto al fine settimana.

  • Assicurarsi di comprendere i modelli di utilizzo prima di definire la pianificazione. Sarà necessario pianificare le ore seguenti del giorno:

    • Ramp-up: l'inizio del giorno, quando l'utilizzo viene prelevato.
    • Ore di punta: l'ora del giorno in cui si prevede che l'utilizzo sia al massimo.
    • Ramp-down:when usage tapers off. In genere, quando si arrestano le macchine virtuali per risparmiare sui costi.
    • Orari di minore attività: l'ora del giorno in cui si prevede che l'utilizzo sia al minimo.
  • Il piano di ridimensionamento avrà effetto non appena lo si abilita.

Tenere inoltre presenti queste limitazioni:

  • Non usare la scalabilità automatica in combinazione con altri strumenti di ridimensionamento Microsoft o di terze parti. Assicurarsi di disabilitare quelli per i pool di host a cui si applicano i piani di ridimensionamento.

  • Per i pool di host in pool, la scalabilità automatica sovrascrive la modalità di svuotamento, quindi assicurarsi di usare i tag di esclusione durante l'aggiornamento delle macchine virtuali nei pool di host.

  • Per i pool di host in pool, la scalabilità automatica ignora gli algoritmi di bilanciamento del carico esistenti nelle impostazioni del pool di host e applica invece il bilanciamento del carico in base alla configurazione della pianificazione.

Scenari di esempio per la scalabilità automatica per i pool di host in pool

In questa sezione sono disponibili quattro scenari che illustrano il funzionamento di parti diverse della scalabilità automatica per i pool di host in pool in pool. In ogni esempio sono presenti tabelle che mostrano le impostazioni del pool di host e dimostrazioni visive animate.

Nota

Per altre informazioni sul significato dei termini dei parametri, vedere il glossario della scalabilità automatica.

Scenario 1: Quando la scalabilità automatica attiva le macchine virtuali?

In questo scenario si dimostrerà che la scalabilità automatica può attivare le macchine virtuali dell'host sessione in qualsiasi fase della pianificazione del piano di ridimensionamento quando la capacità del pool di host usato supera la soglia di capacità.

Si esaminerà, ad esempio, la configurazione del pool di host seguente, come descritto in questa tabella:

Parametro Valore
Fase Ramp-up
Totale host di sessione 6
Algoritmo di bilanciamento del carico Bilanciamento in ampiezza
Soglia di capacità 30%
Percentuale minima di host 30%
Host di sessione disponibili 2
Limite massimo di sessioni 5
Capacità del pool di host disponibile 10
Sessioni utente 0
Capacità del pool di host usata 0%

All'inizio di questa fase, la scalabilità automatica ha attivato due host di sessione in modo che corrispondano alla percentuale minima di host. Anche se il 30% di sei non è un numero intero, la scalabilità automatica arrotonda fino al numero intero più vicino. Avere due host di sessione disponibili e un limite massimo di cinque sessioni per host significa che questo pool di host ha una capacità di pool di host disponibile pari a 10. Poiché attualmente non sono presenti sessioni utente, la capacità del pool di host usato è 0%.

All'inizio del giorno, si supponga che tre utenti esecano e avviino le sessioni utente. Le sessioni utente vengono distribuite uniformemente tra i due host di sessione disponibili, perché l'algoritmo di bilanciamento del carico è il primo. La capacità del pool di host disponibile è ancora 10, ma con le tre nuove sessioni utente, la capacità del pool di host usato è ora del 30%. Tuttavia, la scalabilità automatica non attiva le macchine virtuali (VM) fino a quando la capacità del pool di host usato non è maggiore della soglia di capacità. In questo esempio, la soglia di capacità è del 30%, quindi la scalabilità automatica non attiva ancora alcuna macchina virtuale.

A questo punto, i parametri del pool di host hanno un aspetto simile al seguente:

Parametro Valore
Fase Ramp-up
Totale host di sessione 6
Algoritmo di bilanciamento del carico Bilanciamento in ampiezza
Soglia di capacità 30%
Percentuale minima di host 30%
Host di sessione disponibili 2
Limite massimo di sessioni 5
Capacità del pool di host disponibile 10
Sessioni utente 3
Capacità del pool di host usata 30%

Quando un altro utente accede e avvia una sessione, sono ora disponibili quattro sessioni di utenti totali distribuite tra due host di sessione. La capacità del pool di host usata è ora del 40%, maggiore della soglia di capacità. Di conseguenza, la scalabilità automatica attiva un altro host di sessione per portare la capacità del pool di host usato a un valore inferiore o uguale alla soglia di capacità (30%).

Di seguito sono riportati i parametri quando la capacità del pool di host usato supera la soglia di capacità:

Parametro Valore
Fase Ramp-up
Totale host di sessione 6
Algoritmo di bilanciamento del carico Bilanciamento in ampiezza
Soglia di capacità 30%
Percentuale minima di host 30%
Host di sessione disponibili 2
Limite massimo di sessioni 5
Capacità del pool di host disponibile 10
Sessioni utente 4
Capacità del pool di host usata 40 %

Ecco i parametri dopo l'attivazione della scalabilità automatica su un altro host di sessione:

Parametro Valore
Fase Ramp-up
Totale host di sessione 6
Algoritmo di bilanciamento del carico Bilanciamento in ampiezza
Soglia di capacità 30%
Percentuale minima di host 30%
Host di sessione disponibili 3
Limite massimo di sessioni 5
Capacità del pool di host disponibile 15
Sessioni utente 4
Capacità del pool di host usata 27%

L'attivazione di un altro host di sessione indica che nel pool di host sono ora disponibili tre host di sessione. Con il limite massimo di sessione ancora cinque, la capacità del pool di host disponibile è salita a 15. Poiché la capacità del pool di host disponibile è aumentata, la capacità del pool di host usato è passata al 27%, che è inferiore alla soglia di capacità del 30%.

Quando un altro utente accede, sono ora disponibili cinque sessioni utente distribuite tra tre host di sessione disponibili. La capacità del pool di host usata è ora del 33%, che supera la soglia di capacità del 30%. Il superamento della soglia di capacità attiva la scalabilità automatica per attivare un altro host di sessione.

Poiché l'esempio è in fase di aumento, è probabile che i nuovi utenti continuino ad accedere. Man mano che arrivano più utenti, il modello diventa più chiaro:

Totale sessioni utente Numero di host di sessione disponibili Capacità del pool di host disponibile Soglia di capacità Capacità del pool di host usata La scalabilità automatica attiva un altro host di sessione?
5 3 15 30% 33%
5 4 20 30% 25% No
6 4 20 30% 30% No
7 4 20 30% 35%
7 5 25 30% 28% No

Come illustrato in questa tabella, la scalabilità automatica attiva solo i nuovi host di sessione quando la capacità del pool di host usato supera la soglia di capacità. Se la capacità del pool di host usata è superiore o inferiore alla soglia di capacità, la scalabilità automatica non attiva nuovi host di sessione.

L'animazione seguente è un riepilogo visivo degli elementi appena usciti nello scenario 1.

A visual recap of Scenario 1.

Scenario 2: Quando la scalabilità automatica disattiva le macchine virtuali?

In questo scenario si mostrerà che la scalabilità automatica disattiva gli host sessione quando sono vere tutte le cose seguenti:

  • La capacità del pool di host usata è inferiore alla soglia di capacità.
  • La scalabilità automatica può disattivare gli host di sessione senza superare la soglia di capacità.
  • La scalabilità automatica disattiva solo gli host di sessione senza sessioni utente su di essi (a meno che il piano di ridimensionamento non sia in fase di riduzione delle prestazioni e che sia stata abilitata l'impostazione forza disconnessione).
  • La scalabilità automatica in pool non disattiva gli host sessione nella fase di ramp-up per evitare un'esperienza utente non valida.

Per questo scenario, il pool di host inizia a essere simile al seguente:

Parametro Valore
Fase Peak
Totale host di sessione 6
Algoritmo di bilanciamento del carico Bilanciamento in ampiezza
Soglia di capacità 30%
Percentuale minima di host 30%
Host di sessione disponibili 5
Limite massimo di sessioni 5
Capacità del pool di host disponibile 25
Sessioni utente 7
Capacità del pool di host usata 28%

Poiché la fase di picco è in corso, è possibile prevedere che il numero di utenti rimanga relativamente stabile. Tuttavia, per mantenere stabile la quantità di risorse usate, pur rimanendo efficiente, la scalabilità automatica attiva e disattiva gli host di sessione in base alle esigenze.

Si supponga quindi che siano presenti sette utenti che hanno eseguito l'accesso durante le ore di punta. Se il numero totale di sessioni utente è sette, ciò renderebbe la capacità del pool di host usato del 28%. Poiché la scalabilità automatica non può disattivare un host sessione senza la capacità del pool di host usato che supera la soglia di capacità, la scalabilità automatica non disattiva ancora alcun host di sessione.

Se due dei sette utenti si disconnetteno durante la pausa pranzo, lascia cinque sessioni utente tra cinque host di sessione. Poiché il limite massimo di sessione è ancora cinque, la capacità del pool di host disponibile è 25. Avere solo cinque utenti significa che la capacità del pool di host usato è ora del 20%. La scalabilità automatica deve ora verificare se può disattivare un host di sessione senza fare in modo che la capacità del pool di host usato passi oltre la soglia di capacità.

Se la scalabilità automatica ha disattivato un host di sessione, la capacità del pool di host disponibile sarà 20. Con cinque utenti, la capacità del pool di host usato sarebbe quindi del 25%. Poiché il 25% è inferiore alla soglia di capacità del 30%, la scalabilità automatica selezionerà un host di sessione senza sessioni utente, lo metta in modalità di svuotamento e lo disattiva.

Quando la scalabilità automatica disattiva uno degli host di sessione senza sessioni utente, sono rimasti quattro host di sessione disponibili. Il limite massimo di sessione del pool di host è ancora cinque, quindi la capacità del pool di host disponibile è 20. Poiché sono presenti cinque sessioni utente, la capacità del pool di host usata è del 25%, che è ancora al di sotto della soglia di capacità.

Tuttavia, se un altro utente si disconnette e si trova a pranzo, sono ora disponibili quattro sessioni utente distribuite tra i quattro host di sessione nel pool di host. Poiché il limite massimo di sessione è ancora cinque, la capacità del pool di host disponibile è 20 e la capacità del pool di host usato è del 20%. La disattivazione di un altro host di sessione lascia tre host sessione e una capacità del pool di host disponibile pari a 15, il che fa sì che la capacità del pool di host usato salti fino a circa il 27%. Anche se il 27% è inferiore alla soglia di capacità, non vi sono host di sessione con zero sessioni utente. La scalabilità automatica selezionerà l'host di sessione con il minor numero di sessioni utente, lo renderà in modalità di svuotamento e attenderà che tutte le sessioni utente si disconnetteranno prima di disattivarlo. Se in qualsiasi momento la capacità del pool di host usato raggiunge un punto in cui la scalabilità automatica non può più disattivare l'host della sessione, l'host della sessione verrà disattivato dalla modalità di svuotamento.

L'animazione seguente è un riepilogo visivo delle operazioni appena passate nello scenario 2.

A visual recap of Scenario 2.

Scenario 3: Quando la scalabilità automatica impone agli utenti di disconnettersi?

La scalabilità automatica impone agli utenti di disconnettersi solo se è stata abilitata l'impostazione di disconnessione forzata durante la fase di riduzione della pianificazione del piano di ridimensionamento. L'impostazione force logoff non disconnette gli utenti durante qualsiasi altra fase della pianificazione del piano di ridimensionamento.

Si esamini ad esempio un pool di host con i parametri seguenti:

Parametro Valore
Fase Ramp-down
Totale host di sessione 6
Algoritmo di bilanciamento del carico Depth-first
Soglia di capacità 75%
Percentuale minima di host 10%
Host di sessione disponibili 4
Limite massimo di sessioni 5
Capacità del pool di host disponibile 20
Sessioni utente 4
Capacità del pool di host usata 20%

Durante la fase di spostamento, l'amministratore del pool di host ha impostato la soglia di capacità sul 75% e la percentuale minima di host su 10%. La presenza di una soglia di capacità elevata e una bassa percentuale minima di host in questa fase riduce la necessità di attivare nuovi host di sessione alla fine del giorno lavorativo.

Per questo scenario, si supponga che attualmente siano presenti quattro utenti nei quattro host di sessione disponibili in questo pool di host. Poiché la capacità del pool di host disponibile è 20, significa che la capacità del pool di host usato è del 20%. In base a queste informazioni, la scalabilità automatica rileva che può disattivare due host di sessione senza superare la soglia di capacità del 75%. Tuttavia, poiché sono presenti sessioni utente in tutti gli host di sessione nel pool di host, per disattivare due host di sessione, la scalabilità automatica dovrà forzare gli utenti a disconnettersi.

Quando è stata abilitata l'impostazione di forza disconnessione, la scalabilità automatica selezionerà gli host di sessione con le sessioni utente più poche e quindi gli host sessione saranno in modalità di svuotamento. La scalabilità automatica invia quindi agli utenti nella sessione selezionata le notifiche che verranno disconnesse forzatamente dalle sessioni dopo un determinato periodo di tempo. Una volta trascorso il tempo, se gli utenti non hanno già terminato le sessioni, la scalabilità automatica terminerà forzatamente le sessioni. In questo scenario, poiché sono presenti un numero uguale di sessioni utente in ognuno degli host di sessione nel pool di host, la scalabilità automatica sceglierà due host di sessione in modo casuale per disconnettere forzatamente tutti gli utenti e quindi disattiva gli host di sessione.

Quando la scalabilità automatica disattiva i due host sessione, la capacità del pool di host disponibile è ora 10. Ora che sono state lasciate solo due sessioni utente, la capacità del pool di host usato è del 20%, come illustrato nella tabella seguente.

Parametro Valore
Fase Ramp-down
Totale host di sessione 6
Algoritmo di bilanciamento del carico Depth-first
Soglia di capacità 75%
Percentuale minima di host 10%
Host di sessione disponibili 2
Limite massimo di sessioni 5
Capacità del pool di host disponibile 10
Sessioni utente 2
Capacità del pool di host usata 20%

Si supponga ora che i due utenti costretti a disconnettersi vogliano continuare a lavorare e accedere di nuovo. Poiché la capacità del pool di host disponibile è ancora 10, la capacità del pool di host usato è ora del 40%, che è al di sotto della soglia di capacità del 75%. Tuttavia, la scalabilità automatica non può disattivare più host di sessione, perché ciò lascia solo un host sessione disponibile e una capacità del pool di host disponibile di cinque. Con quattro utenti, ciò renderebbe la capacità del pool di host usata 80%, che supera la soglia di capacità.

I parametri sono quindi simili al seguente:

Parametro Valore
Fase Ramp-down
Totale host di sessione 6
Algoritmo di bilanciamento del carico Depth-first
Soglia di capacità 75%
Percentuale minima di host 10%
Host di sessione disponibili 2
Limite massimo di sessioni 5
Capacità del pool di host disponibile 10
Sessioni utente 4
Capacità del pool di host usata 40 %

Se a questo punto un altro utente si disconnette, lascia solo tre sessioni utente distribuite tra i due host di sessione disponibili. In altre parole, il pool di host è ora simile al seguente:

Parametro Valore
Fase Ramp-down
Totale host di sessione 6
Algoritmo di bilanciamento del carico Depth-first
Soglia di capacità 75%
Percentuale minima di host 10%
Host di sessione disponibili 2
Limite massimo di sessioni 5
Capacità del pool di host disponibile 10
Sessioni utente 3
Capacità del pool di host usata 30%

Poiché il limite massimo di sessione è ancora cinque e la capacità del pool di host disponibile è 10, la capacità del pool di host usato è ora del 30%. La scalabilità automatica può ora disattivare un host di sessione senza superare la soglia di capacità. La scalabilità automatica disattiva un host di sessione scegliendo l'host sessione con il minor numero di sessioni utente. La scalabilità automatica inserisce quindi l'host di sessione in modalità di svuotamento, invia agli utenti una notifica che indica che l'host sessione verrà disattivato, quindi dopo un determinato periodo di tempo, disconnette forzatamente gli utenti rimanenti e lo disattiva. Dopo questa operazione, nel pool di host è disponibile un host sessione rimanente con un limite massimo di cinque sessioni, rendendo la capacità del pool di host disponibile cinque.

Poiché la scalabilità automatica ha costretto un utente a disconnettersi quando si disattiva l'host di sessione scelto, sono state lasciate solo due sessioni utente, che rende la capacità del pool di host usata al 40%.

Per riepilogare, ecco l'aspetto del pool di host:

Parametro Valore
Fase Ramp-down
Totale host di sessione 6
Limite massimo di sessioni 5
Algoritmo di bilanciamento del carico Depth-first
Soglia di capacità 75%
Percentuale minima di host 10%
Capacità del pool di host disponibile 5
Sessioni utente 2
Host di sessione disponibili 1
Capacità del pool di host usata 40 %

Successivamente, si immagini che l'utente che è stato costretto a disconnettersi esegue nuovamente l'accesso, rendendo il pool di host simile al seguente:

Parametro Valore
Fase Ramp-down
Totale host di sessione 6
Algoritmo di bilanciamento del carico Depth-first
Soglia di capacità 75%
Percentuale minima di host 10%
Host di sessione disponibili 1
Limite massimo di sessioni 5
Capacità del pool di host disponibile 5
Sessioni utente 3
Capacità del pool di host usata 60%

Sono ora disponibili tre sessioni utente nel pool di host. Tuttavia, la capacità del pool di host è ancora cinque, il che significa che la capacità del pool di host usato è del 60% e inferiore alla soglia di capacità. Poiché la disattivazione dell'host sessione rimanente renderebbe zero la capacità del pool di host disponibile, che è inferiore al 10% della percentuale minima di host, la scalabilità automatica garantisce che durante la fase di ramp-down sia sempre presente almeno un host di sessione disponibile.

L'animazione seguente è un riepilogo visivo delle operazioni appena passate nello scenario 3.

A visual recap of Scenario 3.

Scenario 4: Come funzionano i tag di esclusione?

Quando una macchina virtuale ha un nome di tag che corrisponde al tag di esclusione del piano di ridimensionamento, la scalabilità automatica non la attiva, disattiva o modifica l'impostazione della modalità di svuotamento. I tag di esclusione sono applicabili in tutte le fasi della pianificazione del piano di scalabilità.

Ecco il pool di host di esempio con cui si inizia:

Parametro Valore
Fase Punta
Totale host di sessione 6
Algoritmo di bilanciamento del carico Bilanciamento in ampiezza
Soglia di capacità 75%
Percentuale minima di host 10%
Host di sessione disponibili 1
Limite massimo di sessioni 5
Capacità del pool di host disponibile 5
Sessioni utente 3
Capacità del pool di host usata 60%

In questo scenario di esempio, l'amministratore del pool di host applica il tag di esclusione del piano di ridimensionamento a cinque degli host della sessione. Quando un nuovo utente accede, questo porta il numero totale di sessioni utente fino a quattro. È disponibile un solo host sessione e il limite massimo di sessione del pool di host è ancora cinque, quindi la capacità del pool di host disponibile è cinque. La capacità del pool di host utilizzata è 80%. Tuttavia, anche se la capacità del pool di host usato è maggiore della soglia di capacità, la scalabilità automatica non attiva altri host di sessione perché tutti gli host di sessione, ad eccezione di quello attualmente in esecuzione, sono stati contrassegnati con il tag di esclusione.

Il pool di host è quindi simile al seguente:

Parametro Valore
Fase Punta
Totale host di sessione 6
Algoritmo di bilanciamento del carico Bilanciamento in ampiezza
Soglia di capacità 75%
Percentuale minima di host 10%
Host di sessione disponibili 1
Limite massimo di sessioni 5
Capacità del pool di host disponibile 5
Sessioni utente 4
Capacità del pool di host usata 80%

Si supponga quindi che tutti e quattro gli utenti abbiano eseguito la disconnessità, lasciando invariate le sessioni utente nell'host sessione disponibile. Poiché nel pool di host non sono presenti sessioni utente, la capacità del pool di host usata è 0. La scalabilità automatica manterrà l'host di una singola sessione nonostante non abbia utenti, perché durante la fase di minore attività, la percentuale minima di host di scalabilità automatica determina che deve mantenere disponibile almeno un host di sessione durante questa fase.

Per riepilogare, il pool di host è ora simile al seguente:

Parametro Valore
Fase Punta
Totale host di sessione 6
Algoritmo di bilanciamento del carico Bilanciamento in ampiezza
Soglia di capacità 75%
Percentuale minima di host 10%
Host di sessione disponibili 1
Limite massimo di sessioni 5
Capacità del pool di host disponibile 5
Sessioni utente 0
Capacità del pool di host usata 0%

Se l'amministratore applica il nome del tag di esclusione all'ultima macchina virtuale host di sessione senza tag e la disattiva, significa che anche se altri utenti tentano di accedere, la scalabilità automatica non sarà in grado di attivare una macchina virtuale per supportare la sessione utente. L'utente visualizzerà un errore "Nessuna risorsa disponibile".

Tuttavia, non è possibile riattivare le macchine virtuali significa che il pool di host non sarà in grado di soddisfare la percentuale minima di host. Per risolvere eventuali problemi potenziali che causano, l'amministratore rimuove i tag di esclusione da due macchine virtuali. La scalabilità automatica attiva solo una delle macchine virtuali, perché richiede solo una macchina virtuale per soddisfare il requisito minimo del 10%.

Infine, il pool di host sarà simile al seguente:

Parametro Valore
Fase Punta
Totale host di sessione 6
Algoritmo di bilanciamento del carico Bilanciamento in ampiezza
Soglia di capacità 75%
Percentuale minima di host 19%
Host di sessione disponibili 1
Limite massimo di sessioni 5
Capacità del pool di host disponibile 5
Sessioni utente 0
Capacità del pool di host usata 0%

L'animazione seguente è un riepilogo visivo delle operazioni appena passate nello scenario 4.

A visual recap of Scenario 4.

Passaggi successivi

  • Per informazioni su come creare piani di ridimensionamento per la scalabilità automatica, vedere Creare il ridimensionamento automatico per i pool di host di Desktop virtuale Azure.
  • Per esaminare i termini associati alla scalabilità automatica, vedere il glossario della scalabilità automatica.
  • Per risposte alle domande frequenti sulla scalabilità automatica, vedere domande frequenti sulla scalabilità automatica.