Capacità di un'istanza di Gestione API di Azure
SI APPLICA A: Developer | Basic | Basic v2 | Standard | Standard v2 | Premium
Gestione API fornisce metriche di Monitoraggio di Azure per rilevare l'uso della capacità del sistema, consentendo di risolvere i problemi del gateway e prendere decisioni basate su informazioni aggiornate in merito alla necessità di ridimensionare o aggiornare un'istanza di Gestione API per supportare un carico maggiore.
Questo articolo illustra le metriche della capacità e il relativo comportamento, mostra come accedere alle metriche della capacità nel portale di Azure e suggerisce quando valutare la possibilità di ridimensionare o aggiornare l'istanza di Gestione API.
Nota
Attualmente, questa funzionalità non è disponibile nelle aree di lavoro.
Importante
Questo articolo illustra come monitorare e ridimensionare l'istanza di Gestione API di Azure in base alle metriche della capacità. Tuttavia, quando un'istanza raggiunge la rispettiva capacità, non applicherà limitazioni per evitare l'overload. Al contrario, fungerà da server Web in overload, ovvero presenterà maggiore latenza, connessioni interrotte ed errori di timeout. I client API devono essere pronti per gestire questi problemi come fanno con altri servizi esterni, ad esempio usando criteri di ripetizione dei tentativi.
Prerequisiti
Per seguire la procedura descritta in questo articolo, è necessario avere un'istanza di Gestione API in uno dei livelli che supportano le metriche della capacità. Per altre informazioni, vedere Create an Azure API Management instance (Creare un'istanza di Gestione API di Azure).
Metriche della capacità disponibili
Sono disponibili diverse metriche della capacità nei livelli di servizio v2 e classici.
Nei livelli v2 sono disponibili le metriche seguenti:
Percentuale di CPU del gateway: percentuale di capacità della CPU usata dalle unità gateway.
Percentuale di memoria del gateway: percentuale di capacità della memoria usata dalle unità gateway.
Le aggregazioni disponibili per queste metriche sono le seguenti.
- Media: percentuale media di capacità usata nei processi del gateway in ogni unità di un'istanza di Gestione API.
- Max: percentuale di capacità nel processo del gateway con il consumo più elevato.
L'utilizzo della CPU e della memoria indicano l'utilizzo delle risorse per:
- Servizi del piano dati di Gestione API, ad esempio l'elaborazione delle richieste, che possono includere l'inoltro delle richieste o l'esecuzione di criteri.
- Servizi del piano di gestione di Gestione API, ad esempio le azioni di gestione applicate tramite il portale di Azure o Azure Resource Manager, o il carico proveniente dal portale per sviluppatori.
- Processi del sistema operativo selezionati, inclusi i processi che comportano costi per handshake TSL su nuove connessioni.
- Aggiornamenti della piattaforma, ad esempio aggiornamenti del sistema operativo nelle risorse di calcolo sottostanti per l'istanza.
- Numero di API distribuite, indipendentemente dall'attività, che possono utilizzare capacità aggiuntiva.
Comportamento delle metriche di capacità
Negli scenari reali, le metriche della capacità possono essere influenzate da molte variabili, ad esempio:
- Modelli di connessione (nuova connessione su richiesta o riutilizzo della connessione esistente)
- Dimensioni di richiesta e risposta
- Criteri configurati per ogni API o numero di client che inviano richieste.
A una maggiore complessità delle operazioni sulle richieste corrisponde un utilizzo maggiore della capacità. Ad esempio, i criteri di trasformazione complessi usano molta più CPU rispetto a un semplice inoltro di richieste. La capacità aumenta anche in presenza di risposte lente dal servizio back-end.
Importante
Le metriche della capacità non sono misure dirette del numero di richieste elaborate.
Le metriche della capacità possono anche presentare picchi intermittenti o essere maggiori di zero, anche in assenza di richieste in fase di elaborazione. Ciò si verifica a causa di azioni specifiche del sistema o della piattaforma e non devono essere presi in considerazione quando si decide se ridimensionare un'istanza.
Anche se le metriche della capacità sono progettate per individuare problemi relativi all'istanza di Gestione API, esistono casi in cui i problemi non si riflettono nelle modifiche apportate a queste metriche. Le metriche della capacità con valore basso, inoltre, non indicano necessariamente che l'istanza di Gestione API non stia riscontrando problemi.
Usare il portale di Azure per esaminare le metriche della capacità
Accedere alle metriche nel portale per comprendere la quantità di capacità usata nel tempo.
- Accedere all'istanza di Gestione API nel portale di Azure.
- Nel menu a sinistra, in Monitoraggio, selezionare Metriche.
- Selezionare la Percentuale di CPU del gateway o Percentuale di memoria del gateway dalle metriche disponibili. Scegliere l'aggregazione Media predefinita oppure selezionare l'aggregazione Max per visualizzare il picco di utilizzo.
- Selezionare un intervallo di tempo desiderato dalla barra superiore della sezione.
Importante
La metrica Capacità viene attualmente visualizzata nel portale anche per le istanze nei livelli v2. Non è tuttavia supportata per l'uso nei livelli v2 e mostra il valore 0.
Nota
È anche possibile impostare un avviso di metrica che si attivi se si verifica qualcosa di imprevisto. È ad esempio possibile ottenere notifiche quando l'istanza di Gestione API supera il picco previsto di utilizzo della CPU o della memoria per più di 20 minuti.
Usare la capacità per prendere decisioni per la scalabilità
Usare le metriche della capacità per prendere decisioni sull'opportunità di ridimensionare un'istanza di Gestione API per gestire un carico maggiore. Di seguito sono riportate le considerazioni generali:
- Esaminare una tendenza a lungo termine e una media.
- Ignorare i picchi improvvisi che molto probabilmente non sono legati a un aumento del carico (per la spiegazione, vedere la sezione Comportamento delle metriche di capacità).
- Come regola generale, aggiornare o ridimensionare l'istanza quando il valore di una metrica della capacità supera il 60% - 70% per un periodo di tempo prolungato, ad esempio 30 minuti. Valori diversi possono essere più adatti a servizi o scenari specifici.
- Se l'istanza è configurata con una sola unità, aggiornare o ridimensionare l'istanza quando il valore di una metrica della capacità supera il 40% per un periodo di tempo prolungato. Questa raccomandazione si basa sulla necessità di riservare capacità per gli aggiornamenti del sistema operativo guest nella piattaforma del servizio sottostante.
Suggerimento
Se si è in grado di stimare il traffico in anticipo, testare l'istanza di Gestione API sui carichi di lavoro previsti. È possibile aumentare il carico delle richieste nel tenant gradualmente e monitorare il valore delle metriche di capacità corrispondenti al carico di picco. Seguire i passaggi della sezione precedente per usare il portale di Azure per ottenere maggiori informazioni sulla quantità di capacità usata in qualsiasi momento.