Capacità di un'istanza di Gestione API di Azure

2025-06-16

Gestione API fornisce metriche di Monitoraggio di Azure per rilevare l'uso della capacità del sistema, consentendo di risolvere i problemi del gateway e prendere decisioni basate su informazioni aggiornate in merito alla necessità di ridimensionare o aggiornare un'istanza di Gestione API per supportare un carico maggiore.

Questo articolo illustra le metriche della capacità e il relativo comportamento, mostra come accedere alle metriche della capacità nel portale di Azure e suggerisce quando valutare la possibilità di ridimensionare o aggiornare l'istanza di Gestione API.

Importante

Questo articolo illustra come monitorare e ridimensionare l'istanza di Gestione API di Azure in base alle metriche della capacità. Tuttavia, quando un'istanza raggiunge la rispettiva capacità, non applicherà limitazioni per evitare l'overload. Si comporta invece come un server Web in overload: maggiore latenza, connessioni eliminate e errori di timeout. I client API devono essere pronti per gestire questi problemi come fanno con altri servizi esterni, ad esempio usando criteri di ripetizione dei tentativi.

Suggerimento

I team API possono usare questa funzionalità nelle aree di lavoro. Le aree di lavoro forniscono accesso amministrativo isolato alle API e ai propri ambienti di runtime API.

Prerequisiti

Per seguire la procedura descritta in questo articolo, è necessario avere un'istanza di Gestione API in uno dei livelli che supportano le metriche della capacità. Per altre informazioni, vedere Create an Azure API Management instance (Creare un'istanza di Gestione API di Azure).

Metriche della capacità disponibili

Le metriche della capacità diverse sono disponibili nei livelli di servizio v2, nei livelli classici e nei gateway dell'area di lavoro.

Nei livelli v2 sono disponibili le metriche seguenti:

Percentuale di CPU del gateway: percentuale di capacità della CPU usata dalle unità gateway.
Percentuale di memoria del gateway: percentuale di capacità della memoria usata dalle unità gateway.

Nota

Attualmente, la metrica Percentuale di memoria del gateway non è supportata nel livello Premium v2.

Le aggregazioni disponibili per queste metriche sono le seguenti.

Media: percentuale media di capacità usata nei processi del gateway in ogni unità di un'istanza di Gestione API.
Max: percentuale di capacità nel processo del gateway con il consumo più elevato.

L'utilizzo della CPU e della memoria indicano l'utilizzo delle risorse per:

Servizi del piano dati di Gestione API, ad esempio l'elaborazione delle richieste, che possono includere l'inoltro delle richieste o l'esecuzione di criteri.
Servizi del piano di gestione di Gestione API, ad esempio le azioni di gestione applicate tramite il portale di Azure o Azure Resource Manager, o il carico proveniente dal portale per sviluppatori.
Processi del sistema operativo selezionati, inclusi i processi che comportano costi per handshake TSL su nuove connessioni.
Aggiornamenti della piattaforma, ad esempio aggiornamenti del sistema operativo nelle risorse di calcolo sottostanti per l'istanza.
Numero di API distribuite, indipendentemente dall'attività, che possono utilizzare capacità aggiuntiva.

Comportamento delle metriche di capacità

Negli scenari reali, le metriche della capacità possono essere influenzate da molte variabili, ad esempio:

Modelli di connessione (nuova connessione su richiesta o riutilizzo della connessione esistente)
Dimensioni di richiesta e risposta
Criteri configurati per ogni API o numero di client che inviano richieste.

A una maggiore complessità delle operazioni sulle richieste corrisponde un utilizzo maggiore della capacità. Ad esempio, i criteri di trasformazione complessi usano molta più CPU rispetto a un semplice inoltro di richieste. La capacità aumenta anche in presenza di risposte lente dal servizio back-end.

Importante

Le metriche della capacità non sono misure dirette del numero di richieste elaborate.

Picchi delle metriche di capacità

Le metriche della capacità possono anche presentare picchi intermittenti o essere maggiori di zero, anche in assenza di richieste in fase di elaborazione. Ciò si verifica a causa di azioni specifiche del sistema o della piattaforma e non devono essere presi in considerazione quando si decide se ridimensionare un'istanza.

Sebbene le metriche di capacità siano progettate per rilevare problemi con l'istanza di Gestione API (o il gateway dell'area di lavoro), esistono casi in cui i problemi non si riflettono nelle modifiche apportate a queste metriche. Le metriche della capacità con valore basso, inoltre, non indicano necessariamente che l'istanza di Gestione API non stia riscontrando problemi.

Usare il portale di Azure per esaminare le metriche della capacità

Accedere alle metriche nel portale per comprendere la quantità di capacità usata nel tempo.

Accedere all'istanza di Gestione API nel portale di Azure.
Nel menu a sinistra, in Monitoraggio, selezionare Metriche.
Selezionare la Percentuale di CPU del gateway o Percentuale di memoria del gateway dalle metriche disponibili. Scegliere l'aggregazione Media predefinita oppure selezionare l'aggregazione Max per visualizzare il picco di utilizzo.
Selezionare un intervallo di tempo desiderato dalla barra superiore della sezione.

Importante

La metrica Capacità viene attualmente visualizzata nel portale anche per le istanze nei livelli v2. Non è tuttavia supportata per l'uso nei livelli v2 e mostra il valore 0.

Nota

È anche possibile impostare un avviso di metrica che si attivi se si verifica qualcosa di imprevisto. È ad esempio possibile ottenere notifiche quando l'istanza di Gestione API supera il picco previsto di utilizzo della CPU o della memoria per più di 20 minuti.

Usare la capacità per prendere decisioni per la scalabilità

Usare le metriche di capacità per prendere decisioni su come ridimensionare un'istanza di Gestione API (o un gateway dell'area di lavoro) per supportare un carico maggiore. Di seguito sono riportate le considerazioni generali:

Esaminare una tendenza a lungo termine e una media.
Ignorare i picchi improvvisi che molto probabilmente non sono legati a un aumento del carico (per la spiegazione, vedere la sezione Comportamento delle metriche di capacità).
Come regola generale, aggiornare o ridimensionare l'istanza quando il valore di una metrica della capacità supera il 60% - 70% per un periodo di tempo prolungato, ad esempio 30 minuti. Valori diversi possono essere più adatti a servizi o scenari specifici.
Se l'istanza o il gateway dell'area di lavoro sono configurati con solo 1 unità, aggiornarli o ridimensionarli quando un valore della metrica della capacità supera 40% per un lungo periodo. Questa raccomandazione si basa sulla necessità di riservare capacità per gli aggiornamenti del sistema operativo guest nella piattaforma del servizio sottostante.

Suggerimento

Se è possibile stimare il traffico in anticipo, testare l'istanza di Gestione API o il gateway dell'area di lavoro nei carichi di lavoro previsti. È possibile aumentare gradualmente il carico della richiesta e monitorare il valore della metrica di capacità corrispondente al carico di picco. Seguire i passaggi della sezione precedente per usare il portale di Azure per ottenere maggiori informazioni sulla quantità di capacità usata in qualsiasi momento.

Importante

Quando si definiscono le regole di autoscaling, assicurarsi di evitare la fluttuazione della scalabilità che potrebbe causare un ciclo continuo di aumenti e riduzioni della capacità. Per ulteriori informazioni, si consiglia di leggere le linee guida di Azure Monitor Autoscale sulla fluttuazione.

Condividi tramite

Informazioni fornite dalla metrica Capacity

Condividi tramite

Capacità di un'istanza di Gestione API di Azure

Prerequisiti

Metriche della capacità disponibili

Comportamento delle metriche di capacità

Usare il portale di Azure per esaminare le metriche della capacità

Usare la capacità per prendere decisioni per la scalabilità

Contenuto correlato

Commenti e suggerimenti

Risorse aggiuntive