Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
SI APPLICA A: Sviluppatore | Basic | Basic v2 | Standard | Standard v2 | Premium | Premium v2
Gestione API fornisce metriche di Monitoraggio di Azure per rilevare l'uso della capacità del sistema, consentendo di risolvere i problemi del gateway e prendere decisioni basate su informazioni aggiornate in merito alla necessità di ridimensionare o aggiornare un'istanza di Gestione API per supportare un carico maggiore.
Questo articolo illustra le metriche della capacità e il relativo comportamento, mostra come accedere alle metriche della capacità nel portale di Azure e suggerisce quando valutare la possibilità di ridimensionare o aggiornare l'istanza di Gestione API.
Importante
Questo articolo illustra come monitorare e ridimensionare l'istanza di Gestione API di Azure in base alle metriche della capacità. Tuttavia, quando un'istanza raggiunge la rispettiva capacità, non applicherà limitazioni per evitare l'overload. Si comporta invece come un server Web in overload: maggiore latenza, connessioni eliminate e errori di timeout. I client API devono essere pronti per gestire questi problemi come fanno con altri servizi esterni, ad esempio usando criteri di ripetizione dei tentativi.
Suggerimento
I team API possono usare questa funzionalità nelle aree di lavoro. Le aree di lavoro forniscono accesso amministrativo isolato alle API e ai propri ambienti di runtime API.
Prerequisiti
Per seguire la procedura descritta in questo articolo, è necessario avere un'istanza di Gestione API in uno dei livelli che supportano le metriche della capacità. Per altre informazioni, vedere Create an Azure API Management instance (Creare un'istanza di Gestione API di Azure).
Metriche della capacità disponibili
Le metriche della capacità diverse sono disponibili nei livelli di servizio v2, nei livelli classici e nei gateway dell'area di lavoro.
Nei livelli v2 sono disponibili le metriche seguenti:
Percentuale di CPU del gateway: percentuale di capacità della CPU usata dalle unità gateway.
Percentuale di memoria del gateway: percentuale di capacità della memoria usata dalle unità gateway.
Nota
Attualmente, la metrica Percentuale di memoria del gateway non è supportata nel livello Premium v2.
Le aggregazioni disponibili per queste metriche sono le seguenti.
- Media: percentuale media di capacità usata nei processi del gateway in ogni unità di un'istanza di Gestione API.
- Max: percentuale di capacità nel processo del gateway con il consumo più elevato.
L'utilizzo della CPU e della memoria indicano l'utilizzo delle risorse per:
- Servizi del piano dati di Gestione API, ad esempio l'elaborazione delle richieste, che possono includere l'inoltro delle richieste o l'esecuzione di criteri.
- Servizi del piano di gestione di Gestione API, ad esempio le azioni di gestione applicate tramite il portale di Azure o Azure Resource Manager, o il carico proveniente dal portale per sviluppatori.
- Processi del sistema operativo selezionati, inclusi i processi che comportano costi per handshake TSL su nuove connessioni.
- Aggiornamenti della piattaforma, ad esempio aggiornamenti del sistema operativo nelle risorse di calcolo sottostanti per l'istanza.
- Numero di API distribuite, indipendentemente dall'attività, che possono utilizzare capacità aggiuntiva.
Comportamento delle metriche di capacità
Negli scenari reali, le metriche della capacità possono essere influenzate da molte variabili, ad esempio:
- Modelli di connessione (nuova connessione su richiesta o riutilizzo della connessione esistente)
- Dimensioni di richiesta e risposta
- Criteri configurati per ogni API o numero di client che inviano richieste.
A una maggiore complessità delle operazioni sulle richieste corrisponde un utilizzo maggiore della capacità. Ad esempio, i criteri di trasformazione complessi usano molta più CPU rispetto a un semplice inoltro di richieste. La capacità aumenta anche in presenza di risposte lente dal servizio back-end.
Importante
Le metriche della capacità non sono misure dirette del numero di richieste elaborate.
Le metriche della capacità possono anche presentare picchi intermittenti o essere maggiori di zero, anche in assenza di richieste in fase di elaborazione. Ciò si verifica a causa di azioni specifiche del sistema o della piattaforma e non devono essere presi in considerazione quando si decide se ridimensionare un'istanza.
Sebbene le metriche di capacità siano progettate per rilevare problemi con l'istanza di Gestione API (o il gateway dell'area di lavoro), esistono casi in cui i problemi non si riflettono nelle modifiche apportate a queste metriche. Le metriche della capacità con valore basso, inoltre, non indicano necessariamente che l'istanza di Gestione API non stia riscontrando problemi.
Usare il portale di Azure per esaminare le metriche della capacità
Accedere alle metriche nel portale per comprendere la quantità di capacità usata nel tempo.
- Accedere all'istanza di Gestione API nel portale di Azure.
- Nel menu a sinistra, in Monitoraggio, selezionare Metriche.
- Selezionare la Percentuale di CPU del gateway o Percentuale di memoria del gateway dalle metriche disponibili. Scegliere l'aggregazione Media predefinita oppure selezionare l'aggregazione Max per visualizzare il picco di utilizzo.
- Selezionare un intervallo di tempo desiderato dalla barra superiore della sezione.
Importante
La metrica Capacità viene attualmente visualizzata nel portale anche per le istanze nei livelli v2. Non è tuttavia supportata per l'uso nei livelli v2 e mostra il valore 0.
Nota
È anche possibile impostare un avviso di metrica che si attivi se si verifica qualcosa di imprevisto. È ad esempio possibile ottenere notifiche quando l'istanza di Gestione API supera il picco previsto di utilizzo della CPU o della memoria per più di 20 minuti.
Usare la capacità per prendere decisioni per la scalabilità
Usare le metriche di capacità per prendere decisioni su come ridimensionare un'istanza di Gestione API (o un gateway dell'area di lavoro) per supportare un carico maggiore. Di seguito sono riportate le considerazioni generali:
- Esaminare una tendenza a lungo termine e una media.
- Ignorare i picchi improvvisi che molto probabilmente non sono legati a un aumento del carico (per la spiegazione, vedere la sezione Comportamento delle metriche di capacità).
- Come regola generale, aggiornare o ridimensionare l'istanza quando il valore di una metrica della capacità supera il 60% - 70% per un periodo di tempo prolungato, ad esempio 30 minuti. Valori diversi possono essere più adatti a servizi o scenari specifici.
- Se l'istanza o il gateway dell'area di lavoro sono configurati con solo 1 unità, aggiornarli o ridimensionarli quando un valore della metrica della capacità supera 40% per un lungo periodo. Questa raccomandazione si basa sulla necessità di riservare capacità per gli aggiornamenti del sistema operativo guest nella piattaforma del servizio sottostante.
Suggerimento
Se è possibile stimare il traffico in anticipo, testare l'istanza di Gestione API o il gateway dell'area di lavoro nei carichi di lavoro previsti. È possibile aumentare gradualmente il carico della richiesta e monitorare il valore della metrica di capacità corrispondente al carico di picco. Seguire i passaggi della sezione precedente per usare il portale di Azure per ottenere maggiori informazioni sulla quantità di capacità usata in qualsiasi momento.
Importante
Quando si definiscono le regole di autoscaling, assicurarsi di evitare la fluttuazione della scalabilità che potrebbe causare un ciclo continuo di aumenti e riduzioni della capacità. Per ulteriori informazioni, si consiglia di leggere le linee guida di Azure Monitor Autoscale sulla fluttuazione.