Metriche supportate per Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
Nella tabella seguente sono elencate le metriche disponibili per il tipo di risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.
Intestazioni di tabella
Metrica: il nome visualizzato della metrica come viene visualizzato nella portale di Azure.
Nome nell'API REST : nome metrica denominato nell'API REST.
Unità - Unità di misura.
Aggregazione : tipo di aggregazione predefinito. Valori validi: Media, Minimo, Massimo, Totale, Conteggio.
Dimensioni - Dimensioni disponibili per la metrica.
Grani - temporaliIntervalli in cui viene campionata la metrica. Ad esempio, PT1M
indica che la metrica viene campionata ogni minuto, ogni 30 minuti, PT1H
PT30M
ogni ora e così via.
Esportazione DS: indica se la metrica è esportabile nei log di Monitoraggio di Azure tramite impostazioni di diagnostica. Per informazioni sull'esportazione delle metriche, vedere Creare impostazioni di diagnostica in Monitoraggio di Azure.
Per informazioni sulla conservazione delle metriche, vedere Panoramica delle metriche di Monitoraggio di Azure.
Category | Metrica | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Grani temporali | Esportazione DS |
---|---|---|---|---|---|---|---|
Risorsa | Percentuale di utilizzo della memoria CPU Percentuale di utilizzo della memoria in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto. |
CpuMemoryUtilizationPercentage |
Percentuale | Minimo, Massimo, Media | instanceId |
PT1M | Sì |
Risorsa | Percentuale di utilizzo cpu Percentuale di utilizzo della CPU in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto. |
CpuUtilizationPercentage |
Percentuale | Minimo, Massimo, Media | instanceId |
PT1M | Sì |
Risorsa | Errori di raccolta dati al minuto Numero di eventi di raccolta dati eliminati al minuto. |
DataCollectionErrorsPerMinute |
Conteggio | Minimo, Massimo, Media | instanceId , reason , type |
PT1M | No |
Risorsa | Eventi di raccolta dati al minuto Numero di eventi di raccolta dati elaborati al minuto. |
DataCollectionEventsPerMinute |
Conteggio | Minimo, Massimo, Media | instanceId , type |
PT1M | No |
Risorsa | Capacità di distribuzione Numero di istanze nella distribuzione. |
DeploymentCapacity |
Conteggio | Minimo, Massimo, Media | instanceId , State |
PT1M | No |
Risorsa | Utilizzo del disco Percentuale di utilizzo del disco in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto. |
DiskUtilization |
Percentuale | Minimo, Massimo, Media | instanceId , disk |
PT1M | Sì |
Risorsa | Energia GPU in Joules Energia di intervallo in Joules in un nodo GPU. L'energia viene segnalata a intervalli di un minuto. |
GpuEnergyJoules |
Conteggio | Minimo, Massimo, Media | instanceId |
PT1M | No |
Risorsa | Percentuale di utilizzo della memoria GPU Percentuale di utilizzo della memoria GPU in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto. |
GpuMemoryUtilizationPercentage |
Percentuale | Minimo, Massimo, Media | instanceId |
PT1M | Sì |
Risorsa | Percentuale di utilizzo della GPU Percentuale di utilizzo della GPU in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto. |
GpuUtilizationPercentage |
Percentuale | Minimo, Massimo, Media | instanceId |
PT1M | Sì |
Traffico | Richiesta latenza P50 Latenza della richiesta P50 media aggregata da tutti i valori di latenza della richiesta raccolti nel periodo di tempo selezionato |
RequestLatency_P50 |
Millisecondi | Media | <nessuna> | PT1M | Sì |
Traffico | Latenza richiesta P90 Latenza media della richiesta P90 aggregata da tutti i valori di latenza delle richieste raccolti nel periodo di tempo selezionato |
RequestLatency_P90 |
Millisecondi | Media | <nessuna> | PT1M | Sì |
Traffico | Latenza richiesta P95 Latenza media della richiesta P95 aggregata da tutti i valori di latenza delle richieste raccolti nel periodo di tempo selezionato |
RequestLatency_P95 |
Millisecondi | Media | <nessuna> | PT1M | Sì |
Traffico | Richiesta latenza P99 Latenza media della richiesta P99 aggregata da tutti i valori di latenza delle richieste raccolti nel periodo di tempo selezionato |
RequestLatency_P99 |
Millisecondi | Media | <nessuna> | PT1M | Sì |
Traffico | Richieste al minuto Numero di richieste inviate alla distribuzione online entro un minuto |
RequestsPerMinute |
Conteggio | Media | envoy_response_code |
PT1M | No |
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per