Metriche supportate per Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Articolo
03/26/2024

Nella tabella seguente sono elencate le metriche disponibili per il tipo di risorsa Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Intestazioni di tabella

Metrica: il nome visualizzato della metrica come viene visualizzato nella portale di Azure.
Nome nell'API REST : nome metrica denominato nell'API REST.
Unità - Unità di misura.
Aggregazione : tipo di aggregazione predefinito. Valori validi: Media, Minimo, Massimo, Totale, Conteggio.
Dimensioni - Dimensioni disponibili per la metrica.
Grani - temporaliIntervalli in cui viene campionata la metrica. Ad esempio, PT1M indica che la metrica viene campionata ogni minuto, ogni 30 minuti, PT1HPT30M ogni ora e così via.
Esportazione DS: indica se la metrica è esportabile nei log di Monitoraggio di Azure tramite impostazioni di diagnostica. Per informazioni sull'esportazione delle metriche, vedere Creare impostazioni di diagnostica in Monitoraggio di Azure.

Per informazioni sulla conservazione delle metriche, vedere Panoramica delle metriche di Monitoraggio di Azure.

Category	Metrica	Nome nell'API REST	Unità	Aggregazione	Dimensioni	Grani temporali	Esportazione DS
Risorsa	Percentuale di utilizzo della memoria CPU Percentuale di utilizzo della memoria in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto.	`CpuMemoryUtilizationPercentage`	Percentuale	Minimo, Massimo, Media	`instanceId`	PT1M	Sì
Risorsa	Percentuale di utilizzo cpu Percentuale di utilizzo della CPU in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto.	`CpuUtilizationPercentage`	Percentuale	Minimo, Massimo, Media	`instanceId`	PT1M	Sì
Risorsa	Errori di raccolta dati al minuto Numero di eventi di raccolta dati eliminati al minuto.	`DataCollectionErrorsPerMinute`	Conteggio	Minimo, Massimo, Media	`instanceId`, `reason`, `type`	PT1M	No
Risorsa	Eventi di raccolta dati al minuto Numero di eventi di raccolta dati elaborati al minuto.	`DataCollectionEventsPerMinute`	Conteggio	Minimo, Massimo, Media	`instanceId`, `type`	PT1M	No
Risorsa	Capacità di distribuzione Numero di istanze nella distribuzione.	`DeploymentCapacity`	Conteggio	Minimo, Massimo, Media	`instanceId`, `State`	PT1M	No
Risorsa	Utilizzo del disco Percentuale di utilizzo del disco in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto.	`DiskUtilization`	Percentuale	Minimo, Massimo, Media	`instanceId`, `disk`	PT1M	Sì
Risorsa	Energia GPU in Joules Energia di intervallo in Joules in un nodo GPU. L'energia viene segnalata a intervalli di un minuto.	`GpuEnergyJoules`	Conteggio	Minimo, Massimo, Media	`instanceId`	PT1M	No
Risorsa	Percentuale di utilizzo della memoria GPU Percentuale di utilizzo della memoria GPU in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto.	`GpuMemoryUtilizationPercentage`	Percentuale	Minimo, Massimo, Media	`instanceId`	PT1M	Sì
Risorsa	Percentuale di utilizzo della GPU Percentuale di utilizzo della GPU in un'istanza. L'utilizzo viene segnalato a intervalli di un minuto.	`GpuUtilizationPercentage`	Percentuale	Minimo, Massimo, Media	`instanceId`	PT1M	Sì
Traffico	Richiesta latenza P50 Latenza della richiesta P50 media aggregata da tutti i valori di latenza della richiesta raccolti nel periodo di tempo selezionato	`RequestLatency_P50`	Millisecondi	Media	<nessuna>	PT1M	Sì
Traffico	Latenza richiesta P90 Latenza media della richiesta P90 aggregata da tutti i valori di latenza delle richieste raccolti nel periodo di tempo selezionato	`RequestLatency_P90`	Millisecondi	Media	<nessuna>	PT1M	Sì
Traffico	Latenza richiesta P95 Latenza media della richiesta P95 aggregata da tutti i valori di latenza delle richieste raccolti nel periodo di tempo selezionato	`RequestLatency_P95`	Millisecondi	Media	<nessuna>	PT1M	Sì
Traffico	Richiesta latenza P99 Latenza media della richiesta P99 aggregata da tutti i valori di latenza delle richieste raccolti nel periodo di tempo selezionato	`RequestLatency_P99`	Millisecondi	Media	<nessuna>	PT1M	Sì
Traffico	Richieste al minuto Numero di richieste inviate alla distribuzione online entro un minuto	`RequestsPerMinute`	Conteggio	Media	`envoy_response_code`	PT1M	No

Metriche supportate per Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Commenti e suggerimenti

Commenti e suggerimenti

Risorse aggiuntive