Udostępnij za pośrednictwem


Obsługiwane metryki dla microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

W poniższej tabeli wymieniono metryki dostępne dla typu zasobu Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Nagłówki tabeli

Metryka — nazwa wyświetlana metryki wyświetlana wyświetlana w witrynie Azure Portal.
Nazwa w interfejsie API REST — nazwa metryki określona w interfejsie API REST.
Jednostka — jednostka miary.
Agregacja — domyślny typ agregacji. Prawidłowe wartości: Average, Minimum, Maximum, Total, Count.
- Wymiary dostępne dla metryki.
Interwały ziarna - czasu, w których próbkowana jest metryka. Na przykład wskazuje, PT1M że metryka jest próbkowana co minutę, PT30M co 30 minut, PT1H co godzinę itd.
Eksportowanie ds — określa, czy metryka jest eksportowana do dzienników usługi Azure Monitor za pośrednictwem ustawień diagnostycznych.

Aby uzyskać informacje na temat eksportowania metryk, zobacz Tworzenie ustawień diagnostycznych w usłudze Azure Monitor.

Aby uzyskać informacje na temat przechowywania metryk, zobacz Omówienie metryk usługi Azure Monitor.

Kategoria Metric Nazwa w interfejsie API REST Jednostka Agregacja Wymiary Ziarna czasu Eksportowanie ds
Zasób Procent wykorzystania pamięci procesora CPU

Procent wykorzystania pamięci w wystąpieniu. Wykorzystanie jest zgłaszane w odstępach jednej minuty.
CpuMemoryUtilizationPercentage Procent Minimum, Maksimum, Średnia instanceId PT1M Tak
Zasób Procent wykorzystania procesora CPU

Procent wykorzystania procesora CPU w wystąpieniu. Wykorzystanie jest zgłaszane w odstępach jednej minuty.
CpuUtilizationPercentage Procent Minimum, Maksimum, Średnia instanceId PT1M Tak
Zasób Błędy zbierania danych na minutę

Liczba zdarzeń zbierania danych spadła na minutę.
DataCollectionErrorsPerMinute Count Minimum, Maksimum, Średnia instanceId, , reasontype PT1M Nie.
Zasób Zdarzenia zbierania danych na minutę

Liczba przetworzonych zdarzeń zbierania danych na minutę.
DataCollectionEventsPerMinute Count Minimum, Maksimum, Średnia instanceId, type PT1M Nie.
Zasób Pojemność wdrożenia

Liczba wystąpień we wdrożeniu.
DeploymentCapacity Count Minimum, Maksimum, Średnia instanceId, State PT1M Nie.
Zasób Wykorzystanie dysku

Procent wykorzystania dysku w wystąpieniu. Wykorzystanie jest zgłaszane w odstępach jednej minuty.
DiskUtilization Procent Minimum, Maksimum, Średnia instanceId, disk PT1M Tak
Zasób Energia procesora GPU w joulesach

Interwał energii w joules w węźle procesora GPU. Energia jest zgłaszana w odstępach jednej minuty.
GpuEnergyJoules Count Minimum, Maksimum, Średnia instanceId PT1M Nie.
Zasób Procent wykorzystania pamięci procesora GPU

Procent wykorzystania pamięci procesora GPU w wystąpieniu. Wykorzystanie jest zgłaszane w odstępach jednej minuty.
GpuMemoryUtilizationPercentage Procent Minimum, Maksimum, Średnia instanceId PT1M Tak
Zasób Procent wykorzystania procesora GPU

Procent wykorzystania procesora GPU w wystąpieniu. Wykorzystanie jest zgłaszane w odstępach jednej minuty.
GpuUtilizationPercentage Procent Minimum, Maksimum, Średnia instanceId PT1M Tak
Ruch Opóźnienie żądania P50

Średnie opóźnienie żądania P50 zagregowane według wszystkich wartości opóźnienia żądań zebranych w wybranym okresie
RequestLatency_P50 Milisekundy Średnia <none> PT1M Tak
Ruch Opóźnienie żądania P90

Średnie opóźnienie żądania P90 zagregowane według wszystkich wartości opóźnienia żądań zebranych w wybranym okresie
RequestLatency_P90 Milisekundy Średnia <none> PT1M Tak
Ruch Opóźnienie żądania P95

Średnie opóźnienie żądania P95 zagregowane przez wszystkie wartości opóźnienia żądań zebrane w wybranym okresie
RequestLatency_P95 Milisekundy Średnia <none> PT1M Tak
Ruch Opóźnienie żądania P99

Średnie opóźnienie żądania P99 zagregowane przez wszystkie wartości opóźnienia żądań zebrane w wybranym okresie
RequestLatency_P99 Milisekundy Średnia <none> PT1M Tak
Ruch Żądania na minutę

Liczba żądań wysyłanych do wdrożenia online w ciągu minuty
RequestsPerMinute Count Średnia envoy_response_code PT1M Nie.