Поддерживаемые метрики для Microsoft.MachineLearningServices/workspaces
В следующей таблице перечислены метрики, доступные для типа ресурса Microsoft.MachineLearningServices/workspaces.
Заголовки таблиц
Метрика — отображаемое имя метрики, отображаемое в портал Azure.
Имя в Rest API — имя метрики, указанное в REST API.
Единица измерения — единица измерения.
Агрегирование — тип агрегирования по умолчанию. Допустимые значения: Average, Minimum, Maximum, Total, Count.
Размеры - Измерения , доступные для метрики.
Интервалы - времениИнтервалы выборки метрики. Например, указывает, PT1M
что выборка метрики выполняется каждую минуту, PT30M
каждые 30 минут, PT1H
каждый час и т. д.
Экспорт DS — можно ли экспортировать метрику в журналы Azure Monitor с помощью параметров диагностики. Сведения об экспорте метрик см. в статье Создание параметров диагностики в Azure Monitor.
Сведения о хранении метрик см. в статье Общие сведения о метриках Azure Monitor.
Список поддерживаемых журналов см. в разделе Поддерживаемые категории журналов — Microsoft.MachineLearningServices/workspaces.
Категория | Metric | Имя в REST API | Unit | Агрегирование | Измерения | Интервалы времени | Экспорт DS |
---|---|---|---|---|---|---|---|
Quota | Активные ядра Число активных ядер |
Active Cores |
Count | Среднее, максимальное, минимальное, общее | Scenario , ClusterName |
PT1M | Да |
Quota | Активные узлы Число активных узлов. Это узлы, активно выполняющие задание. |
Active Nodes |
Count | Среднее, максимальное, минимальное, общее | Scenario , ClusterName |
PT1M | Да |
Выполнить | Cancel Requested Runs Количество запусков, для которых была запрошена отмена для этой рабочей области. Счетчик обновляется при получении запроса на отмену выполнения. |
Cancel Requested Runs |
Count | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Да |
Выполнить | Cancelled Runs Количество запусков, отмененных для этой рабочей области. Счетчик обновляется при успешной отмене выполнения. |
Cancelled Runs |
Count | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Да |
Выполнить | Завершенные запуски Число выполнений, успешно завершенных для этой рабочей области. Значение счетчика обновляется после выполнения и сбора выходных данных. |
Completed Runs |
Count | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Да |
Ресурс | CpuCapacityMillicores Максимальная емкость узла ЦП в MilliCores. Емкость агрегируется за интервал длительностью 1 минута. |
CpuCapacityMillicores |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , ComputeName |
PT1M | Да |
Ресурс | CpuMemoryCapacityMegabytes Максимальный уровень использования памяти для узла ЦП в мегабайтах. Сведения об использовании агрегируются за интервал длительностью 1 минута. |
CpuMemoryCapacityMegabytes |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , ComputeName |
PT1M | Да |
Ресурс | CpuMemoryUtilizationMegabytes Уровень использования памяти для узла ЦП в мегабайтах. Сведения об использовании агрегируются за интервал длительностью 1 минута. |
CpuMemoryUtilizationMegabytes |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , ComputeName |
PT1M | Да |
Ресурс | CpuMemoryUtilizationPercentage Процент использования памяти для узла ЦП. Сведения об использовании агрегируются за интервал длительностью 1 минута. |
CpuMemoryUtilizationPercentage |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , ComputeName |
PT1M | Да |
Ресурс | CpuUtilization Процент использования на узле ЦП. Сведения об использовании поступают каждую минуту. |
CpuUtilization |
Count | Среднее, максимальное, минимальное, общее | Scenario , runId , NodeId , ClusterName |
PT1M | Да |
Ресурс | CpuUtilizationMillicores Сведения об использовании узла ЦП в MilliCores. Сведения об использовании агрегируются за интервал длительностью 1 минута. |
CpuUtilizationMillicores |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , ComputeName |
PT1M | Да |
Ресурс | CpuUtilizationPercentage Процент использования узла ЦП. Сведения об использовании агрегируются за интервал длительностью 1 минута. |
CpuUtilizationPercentage |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , ComputeName |
PT1M | Да |
Ресурс | DiskAvailMegabytes Доступное дисковое пространство, в мегабайтах. Метрики собираются с периодичностью в 1 минуту. |
DiskAvailMegabytes |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , ComputeName |
PT1M | Да |
Ресурс | DiskReadMegabytes Данные считываются с диска в мегабайтах. Метрики собираются с периодичностью в 1 минуту. |
DiskReadMegabytes |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , ComputeName |
PT1M | Да |
Ресурс | DiskUsedMegabytes Используемое дисковое пространство, в мегабайтах. Метрики собираются с периодичностью в 1 минуту. |
DiskUsedMegabytes |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , ComputeName |
PT1M | Да |
Ресурс | DiskWriteMegabytes Данные, записанные на диск, в мегабайтах. Метрики собираются с периодичностью в 1 минуту. |
DiskWriteMegabytes |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , ComputeName |
PT1M | Да |
Выполнить | ошибки Число ошибок запуска в этой рабочей области. Значение счетчика обновляется при возникновении ошибки в процессе выполнения. |
Errors |
Count | Total, Average, Minimum, Maximum, Count | Scenario |
PT1M | Да |
Выполнить | циклы выполнения со сбоем; Количество запусков, завершившихся сбоем для этой рабочей области. Значение счетчика обновляется при сбое выполнения. |
Failed Runs |
Count | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Да |
Выполнить | Finalizing Runs Число выполнений, вошедших в состояние завершения для этой рабочей области. Значение счетчика обновляется, как выполнение уже завершено, но сбор выходных данных еще выполняется. |
Finalizing Runs |
Count | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Да |
Ресурс | GpuCapacityMilliGPUs Максимальная емкость устройства GPU в милли-GPU. Емкость агрегируется за интервал длительностью 1 минута. |
GpuCapacityMilliGPUs |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , DeviceId , ComputeName |
PT1M | Да |
Ресурс | GpuEnergyJoules Интервальное энергопотребления в джоулях на узле GPU. Сведения об энергопотреблении поступают каждую минуту. |
GpuEnergyJoules |
Count | Среднее, максимальное, минимальное, общее | Scenario , runId , rootRunId , InstanceId , DeviceId , ComputeName |
PT1M | Да |
Ресурс | GpuMemoryCapacityMegabytes Максимальный объем памяти для устройства GPU в мегабайтах. Объем памяти агрегируется каждую минуту. |
GpuMemoryCapacityMegabytes |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , DeviceId , ComputeName |
PT1M | Да |
Ресурс | GpuMemoryUtilization Процент использования памяти на узле GPU. Сведения об использовании поступают каждую минуту. |
GpuMemoryUtilization |
Count | Среднее, максимальное, минимальное, общее | Scenario , runId , NodeId , DeviceId , ClusterName |
PT1M | Да |
Ресурс | GpuMemoryUtilizationMegabytes Использование памяти устройством GPU в мегабайтах. Использование памяти агрегируется каждую минуту. |
GpuMemoryUtilizationMegabytes |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , DeviceId , ComputeName |
PT1M | Да |
Ресурс | GpuMemoryUtilizationPercentage Процент использования памяти устройством GPU. Использование памяти агрегируется каждую минуту. |
GpuMemoryUtilizationPercentage |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , DeviceId , ComputeName |
PT1M | Да |
Ресурс | GpuUtilization Процент использования на узле GPU. Сведения об использовании поступают каждую минуту. |
GpuUtilization |
Count | Среднее, максимальное, минимальное, общее | Scenario , runId , NodeId , DeviceId , ClusterName |
PT1M | Да |
Ресурс | GpuUtilizationMilliGPUs Использование устройства GPU в милли-GPU. Сведения об использовании агрегируются за интервал длительностью 1 минута. |
GpuUtilizationMilliGPUs |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , DeviceId , ComputeName |
PT1M | Да |
Ресурс | GpuUtilizationPercentage Процент использования устройства GPU. Сведения об использовании агрегируются за интервал длительностью 1 минута. |
GpuUtilizationPercentage |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , DeviceId , ComputeName |
PT1M | Да |
Ресурс | IBReceiveMegabytes Данные сети, полученные через InfiniBand, в мегабайтах. Метрики собираются с периодичностью в 1 минуту. |
IBReceiveMegabytes |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , ComputeName , DeviceId |
PT1M | Да |
Ресурс | IBTransmitMegabytes Данные сети, отправленные через InfiniBand, в мегабайтах. Метрики собираются с периодичностью в 1 минуту. |
IBTransmitMegabytes |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , ComputeName , DeviceId |
PT1M | Да |
Quota | Бездействующие ядра Число бездействующих ядер |
Idle Cores |
Count | Среднее, максимальное, минимальное, общее | Scenario , ClusterName |
PT1M | Да |
Quota | Бездействующие узлы Количество узлов в неактивном состоянии. Узлы в неактивном состоянии — это узлы, на которых не выполняются никакие задания, но они могут принимать новые задания. |
Idle Nodes |
Count | Среднее, максимальное, минимальное, общее | Scenario , ClusterName |
PT1M | Да |
Quota | Освобождаемые ядра Число освобождаемых ядер |
Leaving Cores |
Count | Среднее, максимальное, минимальное, общее | Scenario , ClusterName |
PT1M | Да |
Quota | Освобождаемые узлы Число освобождаемых узлов. Освобождаемые узлы — это узлы, которые только что завершили обработку задания и переходят в неактивное состояние. |
Leaving Nodes |
Count | Среднее, максимальное, минимальное, общее | Scenario , ClusterName |
PT1M | Да |
Моделирование | Неудачные развертывания модели Число развертываний моделей, завершившихся сбоем в этой рабочей области |
Model Deploy Failed |
Count | Total, Average, Minimum, Maximum, Count | Scenario , StatusCode |
PT1M | Да |
Моделирование | Начатые развертывания модели Число развертываний моделей, запущенных в этой рабочей области |
Model Deploy Started |
Count | Total, Average, Minimum, Maximum, Count | Scenario |
PT1M | Да |
Моделирование | Успешные развертывания модели Число развертываний моделей, завершившихся успешно в этой рабочей области |
Model Deploy Succeeded |
Count | Total, Average, Minimum, Maximum, Count | Scenario |
PT1M | Да |
Моделирование | Неудачные регистрации модели Число неудачных регистраций моделей в этой рабочей области |
Model Register Failed |
Count | Total, Average, Minimum, Maximum, Count | Scenario , StatusCode |
PT1M | Да |
Моделирование | Успешные регистрации модели Число регистраций моделей, завершившихся успешно в этой рабочей области |
Model Register Succeeded |
Count | Total, Average, Minimum, Maximum, Count | Scenario |
PT1M | Да |
Ресурс | NetworkInputMegabytes Полученные данные сети в мегабайтах. Метрики собираются с периодичностью в 1 минуту. |
NetworkInputMegabytes |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , ComputeName , DeviceId |
PT1M | Да |
Ресурс | NetworkOutputMegabytes Отправленные данные сети в мегабайтах. Метрики собираются с периодичностью в 1 минуту. |
NetworkOutputMegabytes |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , ComputeName , DeviceId |
PT1M | Да |
Выполнить | Not Responding Runs Число неотвечающих запусков для этой рабочей области. Значение счетчика обновляется, когда выполнение переходит в состояние "Не отвечает". |
Not Responding Runs |
Count | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Да |
Выполнить | Not Started Runs Число запусков в состоянии "Не запущено" для этой рабочей области. Значение счетчика обновляется при получении запроса на создание выполнения, но сведения о выполнении еще не заполнены. |
Not Started Runs |
Count | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Да |
Quota | Замещенные ядра Количество замещенных ядер |
Preempted Cores |
Count | Среднее, максимальное, минимальное, общее | Scenario , ClusterName |
PT1M | Да |
Quota | Замещенные узлы Количество замещенных узлов. Это узлы с низким приоритетом, взятые из пула доступных узлов. |
Preempted Nodes |
Count | Среднее, максимальное, минимальное, общее | Scenario , ClusterName |
PT1M | Да |
Выполнить | Preparing Runs Число запусков, которые подготавливаются для этой рабочей области. Значение счетчиков обновляется, когда выполнение переходит в состояние подготовки во время подготовки среды выполнения. |
Preparing Runs |
Count | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Да |
Выполнить | Provisioning Runs Число запусков, которые подготавливаются для этой рабочей области. Значение счетчика обновляется, когда запуск ожидает создания или подготовки целевого объекта вычислений. |
Provisioning Runs |
Count | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Да |
Выполнить | Queued Runs Число запусков, которые находятся в очереди для этой рабочей области. Значение счетчика обновляется, когда запуск помещается в очередь целевого объекта вычислений. Может возникнуть при ожидании готовности требуемых вычислительных узлов. |
Queued Runs |
Count | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Да |
Quota | Процент использования квоты Процент использования квоты |
Quota Utilization Percentage |
Count | Среднее, максимальное, минимальное, общее | Scenario , ClusterName , VmFamilyName , VmPriority |
PT1M | Да |
Выполнить | Начатые запуски Число запусков в этой рабочей области. Значение счетчика обновляется, когда запуск на требуемых ресурсах начинается. |
Started Runs |
Count | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Да |
Выполнить | Starting Runs Количество запусков, начавшихся для этой рабочей области. Значение счетчика обновляется после запроса на создание запуска и заполнения сведений о запуске, например идентификатора запуска |
Starting Runs |
Count | Total, Average, Minimum, Maximum, Count | Scenario , RunType , PublishedPipelineId , ComputeType , PipelineStepType , ExperimentName |
PT1M | Да |
Ресурс | StorageAPIFailureCount Число сбоев вызовов API Хранилища BLOB-объектов Azure. |
StorageAPIFailureCount |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , ComputeName |
PT1M | Да |
Ресурс | StorageAPISuccessCount Число успешных вызовов API Хранилища BLOB-объектов Azure. |
StorageAPISuccessCount |
Count | Среднее, максимальное, минимальное, общее | RunId , InstanceId , ComputeName |
PT1M | Да |
Quota | Всего ядер Общее число ядер |
Total Cores |
Count | Среднее, максимальное, минимальное, общее | Scenario , ClusterName |
PT1M | Да |
Quota | Всего узлов Общее число узлов. Сюда входят некоторые активные узлы, бездействующие узлы, неиспользуемые узлы, замещенные узлы и освобождаемые узлы |
Total Nodes |
Count | Среднее, максимальное, минимальное, общее | Scenario , ClusterName |
PT1M | Да |
Quota | Недоступные для использования ядра Число ядер, непригодных для использования |
Unusable Cores |
Count | Среднее, максимальное, минимальное, общее | Scenario , ClusterName |
PT1M | Да |
Quota | Недоступные для использования узлы Число узлов, непригодных для использования. Узлы, непригодные для использования, не работают из-за неразрешимой проблемы. Azure выполнит повторный запуск этих узлов. |
Unusable Nodes |
Count | Среднее, максимальное, минимальное, общее | Scenario , ClusterName |
PT1M | Да |
Выполнить | Предупреждения Число предупреждений запуска в этой рабочей области. Значение счетчика обновляется каждый раз, когда для запуска возникает предупреждение. |
Warnings |
Count | Total, Average, Minimum, Maximum, Count | Scenario |
PT1M | Да |
Кері байланыс
https://aka.ms/ContentUserFeedback.
Жақында қолжетімді болады: 2024 жыл бойы біз GitHub Issues жүйесін мазмұнға арналған кері байланыс механизмі ретінде біртіндеп қолданыстан шығарамыз және оны жаңа кері байланыс жүйесімен ауыстырамыз. Қосымша ақпаратты мұнда қараңыз:Жіберу және пікірді көру