Мониторинг и анализ заданий в Студии
С помощью Студии машинного обучения Azure можно отслеживать и упорядочивать задания для обучения и экспериментирования, а также выполнять их мониторинг. Журнал заданий машинного обучения является важным элементом подробного и воспроизводимого процесса разработки машинного обучения.
В этой статье показано, как выполнять следующие задачи:
- добавление отображаемого имени задания;
- создание настраиваемого представления;
- добавление описания задания;
- пометка и поиск заданий;
- поиск по журналу заданий;
- отмена или принудительный сбой заданий;
- мониторинг состояния заданий через уведомления по электронной почте.
- Мониторинг ресурсов задания (предварительная версия)
Совет
- Сведения об использовании пакета SDK Машинного обучения Azure версии 1 и CLI версии 1 см. в разделе Отслеживание, мониторинг и анализ заданий (версия 1).
- Сведения о мониторинге заданий обучения из CLI или пакета SDK версии 2 см. в разделе Отслеживание экспериментов с помощью MLflow и CLI версии 2.
- Дополнительные сведения о мониторинге службы машинного обучения Azure и связанных служб Azure см. в разделе Как выполнять мониторинг машинного обучения Azure.
Сведения о мониторинге моделей, развернутых на сетевых конечных точках, см. в разделе Мониторинг сетевых конечных точек.
Предварительные требования
Потребуется следующее:
- Для использования машинного обучения Azure необходима подписка Azure. Если у вас еще нет подписки Azure, создайте бесплатную учетную запись, прежде чем начинать работу. Попробуйте бесплатную или платную версию Машинного обучения Azure.
- У вас должна быть рабочая область Машинного обучения Azure. Создание рабочей области описано в разделе Установка, настройка и использование CLI (версия 2).
Отображаемое имя задания
Отображаемое имя задания — это необязательное настраиваемое имя, которое можно указать для задания. Чтобы изменить отображаемое имя задания, выполните указанные ниже действия.
Перейдите к списку Задания.
Выберите задание для редактирования.
Нажмите кнопку Изменить, чтобы изменить отображаемое имя задания.
Пользовательское представление
Чтобы просмотреть задания в студии, выполните указанные ниже действия.
Перейдите на вкладку Задания.
Выберите Все эксперименты, чтобы просмотреть все задания эксперимента, или Все задания, чтобы просмотреть все задания, отправлявшиеся из рабочей области.
На странице Все задания можно отфильтровать задания по тегам, экспериментам, целевым объектам вычислений и многим другим параметрам, чтобы лучше упорядочить и определить область для своей работы.
На этой странице вы можете выбирать задания для сравнения, добавлять диаграммы и применять фильтры. Эти изменения можно сохранить как Пользовательское представление, чтобы можно было легко вернуться к работе. Пользователи с разрешениями рабочей области могут изменять или просматривать пользовательские представления. Кроме того, можно предоставить общий доступ к пользовательскому представлению членам группы, чтобы расширить совместную работу, выбрав Опубликовать представление.
Чтобы просмотреть журналы задания, выберите конкретное задание. На вкладке Вывод + журналы можно найти журналы диагностики и ошибок для данного задания.
Описание задания
Задание можно дополнить описанием, чтобы предоставить больше контекста и данных. Также можно выполнять поиск по этим описаниям из списка заданий и добавлять описание задания в качестве столбца в список.
Перейдите на страницу Сведения о задании и щелкните значок редактирования (или карандаш), чтобы добавить, изменить или удалить описание для задания. Чтобы сохранить изменения в списке заданий, сохраните изменения в существующем или новом пользовательском представлении. Для описаний задания поддерживается формат Markdown, позволяющий внедрять изображения и прямые ссылки на них, как показано ниже.
Пометка и поиск заданий
В Машинном обучении Azure можно использовать свойства и теги для упорядочения заданий, а также для запроса и получения важной информации.
Изменение тегов
В Студии можно добавлять, изменять и удалять теги задания. Перейдите на страницу Сведения о задании и щелкните значок редактирования (или карандаш), чтобы добавить, изменить или удалить теги для задания. Также можно выполнять поиск и фильтрацию по этим тегам со страницы списка заданий.
Запрос свойств и тегов
Вы можете выполнять запросы по заданиям эксперимента для получения списка заданий, соответствующих указанным свойствам и тегам.
Чтобы найти конкретные задания, перейдите к списку Все задания. В этом случае существует два варианта.
Нажмите кнопку Добавить фильтр и выберите фильтр по тегам, чтобы отфильтровать задания по тегу, который был им назначен.
ИЛИИспользуйте панель поиска для быстрого поиска заданий по таким метаданным, как состояние задания, описание, имя эксперимента и имя отправителя.
Отмена или принудительный сбой задания
Если вы заметили ошибку или задание занимает слишком много времени, его можно отменить.
Чтобы отменить задание в студии, выполните указанные ниже действия.
Перейдите к конвейеру задания в разделе Эксперименты или Конвейеры.
Выберите номер задания конвейера, который нужно отменить.
На панели инструментов нажмите кнопку Отмена.
Мониторинг состояния задания через уведомления по электронной почте
На портале Azure на панели навигации слева выберите вкладку Монитор.
Выберите Параметры диагностики, а затем выберите + Добавить параметр диагностики.
В поле "Параметр диагностики"
- в разделе Сведения о категории выберите AmlRunStatusChangedEvent.
- В разделе Сведения о назначении выберите Отправить в рабочую область Log Analytics, а затем заполните поля Подписка и Рабочая область Log Analytics.
Примечание
Рабочая область Azure Log Analytics — это ресурс Azure типа, отличного от рабочей области службы машинного обучения Azure. Если в этом списке нет параметров, то можно создать рабочую область Log Analytics.
На вкладке Журналы добавьте Новое правило генерации оповещений.
См. раздел Создание и просмотр оповещений журнала, а также управление ими с помощью Azure Monitor
Дальнейшие действия
- Сведения о том, как регистрировать метрики для экспериментов, см. в статье Регистрация метрик во время задания обучения.
- О том, как выполнять мониторинг ресурсов и журналов из машинного обучения Azure, см. в разделе Мониторинг машинного обучения Azure.