Поделиться через


Мониторинг и наблюдаемость заданий Databricks

В этой статье описываются функции, доступные в пользовательском интерфейсе Azure Databricks для просмотра заданий, к которых у вас есть доступ, просмотр журнала запусков задания и просмотр сведений о выполнении заданий. Сведения о настройке уведомлений для заданий см. в статье "Добавление уведомлений электронной почты и системных уведомлений для событий задания".

Чтобы узнать об использовании интерфейса командной строки Databricks для просмотра заданий и выполнения заданий, выполните команды databricks jobs list -hdatabricks jobs get -hCLI и databricks jobs run-now -h. Дополнительные сведения об использовании API заданий см. в API заданий.

Если у вас есть доступ к схеме system.lakeflow , вы также можете просматривать и запрашивать записи выполнения заданий и задач из вашей учетной записи. См . справочник по системной таблице заданий.

Просмотр заданий

Чтобы просмотреть список доступных заданий, щелкните Значок рабочих процессов "Рабочие процессы " на боковой панели. Вкладка "Задания " в пользовательском интерфейсе рабочих процессов содержит сведения обо всех доступных заданиях, таких как создатель задания, триггер задания, если он есть, и результат последнего выполнения.

Чтобы изменить столбцы, отображаемые в списке заданий, щелкните и выберите Значок параметров или отмените выбор столбцов.

Задания в списке можно фильтровать:

  • используя ключевые слова; Если для этой рабочей области включена функция увеличенного ограничения количества заданий, поиск по ключевым словам поддерживается только для полей имени, идентификатора задания и тега задания.
  • выбирая только те задания, которыми вы владеете;
  • выбирая все задания, для доступа к которым у вас есть разрешения.
  • Используя теги. Чтобы найти тег, созданный только с ключом, введите ключ в поле поиска. Чтобы найти тег, созданный с ключом и значением, можно выполнить поиск по ключу, по значению или по ключу и значению. Например, для тега с ключом department и значением finance соответствующие задания можно найти по department или finance. Чтобы выполнить поиск по ключу и значению, введите ключ и значение, разделенные двоеточием; например, department:finance.

Чтобы отсортировать список заданий (по убыванию или по возрастанию) по определенному столбцу, щелкните заголовок соответствующего столбца. Если включена функция увеличенного ограничения количества заданий, можно сортировать только по Name, Job ID или Created by. По умолчанию задания сортируются по Name в порядке возрастания.

Щелкните Меню Кебаб , чтобы получить доступ к действиям для задания, например удалить задание.

Просмотр запусков задания

Список запущенных и недавно завершенных запусков для всех заданий, к которым у вас есть доступ, включая запуски, запущенные внешними средствами оркестрации, такими как Apache Airflow или Фабрика данных Azure. Чтобы просмотреть список недавно выполненных заданий, выполните следующие действия:

  1. Щелкните Значок рабочих процессов рабочие процессы на боковой панели.
  2. В столбце Имя нажмите на имя задания. Вкладка "Запуски " отображается с представлениями матрицы и списка активных и завершенных запусков.

В матричном представлении отображается журнал запусков задания, включая каждую задачу задания.

В строке общей длительности выполнения матрицы отображается общая длительность выполнения и состояние выполнения. Чтобы просмотреть сведения о выполнении, включая время начала, длительность и состояние, наведите указатель мыши на строку в строке общей продолжительности выполнения.

Каждая ячейка в строке Задачи обозначает задачу и ее соответствующее состояние. Чтобы просмотреть сведения о каждой задаче, включая время начала, продолжительность, кластер и ее состояние, наведите указатель мыши на ячейку с этой задачей.

Столбики запусков задания и задач выделены цветом, отображающим состояние запуска. Выполненные запуски выделены зеленым цветом, невыполненные — красным, а пропущенные — розовым. Высота отдельных запусков заданий и полос выполнения задач визуально указывает длительность выполнения.

Если вы настроили ожидаемое время завершения, представление матрицы отображает предупреждение, когда длительность выполнения превышает настроенное время.

По умолчанию отображается представление списка запусков:

  • Время начала запуска.
  • Идентификатор выполнения.
  • Был ли запуск активирован расписанием заданий, запросом API или вручную.
  • Время, затраченное на текущее задание или общее время выполнения для завершенного выполнения. Предупреждение отображается, если длительность превышает настроенное ожидаемое время завершения.
  • Ссылки на журналы Spark.
  • Состояние выполнения, либо Queued, RunningFailedSucceededTerminatingTerminatedSkippedPendingTimed OutCanceledInternal ErrorCancelingлибо .Waiting for Retry
  • Щелкните Меню Кебаб , чтобы получить доступ к действиям, зависящим от контекста для выполнения, например остановить активный запуск или удалить завершенный запуск.

Чтобы изменить столбцы, отображаемые в представлении списка запусков, щелкните Значок параметров и выберите или отмените выбор столбцов.

Чтобы просмотреть сведения о выполнении задания, щелкните ссылку для запуска в столбце времени запуска в представлении списка запусков. Чтобы просмотреть сведения о последнем успешном выполнении этого задания, нажмите кнопку "Перейти к последнему успешному выполнению".

Azure Databricks ведет журнал выполнения заданий за 60 дней. Если необходимо сохранить выполнение заданий, Databricks рекомендует экспортировать результаты до истечения срока их действия. Дополнительные сведения см. в разделе Экспорт результатов выполнения заданий.

Просмотр сведений о выполнении задания

Страница сведений о выполнении задания содержит его выходные данные и ссылки на журналы, включая информацию о завершении или сбое каждой задачи в задании. Сведения о выполнении задания см. на вкладке Выполнения для задания. Чтобы просмотреть сведения о выполнении задания на вкладке "Запуски ", щелкните ссылку для запуска в столбце "Время начала" в представлении списка запусков. Чтобы вернуться на вкладку "Запуски " для задания, щелкните значение идентификатора задания.

Если задание содержит несколько задач, щелкните задачу для просмотра сведений о выполнении задачи, включая:

  • кластер, выполняющий задачу
    • пользовательский интерфейс Spark для задачи;
    • журналы для задачи;
    • метрики для задачи.

Чтобы вернуться на вкладку Выполнения для задания, щелкните значение Идентификатор задания.

Как Azure Databricks определяет состояние выполнения задания?

Azure Databricks определяет, успешно ли выполнено задание на основе результатов конечных задач задания. Конечная задача — это задача, которая не имеет подчиненных зависимостей. Выполнение задания может иметь один из трех результатов:

  • Выполнено: все задачи были успешными.
  • Успешно выполнено сбоями: некоторые задачи завершились сбоем, но все конечные задачи были успешными.
  • Сбой: сбой одной или нескольких конечных задач.

Просмотр журнала выполнения задач

Чтобы просмотреть журнал выполнения задач, включая выполненные и невыполненные запуски, выполните следующие действия:

  1. Щелкните задачу на странице Сведения о выполнении задания. Откроется диалоговое окно Сведения о выполнении задач.
  2. Выберите выполнение задачи в раскрывающемся меню журнала выполнения.

Просмотр журнала выполнения задач для For each задачи

Доступ к журналу For each выполнения задачи совпадает со стандартной задачей Заданий Azure Databricks. Вы можете щелкнуть For each узел задачи на странице сведений о выполнении задания или соответствующую ячейку в представлении матрицы. Однако, в отличие от стандартной задачи, сведения For each о выполнении задачи представлены в виде таблицы итерации вложенных задач.

Чтобы просмотреть только неудачные итерации, щелкните "Только неудачные итерации".

Чтобы просмотреть выходные данные итерации, щелкните значения времени начала или окончания итерации.

Просмотр недавно выполненных заданий

Список запущенных и недавно завершенных запусков для всех заданий в рабочей области, к которой у вас есть доступ, включая запуски, запущенные внешними средствами оркестрации, такими как Apache Airflow или Фабрика данных Azure. Чтобы просмотреть список недавно выполненных заданий, выполните следующие действия:

  1. Щелкните Значок рабочих процессов рабочие процессы на боковой панели.
  2. Щелкните вкладку "Выполнение задания", чтобы отобразить список запусков задания.

На графике счетчика завершенных запусков отображается количество выполненных заданий за последние 48 часов. По умолчанию граф отображает неудачные, пропущенные и успешные запуски заданий. Вы также можете отфильтровать граф, чтобы отобразить определенные состояния выполнения или ограничить график определенным диапазоном времени. Вкладка "Запуски задания" также содержит таблицу заданий с последних 67 дней. По умолчанию таблица содержит сведения о неудачных, пропущенных и успешных запусках заданий.

Примечание.

Граф счетчика завершенных запусков отображается только при нажатии кнопки "Принадлежащий мне".

Вы можете отфильтровать количество завершенных запусков по состоянию выполнения:

  • Чтобы обновить граф для отображения заданий, выполняющихся в данный момент или ожидающих выполнения, нажмите кнопку "Активные запуски".
  • Чтобы обновить граф для отображения только завершенных запусков, включая неудачные, успешные и пропущенные запуски, нажмите кнопку "Завершенные запуски".
  • Чтобы обновить граф, чтобы отобразить только запуски, успешно выполненные за последние 48 часов, нажмите кнопку "Успешные запуски".
  • Чтобы обновить граф, чтобы отобразить только пропущенные запуски, нажмите кнопку "Пропущенные запуски". Запуски пропускаются, так как превышено максимальное количество одновременных запусков в рабочей области или задание превысило максимальное количество одновременных запусков, указанных в конфигурации задания.
  • Чтобы обновить граф, чтобы показать только запуски, завершенные в состоянии ошибки, нажмите кнопку "Неудачные запуски".

При щелчке любой из кнопок фильтра список запусков в таблице запусков также обновляется, чтобы отобразить только запуски заданий, которые соответствуют выбранному состоянию.

Чтобы ограничить диапазон времени, отображаемый в графе количества завершенных запусков, щелкните и перетащите курсор в граф, чтобы выбрать диапазон времени. Граф и обновление таблицы запуска для отображения выполняется только из выбранного диапазона времени.

По умолчанию отображается список запусков в таблице запусков:

  • Время начала запуска.
  • Имя задания, связанного с запуском.
  • Имя пользователя, от имени которого выполняется задание.
  • Был ли запуск активирован расписанием заданий, запросом API или вручную.
  • Время, затраченное на текущее задание или общее время выполнения для завершенного выполнения. Предупреждение отображается, если длительность превышает настроенное ожидаемое время завершения.
  • Состояние выполнения, либо Queued, RunningFailedSucceededTerminatingTerminatedSkippedPendingTimed OutCanceledInternal ErrorCancelingлибо .Waiting for Retry
  • Все параметры для выполнения.
  • Щелкните Меню Кебаб , чтобы получить доступ к действиям, зависящим от контекста для выполнения, например остановить активный запуск или удалить завершенный запуск.

Чтобы изменить столбцы, отображаемые в списке запусков, щелкните Значок параметров и выберите или отмените выбор столбцов.

В таблице типов ошибок 5 лучших типов ошибок отображается список наиболее частых типов ошибок из выбранного диапазона времени, что позволяет быстро увидеть наиболее распространенные причины проблем с заданием в рабочей области.

Чтобы просмотреть сведения о выполнении задания, щелкните ссылку в столбце Время начала необходимого запуска. Чтобы просмотреть сведения о задании, щелкните его имя в столбце Задание.

Просмотр сведений о происхождении задания

Если каталог Unity включен в рабочей области, вы можете просмотреть сведения о происхождении для любых таблиц каталога Unity в рабочем процессе. Если сведения о происхождении доступны для рабочего процесса, вы увидите ссылку с количеством вышестоящих и подчиненных таблиц в области сведений о задании для задания, панели сведений о выполнении задания или панели сведений о выполнении задачи для выполнения задачи. Щелкните ссылку, чтобы отобразить список таблиц. Щелкните таблицу, чтобы просмотреть подробные сведения в обозревателе каталогов.

Просмотр и запуск задания, созданного с помощью пакета ресурсов Databricks

Пользовательский интерфейс заданий Azure Databricks можно использовать для просмотра и запуска заданий, развернутых пакетом ресурсов Databricks. По умолчанию эти задания доступны только для чтения в пользовательском интерфейсе заданий. Чтобы изменить задание, развернутое пакетом, измените файл конфигурации пакета и повторно разверните задание. Применение изменений только к конфигурации пакета гарантирует, что исходные файлы пакета всегда фиксируют текущую конфигурацию задания.

Однако если необходимо внести немедленные изменения в задание, можно отключить задание от конфигурации пакета, чтобы включить редактирование параметров задания в пользовательском интерфейсе. Чтобы отключить задание, нажмите кнопку "Отключиться от источника". В диалоговом окне "Отключение от источника" нажмите кнопку "Отключить", чтобы подтвердить.

Любые изменения, внесенные в задание в пользовательском интерфейсе, не применяются к конфигурации пакета. Чтобы применить изменения в пользовательском интерфейсе к пакету, необходимо вручную обновить конфигурацию пакета. Чтобы повторно подключить задание к конфигурации пакета, повторно разверните задание с помощью пакета.

Экспорт результатов выполнения задания

Вы можете экспортировать результаты выполнения записной книжки и журналы выполнения заданий для всех типов заданий.

Экспорт результатов выполнения записной книжки

Выполнения заданий можно сохранять, экспортируя их результаты. Для выполнения заданий записной книжки можно экспортировать подготовленную записную книжку, которую затем можно будет импортировать в рабочую область Azure Databricks.

Чтобы экспортировать результаты выполнения записной книжки для задания с одной задачей, выполните следующие действия:

  1. На странице сведений о задании щелкните ссылку Просмотр сведений для соответствующего выполнения в столбце Выполнение таблицы Завершенные выполнения (за последние 60 дней) .
  2. Нажмите кнопку Экспорт в HTML.

Чтобы экспортировать результаты выполнения записной книжки для задания с несколькими задачами, выполните следующие действия:

  1. На странице сведений о задании щелкните ссылку Просмотр сведений для соответствующего выполнения в столбце Выполнение таблицы Завершенные выполнения (за последние 60 дней) .
  2. Щелкните задачу записной книжки, которую нужно экспортировать.
  3. Нажмите кнопку Экспорт в HTML.

Экспорт журналов выполнения заданий

Вы также можете экспортировать журналы для выполнения задания. Задание можно настроить так, чтобы журналы автоматически доставлялись в DBFS через API заданий. См. объект new_cluster.cluster_log_conf в тексте запроса, передаваемый в операцию Создать задачу (POST /jobs/create) в API заданий.