Поделиться через


Анализ производительности запросов

Это важно

Эта функция доступна в закрытой предварительной версии. Чтобы попробовать, свяжитесь с вашим контактом в Azure Databricks.

При выполнении запросов Databricks может возвращать аналитические сведения, определяющие возможности повышения производительности. На этой странице перечислены поддерживаемые аналитические сведения и их смысл.

Более широкий обзор рекомендаций по повышению производительности см. в комплексном руководстве по оптимизации рабочих нагрузок Databricks, Spark и Delta Lake.

Одновременная_Запись

  • Одновременные операции записи в таблице вызывают конфликты , которые автоматически разрешаются или завершаются сбоем.
  • Рекомендация: Просмотрите разностную историю, чтобы определить одновременные записи и рассмотреть различные планирования, чтобы избежать конфликтов.

COVERAGE_FILTER_KEYS_CLUSTERING

  • Таблица кластеризована одним или несколькими ключами, которые не используются при фильтрации во время сканирования таблицы.
  • Рекомендация. Определите, какой подмножество данных требуется для нужного результата, а затем добавьте фильтры для сопоставления ключей кластеризации, чтобы уменьшить количество операций чтения байтов.

ПРОСТРАНСТВЕННОЕ_РАЗДЕЛЕНИЕ_КЛЮЧЕЙ_ФИЛЬТРАЦИИ

  • Таблица секционируется одним или несколькими ключами, которые не используются при фильтрации во время сканирования таблицы.
  • Рекомендация. Определите, какой подмножество данных требуется для нужного результата, а затем добавьте фильтры для сопоставления ключей секционирования, чтобы сократить чтение байтов.

COVERAGE_PHOTON

  • Фотон не может ускорить операцию, поэтому использовался стандартный механизм среды выполнения.
  • Рекомендация. Ознакомьтесь с ограничениями Photon и рассмотрите возможность настройки запроса, чтобы использовать поддерживаемую стратегию выполнения для ускорения выполнения.

COVERAGE_STATS_DELTA

  • Статистика пропуска данных Delta отсутствует или неполна для фильтров файлов сканирования таблицы, и запрос использует фильтрацию по файлу. Возможны следующие состояния статистики:
    • Полный: статистика доступна для всех фильтров.
    • Частично. Статистика доступна в подмножестве фильтров.
    • Недоступно. Статистика недоступна в любом фильтре.
    • Неиспользуемый: статистика не может использоваться в фильтре, преобразующего тип данных.
  • Рекомендация: Соберите статистику Delta для уменьшения объема прочитанных данных.

COVERAGE_STATS_OPTIMIZER

DATA_SKEW

  • Данные обрабатываются неравномерно доступными вычислительными ресурсами.
  • Рекомендация: Просмотрите распределение данных, затем выполните хэширование ключей или предварительно агрегируйте данные.

EXPLODING_JOIN

IO_THROTTLING

  • Запрос облачного хранилища регулируется поставщиком облачных служб.
  • Рекомендация. Обратитесь к администратору, чтобы увеличить ограничения запросов облачного хранилища с помощью поставщика облачных служб.