Поделиться через


Визуализации в записных книжках Databricks

Azure Databricks имеет встроенную поддержку диаграмм и визуализаций как в Databricks SQL, так и в записных книжках. На этой странице описывается, как работать с визуализациями в записной книжке Databricks. Сведения об использовании визуализаций в Databricks SQL см. в разделе "Визуализация" в Databricks SQL.

Чтобы просмотреть типы визуализаций, см . типы визуализаций.

Внимание

Сведения о предварительной версии диаграмм Azure Databricks см . в предварительной версии визуализаций диаграмм.

Создание новой визуализации

Чтобы повторно создать пример в этом разделе, используйте следующий код:

sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)

Чтобы создать визуализацию, щелкните + над результатом и выберите "Визуализация". Откроется редактор визуализаций.

Меню новой визуализации

  1. В раскрывающемся списке Тип визуализации выберите тип.

    Редактор визуализаций

  2. Выберите данные для отображения в визуализации. Доступные поля будут зависть от выбранного типа.

  3. Нажмите кнопку Сохранить.

Средства визуализации

Если навести указатель мыши на верхний правый элемент диаграммы в редакторе визуализаций, отобразится панель инструментов Plotly, где можно выполнять такие операции, как выбор, масштабирование и панорамирование.

Панель инструментов редактора визуализаций для записных книжек

Если наведите указатель мыши на верхнюю правую часть диаграммы за пределами редактора визуализации, появится меньшее подмножество инструментов:

Панель инструментов для диаграмм в записной книжке

Создание профиля данных

Примечание.

Доступно в Databricks Runtime 9.1 LTS и более поздних версий.

Профили данных отображают сводную статистику по кадру данных Apache Spark, кадру данных Pandas или таблице SQL в табличном и графическом форматах. Чтобы создать профиль данных из ячейки результатов, щелкните и выберите + профиль данных.

Azure Databricks вычисляет и отображает сводную статистику.

Профиль данных

  • Числовые функции и функции категорий показаны в отдельных таблицах.
  • В верхней части вкладки можно выполнить сортировку или поиск признаков.
  • В верхней части столбца диаграммы можно выбрать отображение гистограммы (Стандартная) или квантилей.
  • Установите флажок развернуть, чтобы диаграммы отображались в увеличенном виде.
  • Установите флажок логарифмическая, чтобы диаграммы отображались на логарифмической шкале.
  • Вы можете навести курсор на диаграмму, чтобы просмотреть более подробные сведения, такие как границы столбца гистограммы, число строк в нем или значение квантиля.

Профили данных также можно создавать программным способом: см. команду summarize (dbutils.data.summarize).

Работа с визуализациями и профилями данных

Примечание.

Профили данных доступны в Databricks Runtime 9.1 LTS и более поздних версий.

Переименование, дублирование или удаление визуализации или профиля данных

Чтобы переименовать, дублировать или удалить визуализацию или профиль данных, щелкните стрелку вниз в правой части имени вкладки.

Раскрывающееся меню визуализаций записных книжек

Вы также можете изменить имя, щелкнув и отредактировав его.

Изменение визуализации

Щелкните Кнопка под визуализацией, чтобы открыть редактор визуализации. Закончив вносить изменения, щелкните Сохранить.

Изменение цветов

Цвета визуализации можно настроить при создании визуализации, либо при ее редактировании.

  1. Создайте или начните изменение визуализации.
  2. Щелкните Цвета.
  3. Чтобы изменить цвет, щелкните квадрат и выберите новый цвет, выполнив одно из следующих действий:
    • Щелкните его в селекторе цветов.
    • Введите шестнадцатеричное значение.
  4. Щелкните в любом месте за пределами средства выбора цвета, чтобы закрыть его и сохранить изменения.

Временное скрытие или отображение ряда

Чтобы скрыть ряд в визуализации, щелкните его в условных обозначениях. Чтобы снова отобразить ряд, щелкните его еще раз в условных обозначениях.

Чтобы отобразить только один ряд, дважды щелкните его в условных обозначениях. Чтобы отобразить другие ряды, щелкните каждый из них.

Скачивание визуализации

Чтобы скачать визуализацию в .png формате, щелкните значок Значок камерыкамеры в ячейке записной книжки или в редакторе визуализации.

  • В результирующий ячейке значок камеры отображается в правом верхнем углу при перемещении курсора над ячейкой.

    Значок камеры в ячейке записной книжки

  • В редакторе визуализаций значок камеры появляется при перемещении курсора на диаграмму. См. раздел Средства визуализации.

Добавление визуализации или профиля данных на панель мониторинга

  1. Щелкните стрелку вниз в правой части имени вкладки.
  2. Выберите Добавить на панель мониторинга. Отобразится список доступных представлений панели мониторинга, а также пункт меню Добавить на новую панель мониторинга.
  3. Выберите панель мониторинга или щелкните Добавить на новую панель мониторинга. Откроется панель мониторинга с только что добавленной визуализацией или профилем данных.