Использование записных книжек Microsoft Fabric

Записная книжка Microsoft Fabric — это основной элемент кода для разработки заданий Apache Spark и экспериментов машинного обучения. Это веб-интерактивная поверхность, используемая специалистами по обработке и анализу данных для написания кода с использованием расширенных визуализаций и текста Markdown. Инженеры данных пишут код для приема, подготовки и преобразования данных. Специалисты по обработке и анализу данных также используют записные книжки для создания решений машинного обучения, включая создание экспериментов и моделей, отслеживание моделей и развертывание.

Важно!

Microsoft Fabric в настоящее время находится на этапе предварительной версии. Эта информация относится к предварительной версии продукта, который может быть существенно изменен перед выпуском. Корпорация Майкрософт не дает никаких гарантий, явных или подразумеваемых, в отношении информации, представленной здесь.

Записная книжка Microsoft Fabric позволяет:

  • Начните работу, потратив минимум усилий на настройку.
  • Простое изучение и обработка данных с интуитивно понятным интерфейсом с низким уровнем кода.
  • Обеспечьте безопасность данных благодаря встроенным функциям безопасности предприятия.
  • Анализ данных в необработанных форматах (CSV, txt, JSON и т. д.), обработанных форматах файлов (parquet, Delta Lake и т. д.), используя мощные возможности Spark.
  • Повысьте продуктивность труда с расширенными возможностями разработки и встроенной визуализацией данных.

В этой статье описывается, как использовать записные книжки для обработки и анализа данных и инжиниринга данных.

Создание записных книжек

Вы можете создать новую записную книжку или импортировать существующую.

Создание записной книжки

Как и в случае с другими стандартными элементами Microsoft Fabric, вы можете легко создать записную книжку на домашней странице Microsoft Fabric Инжиниринг данных, с помощью кнопки Создать рабочую область или создать концентратор.

Импорт существующих записных книжек

Вы можете импортировать одну или несколько существующих записных книжек с локального компьютера в рабочую область Microsoft Fabric с Инжиниринг данных или на домашней странице Обработка и анализ данных. Записные книжки Microsoft Fabric могут распознавать стандартные Jupyter Notebook IPYNB-файлы и исходные файлы, такие как PY, SCALA и SQL, и создавать новые элементы записной книжки соответствующим образом.

Снимок экрана: поиск параметров записной книжки в меню

Экспорт записной книжки

Вы можете экспортировать записную книжку в другие стандартные форматы. Записная книжка Synapse поддерживает экспорт в:

  • Стандартный файл записной книжки (.ipynb), который обычно используется для записных книжек Jupyter.
  • HTML-файл (.html), который можно открыть непосредственно из браузера.
  • Файл Python (.py).
  • Latex file(.tex).

Снимок экрана: экспорт записной книжки.

Сохранение записной книжки

В Microsoft Fabric записная книжка по умолчанию сохраняется автоматически после ее открытия и изменения. Вам не нужно беспокоиться о потере изменений кода. Вы также можете использовать команду Сохранить копию , чтобы клонировать другую копию в текущей рабочей области или в другую рабочую область.

Снимок экрана: место для сохранения копии.

Если вы предпочитаете сохранять записную книжку вручную, можно также переключиться в режим сохранения вручную, чтобы иметь локальную ветвь элемента записной книжки, и нажать кнопку Сохранить или CTRL+s для сохранения изменений.

Снимок экрана, показывающий, где переключиться на сохранение вручную.

Вы также можете переключиться в режим сохранения вручную, перейдя в меню Параметры редактирования и>сохранения вручную>. Чтобы включить локальную ветвь записной книжки, сохраните ее вручную, нажав кнопку Сохранить или нажав клавиши CTRL+S.

Подключение lakehouse и записных книжек

Записная книжка Microsoft Fabric теперь поддерживает тесное взаимодействие с lakehouses; вы можете легко добавить новый или существующий lakehouse из обозревателя lakehouse.

Вы можете перейти к разным lakehouse в обозревателе lakehouse и установить один lakehouse в качестве хранилища по умолчанию, закрепив его. Затем он будет подключен к рабочему каталогу среды выполнения, и вы сможете считывать или записывать данные в lakehouse по умолчанию, используя локальный путь.

Снимок экрана: место для закрепления хранилища озера по умолчанию.

Примечание

После закрепления нового lakehouse или переименования по умолчанию необходимо перезапустить сеанс.

Добавление или удаление lakehouse

Если щелкнуть значок X рядом с именем lakehouse, он будет удален из вкладки записной книжки, но элемент lakehouse по-прежнему существует в рабочей области.

Выберите Добавить lakehouse , чтобы добавить в записную книжку дополнительные элементы lakehouse, добавив существующий или создав новый lakehouse.

Изучение файла lakehouse

Вложенные папки и файлы в разделе Таблицы и файлы представления Озера отображаются в области содержимого между списком Lakehouse и содержимым записной книжки. Выберите разные папки в разделе Таблицы и файлы , чтобы обновить область содержимого.

Операции с папками и файлами

Если вы выбираете файл (.csv, .parquet, .txt, .jpg, .png и т. д.) щелчком правой кнопкой мыши, то для загрузки данных поддерживаются api Spark и Pandas. Новая ячейка кода создается и вставляется в под ячейкой фокуса.

Вы можете легко скопировать путь с другим форматом выбранного файла или папки и использовать соответствующий путь в коде.

Снимок экрана: контекстное меню файлов в lakehouse.

Совместная работа в записной книжке

Записная книжка Microsoft Fabric — это элемент для совместной работы, который поддерживает редактирование одной записной книжки несколькими пользователями.

При открытии записной книжки по умолчанию вы переходите в режим совместного редактирования, и каждое редактирование записной книжки будет сохраняться автоматически. Если ваши коллеги одновременно открывают одну и ту же записную книжку, вы увидите их профиль, выходные данные выполнения, индикатор курсора, индикатор выбора и трассировку редактирования. Используя функции совместной работы, вы можете легко выполнять сценарии парного программирования, удаленной отладки и обучения.

Снимок экрана: ячейка кода с другим пользователем.

Комментирование ячейки кода

Комментирование — еще одна полезная функция в сценариях совместной работы. В настоящее время мы поддерживаем добавление комментариев на уровне ячеек.

  1. Нажмите кнопку Примечания на панели инструментов записной книжки или индикаторе примечаний ячейки, чтобы открыть панель Примечания .

    Снимок экрана: место для выбора примечания.

  2. Выберите код в ячейке кода, выберите Создать на панели Примечания , добавьте примечания, а затем нажмите кнопку примечания для сохранения.

    Снимок экрана, показывающий, где нажать кнопку Создать.

  3. Вы можете выполнить команду Изменить комментарий, Разрешить поток или Удалить поток , нажав кнопку Дополнительно рядом с комментарием.

Переключение режима записной книжки

Записная книжка Fabric поддерживает два режима для разных сценариев. Вы можете легко переключаться между режимами правки и просмотра .

Снимок экрана: место переключения режимов.

  • Режим редактирования. Вы можете редактировать и запускать ячейки, а также совместно работать с другими пользователями в записной книжке.
  • Режим просмотра. Вы можете просматривать только содержимое ячейки, выходные данные и комментарии записной книжки. Все операции, которые могут привести к изменению записной книжки, будут отключены.

Дальнейшие действия