Поделиться через


Использование записных книжек Microsoft Fabric

Записная книжка Microsoft Fabric — это основной элемент кода для разработки заданий Apache Spark и экспериментов машинного обучения. Это веб-интерактивная поверхность, используемая специалистами по обработке и анализу данных, для написания кода с помощью расширенных визуализаций и текста Markdown. Инженеры данных записывают код для приема данных, подготовки данных и преобразования данных. Специалисты по обработке и анализу данных также используют записные книжки для создания решений машинного обучения, включая создание экспериментов и моделей, отслеживание моделей и развертывание.

Записная книжка Fabric позволяет:

  • Начало работы с нулевыми усилиями по настройке.
  • Легко изучить и обработать данные с интуитивно понятным интерфейсом с низким кодом.
  • Обеспечьте безопасность данных благодаря встроенным функциям безопасности предприятия.
  • Анализ данных в необработанных форматах (CSV, txt, JSON и т. д.), обработанных форматов файлов (parquet, Delta Lake и т. д.), с помощью мощных возможностей Spark.
  • Повысьте продуктивность труда с расширенными возможностями разработки и встроенной визуализацией данных.

В этой статье описывается, как использовать записные книжки в области обработки и анализа данных.

Создание записных книжек

Вы можете создать новую записную книжку или импортировать существующую записную книжку.

Создание записной книжки

Как и в других стандартных процессах создания элементов Fabric, вы можете легко создать записную книжку на домашней странице Fabric Инжиниринг данных, новой рабочей области или в Центре создания.

Импорт существующих записных книжек

Можно импортировать одну или несколько существующих записных книжек с локального компьютера в рабочую область Fabric из Инжиниринг данных или домашней страницы Обработка и анализ данных. Записные книжки Fabric распознают стандартные файлы Jupyter Notebook .ipynb и исходные файлы, такие как .py, SCALA и .sql, и создают новые элементы записной книжки соответствующим образом.

Снимок экрана: поиск параметров записной книжки в меню

Экспорт записной книжки

Записную книжку можно экспортировать в другие стандартные форматы. Записная книжка Synapse можно экспортировать в:

  • Стандартный файл записной книжки (IPYNB), используемый для записных книжек Jupyter.
  • HTML-файл (.html), который можно открыть непосредственно из браузера.
  • Файл Python (.py).
  • Латекс-файл (.tex).

Снимок экрана: место экспорта записной книжки.

Сохранение записной книжки

В Fabric записная книжка по умолчанию автоматически сохраняется после открытия и редактирования записной книжки; Вам не нужно беспокоиться о потере изменений кода. Можно также использовать сохранение копии, чтобы клонировать другую копию в текущей рабочей области или в другую рабочую область.

Снимок экрана: место сохранения копии.

Если вы предпочитаете сохранить записную книжку вручную, можно переключиться на параметр сохранения вручную , чтобы иметь локальную ветвь элемента записной книжки, а затем использовать команду "Сохранить " или CTRL+s для сохранения изменений.

Снимок экрана: место для переключения ручного сохранения.

Вы также можете переключиться в режим сохранения вручную, нажав кнопку "Изменить -> Сохранить параметры -> Вручную". Чтобы включить локальную ветвь записной книжки, сохраните ее вручную, нажмите кнопку "Сохранить " или используйте сочетание клавиш CTRL+s .

Подключение lakehouses и записные книжки

Записные книжки Fabric теперь поддерживают тесное взаимодействие с lakehouses; вы можете легко добавить новый или существующий lakehouse из обозревателя Lakehouse.

Вы можете перейти к разным лейкхаусам в обозревателе Lakehouse и установить один лейкхаус как по умолчанию, закрепив его. Затем ваше значение по умолчанию подключено к рабочему каталогу среды выполнения, и вы можете прочитать или записать его в lakehouse по умолчанию с помощью локального пути.

Снимок экрана: место для закрепления озера по умолчанию.

Примечание.

Необходимо перезапустить сеанс после закрепления нового озера или переименования озера по умолчанию.

Добавление или удаление lakehouse

Выбор значка X рядом с именем lakehouse удаляет его на вкладке записной книжки, но элемент Lakehouse по-прежнему существует в рабочей области.

Выберите "Добавить lakehouse" , чтобы добавить в записную книжку больше озерных домов, добавив существующую или создав новый lakehouse.

Изучение файла lakehouse

Вложенные папки и файлы в разделе "Таблицы и файлы" представления Lake отображаются в области содержимого между списком lakehouse и содержимым записной книжки. Выберите разные папки в разделе "Таблицы и файлы ", чтобы обновить область содержимого.

Операции с папкой и файлами

Если выбрать файл (.csv, PARQUET, .txt, .jpg, .png и т. д.) с помощью правой кнопки мыши, можно использовать API Spark или Pandas для загрузки данных. Новая ячейка кода создается и вставляется под ячейкой фокуса.

Можно легко скопировать путь с другим форматом из выбранного файла или папки и использовать соответствующий путь в коде.

Снимок экрана: контекстное меню файлов в Lakehouse.

Ресурсы записной книжки

Обозреватель ресурсов записной книжки предоставляет файловую систему unix, которая поможет вам управлять папками и файлами. Он предлагает пространство файловой системы для записи, в котором можно хранить небольшие файлы, такие как модули кода, семантические модели и изображения. Вы можете легко получить доступ к ним с кодом в записной книжке, как если бы вы работали с локальной файловой системой.

Анимированный GIF-файл ресурсов записной книжки.

Эта встроенная папка представляет собой системную предопределенную папку для каждого экземпляра записной книжки. Он сохраняет до 500 МБ хранилища для хранения зависимостей текущей записной книжки. Это основные возможности ресурсов записной книжки:

  • Вы можете использовать распространенные операции, такие как создание, удаление, загрузка, перетаскивание, переименование, дублирование и поиск по пользовательскому интерфейсу.
  • Для быстрого изучения можно использовать относительные builtin/YourData.txt пути. Этот mssparkutils.nbResPath метод помогает составить полный путь.
  • Вы можете легко переместить проверенные данные в лейкхаус с помощью параметра "Запись в lakehouse ". Структура содержит встроенные фрагменты кода для распространенных типов файлов, которые помогут вам быстро приступить к работе.
  • Эти ресурсы также доступны для использования в случае запуска записной книжки справочника.mssparkutils.notebook.run()

Примечание.

  • В настоящее время Fabric поддерживает отправку определенных типов файлов через пользовательский интерфейс, включая .py, WHL, .jar, .txt, .json, .yml, .xml, .csv .html, .html, .png, .jpg и .xlsx файлов. Вы можете записать в встроенную папку с типами файлов, которые не находятся в списке с помощью кода, однако записные книжки Fabric не поддерживают создание фрагментов кода для неподдерживаемых типов файлов.
  • Каждый размер файла должен быть меньше 50 МБ, а встроенная папка позволяет в общей сложности до 100 экземпляров файлов и папок.
  • При использовании mssparkutils.notebook.run()используйте mssparkutils.nbResPath команду для доступа к целевому ресурсу записной книжки. Относительный путь "builtin/" всегда указывает на встроенную папку корневой записной книжки.

Совместная работа в записной книжке

Записная книжка Fabric — это элемент совместной работы, поддерживающий редактирование нескольких пользователей одной записной книжки.

При открытии записной книжки по умолчанию вы вводите режим совместного редактирования и автоматически сохраняется каждая редактируемая записная книжка. Если ваши коллеги одновременно открывают одну и ту же записную книжку, вы увидите свой профиль, запустите выходные данные, индикатор курсора, индикатор выбора и трассировку редактирования. С помощью функций совместной работы можно легко выполнить программирование пар, удаленную отладку и сценарии обучения.

Снимок экрана: ячейка кода с изменением другого пользователя.

Совместное использование записной книжки

Совместное использование записной книжки — это удобный способ совместной работы с участниками группы. Авторизованные роли рабочей области могут просматривать или изменять или запускать записные книжки по умолчанию. Записную книжку можно предоставить с указанными разрешениями.

  1. Выберите "Общий доступ " на панели инструментов записной книжки.

    Снимок экрана: место для выбора общего доступа.

  2. Выберите соответствующую категорию пользователей , которые могут просматривать эту записную книжку. Вы можете выбрать разрешения "Общий доступ", "Изменить" или "Выполнить " для получателей.

    Снимок экрана: место выбора разрешений.

  3. После нажатия кнопки "Применить" можно отправить записную книжку напрямую или скопировать ссылку на других пользователей. Затем получатели могут открыть записную книжку с соответствующим представлением, предоставленным уровнем разрешений.

    Снимок экрана: место создания и отправки ссылки.

  4. Чтобы дополнительно управлять разрешениями записной книжки, выберите список>элементов рабочей области "Дополнительные параметры" и выберите пункт "Управление разрешениями". На этом экране можно обновить существующий доступ к записной книжке и разрешения.

    Снимок экрана: место для управления разрешениями в рабочей области.

Комментарий ячейки кода

Комментарии — это еще одна полезная функция для сценариев совместной работы. В настоящее время Fabric поддерживает добавление комментариев на уровне ячеек.

  1. Нажмите кнопку "Примечания" на панели инструментов записной книжки или индикатора комментариев ячеек, чтобы открыть панель "Комментарии".

    Снимок экрана: место для выбора комментария.

  2. Выберите код в ячейке кода, выберите "Создать " в области "Примечания ", добавьте примечания, а затем нажмите кнопку "Опубликовать комментарий ", чтобы сохранить.

    Снимок экрана, на котором показано, где выбрать

  3. Если вам нужны, найдите комментарий "Изменить", "Разрешить поток" и "Удалить", выбрав параметр "Дополнительно" рядом с комментарием.

Добавление тегов других пользователей в комментарий

"Тег" относится к упоминание и уведомлению пользователя в потоке комментариев, что повышает эффективность совместной работы по конкретным вопросам.

  1. Выберите раздел кода в ячейке и создайте поток комментариев.

  2. Введите имя пользователя и выберите правильный в списке предложений, если вы хотите упоминание кого-то для обсуждения определенного раздела.

  3. Поделитесь своими аналитическими сведениями и опубликуйте их.

  4. Уведомление по электронной почте будет активировано, и пользователь нажимает ссылку "Открыть примечания ", чтобы быстро найти эту ячейку.

  5. Кроме того, авторизуйте и настройте разрешения для пользователей при добавлении тегов, у которых нет доступа, обеспечивая хорошое управление ресурсами кода.

Анимированный GIF-файл тегов других пользователей в комментарии.

Примечание.

Для элемента комментария помеченный пользователь больше не получит уведомление электронной почты, если вы обновляете комментарий в течение одного часа. Но он отправит уведомление по электронной почте новому пользователю с тегами.

Переключение режима записной книжки

Записные книжки Fabric поддерживают два режима, которые можно легко переключать между: режимом редактирования и режимом просмотра .

Снимок экрана: режимы переключения.

  • Режим редактирования: вы можете редактировать и запускать ячейки и совместно работать с другими пользователями в записной книжке.
  • Режим просмотра: можно просматривать только содержимое ячейки, выходные данные и комментарии записной книжки. Все операции, внесенные в записную книжку, отключены.