Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этой статье объясняется, как использовать конвейеры интеграции и развертывания Git с записными книжками в Microsoft Fabric. Вы узнаете, как подключить репозиторий, управлять исходным кодом записной книжки и развертывать записные книжки в разных средах.
Перед началом работы
- Подключите рабочую область к Git перед выполнением шагов управления версиями записной книжки. Инструкции по настройке см. в статье "Начало работы с интеграцией Git".
- Создайте правила развертывания записных книжек на целевом этапе (например, test или Production), а не на этапе разработки.
- Чтобы создать правила развертывания, необходимо быть владельцем элемента.
Интеграция Git в записные книжки
Записные книжки Fabric поддерживают интеграцию Git с Azure DevOps для системы контроля версий. Вы можете сохранять изменения версий записных книжек, управлять жизненным циклом записных книжек и совместно работать с помощью ветвей непосредственно в Fabric.
При фиксации записной книжки вместе с присоединенными зависимостями (например, средами), синхронизация с другой рабочей областью сохраняет эти привязки. Структура автоматически привязывает записную книжку к соответствующим ресурсам в новой рабочей области.
Для поддержки этого поведения Fabric сохраняет логические идентификаторы для подключенных ресурсов в метаданных записной книжки. В результате диффы Git могут отображать обновления метаданных из физических идентификаторов на логические идентификаторы.
Примечание.
Обновления метаданных, связанные с логическими идентификаторами и автоматической привязкой, могут отображаться в представлениях диффа Git, даже если код записной книжки не изменяется.
Настройка подключения
В параметрах рабочей области настройте подключение к репозиторию для фиксации и синхронизации изменений. Инструкции по настройке см. в статье "Начало работы с интеграцией Git". После подключения ваши элементы, включая записные книжки, отображаются на панели контроля версий.
После коммита экземпляров ноутбуков в Git-репозиторий можно увидеть структуру папок ноутбуков в репозитории.
Теперь можно выполнять операции Git, такие как создание pull request.
Представление записной книжки в Git
В следующем тексте показана структура файла для элемента записной книжки в репозитории Git:
.
├── Notebook_1.Notebook/
│ ├── Resources/ (Optional)
│ │ └── builtin/
│ │ ├── large_dataset.parquet
│ │ └── model_output.parquet
│ ├── .platform
│ ├── fs-settings.json (Optional)
│ ├── notebook-content.py
│ └── notebook-settings.json (Optional)
└── Readme.md
.
├── Notebook_2.Notebook/
│ ├── Resources/ (Optional)
│ │ └── builtin/
│ │ ├── large_dataset.parquet
│ │ └── model_output.parquet
│ ├── .platform
│ ├── fs-settings.json (Optional)
│ ├── notebook-content.sql
│ └── notebook-settings.json (Optional)
└── Readme.md
При коммитинге элемента блокнота Fabric сохраняет его в качестве файлов исходного кода вместо стандартного .ipynb файла. Например, записная книжка PySpark хранится как notebook-content.py. Этот формат проще просматривать в диффах Git.
Исходный файл сохраняет метаданные записной книжки (включая среду lakehouse по умолчанию и подключенную среду), ячейки markdown и ячейки кода в виде отдельных разделов. Платформа Fabric использует эту структуру для восстановления записной книжки при обратной синхронизации с рабочей областью.
Вывод ячеек записной книжки не включается при синхронизации с Git.
На следующем снимке экрана показан исходный формат в репозитории Git:
Примечание.
Сохраняйте записные книжки и их зависимые среды в одной рабочей области и контролируйте версии как записных книжек, так и элементов среды в Git. Fabric сопоставляет эти связи при синхронизации с новыми рабочими пространствами.
Идентификатор lakehouse по умолчанию остается в метаданных записной книжки при синхронизации из репозитория с рабочей областью Fabric. При необходимости вручную привяжите записную книжку к новому элементу Lakehouse. Дополнительные сведения см. в статье об интеграции с Lakehouse Git.
Настройки Git ноутбука
Панель настроек Git позволяет управлять тем, как блокноты взаимодействуют с системой управления версиями, включая параметры привязки Git и управление тем, какие файлы папки Ресурсов включаются в коммиты.
Примечание.
Не редактируйте notebook-settings.json в репозитории Git для управления автоматической привязкой или ресурсами Git. Вместо этого управляйте этими параметрами с помощью страницы параметров записной книжки.
Автоматическая привязка в Git для Lakehouse
Автоматическая привязка Lakehouse позволяет Fabric определять правильный lakehouse по умолчанию для каждой рабочей области, подключенной к Git. Это уменьшает необходимость повторного связывания вручную при перемещении записных книжек между рабочими областями разработки, тестирования и промышленной среды.
Включите эту функцию из параметров записной книжки. После включения Fabric создает notebook-settings.json в репозитории и автоматически управляет этим файлом. Не изменяйте этот файл вручную.
Примечание.
Интеграция Notebook Git поддерживает постоянное поддержание связи между записными книжками и подключенными data lakehouse при синхронизации между рабочими областями. При синхронизации записной книжки с другой рабочей областью можно выбрать, привязывается ли она к lakehouse в исходной рабочей области или lakehouse в новой рабочей области. Для записных книжек, которые уже находятся под управлением версий в Git, физический идентификатор присоединенного lakehouse в метаданных записной книжки заменяется логическим идентификатором. Это изменение может появиться в представлении сравнения версий Git.
Поддержка папок ресурсов для ноутбуков в Git
Примечание.
В настоящее время папка "Ресурсы среды" и интеграция с конвейерами развертывания и общедоступными API не поддерживаются.
Встроенная папка ресурсов может быть зафиксирована в Git, чтобы сценарии и файлы конфигурации были версиями записной книжки.
Эта функция является необязательной и отключенной по умолчанию. Включите его из параметров записной книжки в разделе параметров Git. После того как вы это включите, файлы в папке "Ресурсы" будут включены в коммиты. Так как фиксации имеют ограничение в 50 МБ , используйте .gitignore правила файла или Git для исключения больших или временных файлов или папок.
Примечание.
Действует только встроенная .gitignore корневая папка ресурса.
После настройки правил Git и фиксации изменений Fabric сохраняет правила в fs-settings.json репозитории. Структура создает и управляет этим файлом, чтобы обеспечить согласованность конфигурации репозитория. Мы также не рекомендуем редактировать этот файл непосредственно в репозитории Git.
Записная книжка в конвейерах развертывания
Используйте конвейеры развертывания для продвижения изменений ноутбуков на различных этапах, таких как разработка, тестирование и производство. Проверьте обновления на более ранних этапах перед их переводом в продуктивную среду.
Развертывание блокнота поддерживает автоматическую привязку для среды lakehouse по умолчанию и связанной среды, если зависимые элементы находятся в той же рабочей области. Во время развертывания Структура может повторно привязать эти зависимости к соответствующим элементам в целевой рабочей области. Изменения метаданных могут отображаться в представлении диффа.
Если вам нужна lakehouse по умолчанию для определенного этапа назначения, настройте правило развертывания, чтобы переопределить автоматическую привязку.
В настоящее время в этой статье используется новый пользовательский интерфейс конвейера развертывания. Вы можете переключиться на старый пользовательский интерфейс, отключив новый конвейер развертывания.
Примечание.
Известная проблема: состояние замороженной ячейки в записных книжках не сохраняется во время развертывания.
Чтобы развернуть записные книжки с помощью конвейера развертывания, выполните следующие действия.
Создайте конвейер развертывания или откройте существующий. Дополнительные сведения см. в статье «Начало работы с конвейерами развертывания».
Назначьте рабочие области на разных этапах в соответствии с целями развертывания.
Выбирайте, просматривайте и сравнивайте элементы, включая ноутбуки, между этапами. Выделенный значок отображает количество измененных элементов между предыдущим этапом и текущим этапом.
Выберите "Развернуть", чтобы продвинуть записные книжки на этапах разработки, тестирования и продакшн.
В окне "Развертывание на этом этапе" просмотрите новые и измененные элементы. Чтобы продолжить развертывание даже в случае сбоя одного или нескольких элементов, выберите Продолжить развертывание, если один или несколько элементов неудачны.
После проверки и подтверждения выбора нажмите кнопку "Развернуть".
(Необязательно.) Чтобы создать правила развертывания, выберите правила развертывания на целевом элементе этапа в конвейере (например, Test или Production).
Общие сведения о поведении и ограничениях правил см. в разделе "Создание правил развертывания".
Настройте правило lakehouse по умолчанию для каждого развертывания записной книжки.
Это правило управляет тем, к какому lakehouse тетрадь подключается на целевом этапе после развертывания.
В области "Задать правила развертывания " выберите плитку Lakehouse по умолчанию .
Используйте раскрывающиеся списки From и To, чтобы сопоставить lakehouse по умолчанию исходного этапа с lakehouse по умолчанию целевого этапа.
- То же самое, что и исходное озеро: сохраните тот же параметр озера по умолчанию, что и исходный этап.
- N/A (без lakehouse по умолчанию): удалите параметр lakehouse по умолчанию на целевом этапе.
- Другие: замените исходный этап озера по умолчанию другим лейкхаусом на целевом этапе.
Если в раскрывающемся списке "Другие" выберите "Другие", укажите сведения о целевом озерном доме:
- Идентификатор "Lakehouse"
- Имя Lakehouse
- Идентификатор рабочей области Lakehouse
Примечание.
Идентификатор Lakehouse требуется при настройке этого правила. Идентификатор Lakehouse можно получить из URL-адреса элемента. Правила развертывания имеют приоритет над автоматической привязкой. Если правило развертывания настроено, оно переопределяет автоматически связанный лейкхаус.
Отслеживайте состояние развертывания из журнала развертывания.