Конвейеры развертывания Lakehouse и интеграция git (предварительная версия)
Lakehouse интегрируется с возможностями управления жизненным циклом в Microsoft Fabric, обеспечивая стандартизированную совместную работу между всеми участниками группы разработки на протяжении всей жизни продукта. Управление жизненным циклом упрощает эффективный процесс управления версиями продуктов и выпуска, постоянно предоставляя функции и исправления ошибок в нескольких средах. Дополнительные сведения см. в статье "Что такое управление жизненным циклом в Microsoft Fabric?".
Внимание
Эта функция доступна в предварительной версии.
Интеграция Git Lakehouse
Lakehouse — это элемент, содержащий как метаданные, так и данные, на которые ссылается несколько объектов в рабочей области. Lakehouse содержит таблицы, папки и ярлыки в качестве основных управляемых элементов контейнера данных. С точки зрения рабочего процесса разработки следующие зависимые объекты могут ссылаться на Lakehouse:
- Потоки данных и конвейеры данных
- Определения заданий Spark
- Записные книжки
- Семантические модели и Power BI
Семантическая модель по умолчанию и метаданные конечной точки аналитики SQL связаны с Lakehouse и управляются процессом обновления Git по умолчанию. Так как основные данные не отслеживаются в Git, отслеживаются только метаданные.
Представление Git
Следующие сведения lakehouse сериализуются и отслеживаются в подключенной рабочей области Git:
- отображаемое имя;
- Description
- Логический guid
Примечание.
Отслеживаемый логический guid — это автоматически созданный идентификатор межрабочая область, представляющий элемент и его представление системы управления версиями.
Внимание
Только артефакт контейнера Lakehouse отслеживается в Git в текущем интерфейсе. Таблицы, папки, ярлыки и другие изменения метаданных не отслеживаются и версии в Git.
Возможности интеграции с Lakehouse git
Доступны следующие возможности:
- Сериализация метаданных объекта Lakehouse в представление JSON git.
- Примените изменения напрямую или используйте запрос на вытягивание для управления изменениями в вышестоящих или подчиненных рабочих областях и ветвях.
- Переименование лейкхаусов отслеживается в Git. Обновление переименованного lakehouse также переименовывает модель семантических данных по умолчанию и конечную точку АНАЛИТИКИ SQL.
- Никаких действий не применяется к таблицам, папкам и ярлыкам, метаданным и данным этих элементов всегда сохраняется.
Lakehouse в конвейерах развертывания
Lakehouse поддерживается в конвейерах развертывания управления жизненным циклом Microsoft Fabric. Это обеспечивает рекомендации по сегментации среды.
Возможности интеграции конвейеров развертывания Lakehouse:
Развертывание в рабочих областях разработки, тестирования и рабочей среды.
Lakehouse можно удалить как зависимый объект при развертывании. Сопоставление различных Lakehouse в контексте конвейера развертывания также поддерживается.
Если во время настройки конвейера развертывания ничего не указано, в целевой рабочей области создается новый пустой объект Lakehouse с тем же именем. Определения заданий Notebook и Spark переназначаются для ссылки на новый объект Lakehouse в новой рабочей области.
Если зависимость Lakehouse настроена для ссылки на другое Lakehouse во время настройки конвейера развертывания, например вышестоящий Lakehouse, новый пустой объект Lakehouse с тем же именем по-прежнему создается в целевой рабочей области, но ссылки на записные книжки и определения заданий Spark сохраняются в другом Lakehouse, как запрошено.
Конечные точки и семантические модели SQL Analytics подготавливаются в рамках развертывания Lakehouse.
Объект внутри Lakehouse не перезаписан.
Обновления имени Lakehouse можно синхронизировать между рабочими областями в контексте конвейера развертывания.