Správa verzování a nasazení notebooku

Tento článek vysvětluje, jak používat integraci Gitu a nasazovací kanály s poznámkovými bloky v Microsoft Fabric. Naučíte se připojit úložiště, spravovat zdrojový kód poznámkového bloku a nasazovat poznámkové bloky napříč prostředími.

Než začnete

  • Než dokončíte kroky správy zdrojového kódu poznámkového bloku, připojte pracovní prostor k Gitu. Pokyny k nastavení najdete v tématu Začínáme s integrací Gitu.
  • Vytvořte pravidla nasazení poznámkového bloku v cílové fázi (například Test nebo Produkční), ne ve vývoji.
  • Pokud chcete vytvořit pravidla nasazení, musíte být vlastníkem položky.

Git integrace notebooku

Poznámkové bloky Fabric podporují integraci s Git a Azure DevOps pro správu verzí. Verziování změn v poznámkovém bloku, spolupráci pomocí větví a správu aktualizací životního cyklu poznámkového bloku můžete provádět přímo ve Fabric.

Když poznámkový blok potvrdíte společně s připojenými závislostmi (například prostředími), synchronizace do jiného pracovního prostoru tyto vazby zachová. Fabric automaticky propojí poznámkový sešit s příslušnými prostředky v novém pracovním prostoru.

K podpoře tohoto chování ukládá Fabric logické identifikátory pro připojené zdroje v metadatech poznámkového bloku. Díky tomu můžou rozdíly Gitu zobrazovat aktualizace metadat z fyzických ID na logická ID.

Poznámka:

Aktualizace metadat souvisejících s logickými ID a automatickými vazbami se můžou zobrazovat v rozdílových zobrazeních Gitu, i když se kód poznámkového bloku nezmění.

Nastavení připojení

V nastavení pracovního prostoru nastavte připojení k úložišti pro potvrzení a synchronizaci změn. Pokyny k nastavení najdete v tématu Začínáme s integrací Gitu. Po připojení se položky, včetně poznámkových bloků, zobrazí na panelu Správa zdrojového kódu .

Snímek obrazovky s panelem správy zdrojového kódu pracovního prostoru

Po potvrzení instancí poznámkového bloku do úložiště Git uvidíte strukturu složek poznámkového bloku v úložišti.

Teď můžete provádět operace Gitu, například vytvořit žádost o přijetí změn.

Reprezentace poznámkového bloku v Gitu

Následující text ukazuje strukturu souborů pro položku poznámkového bloku v úložišti Git:

.
├── Notebook_1.Notebook/
│   ├── Resources/ (Optional)
│   │   └── builtin/
│   │       ├── large_dataset.parquet
│   │       └── model_output.parquet
│   ├── .platform
│   ├── fs-settings.json (Optional)
│   ├── notebook-content.py
│   └── notebook-settings.json (Optional)
└── Readme.md
.
├── Notebook_2.Notebook/
│   ├── Resources/ (Optional)
│   │   └── builtin/
│   │       ├── large_dataset.parquet
│   │       └── model_output.parquet
│   ├── .platform
│   ├── fs-settings.json (Optional)
│   ├── notebook-content.sql
│   └── notebook-settings.json (Optional)
└── Readme.md

Když potvrdíte položku poznámkového bloku, Fabric ji uloží jako zdrojové soubory místo standardního .ipynb souboru. Například poznámkový blok PySpark je uložený jako notebook-content.py. Tento formát je jednodušší zkontrolovat v rozdílech Gitu.

Zdrojový soubor uchovává metadata poznámkového bloku (včetně výchozího úložiště dat typu lakehouse a připojeného prostředí), buňky s formátováním markdown a buňky s kódem jako samostatné oddíly. Fabric tuto strukturu používá k rekonstrukci poznámkového bloku při synchronizaci zpět do pracovního prostoru.

Výstup z buňky notebooku není zahrnutý při synchronizaci s Gitem.

Následující snímek obrazovky ukazuje zdrojový formát v úložišti Git:

Snímek obrazovky s formátem obsahu úložiště Git poznámkového bloku

Poznámka:

Poznámkové bloky a jejich závislá prostředí uchovávejte ve stejném pracovním prostoru a verzujte jak poznámkové bloky, tak položky prostředí v Gitu. Fabric mapuje tyto vztahy při synchronizaci s novými pracovními prostory.

Výchozí ID lakehouse zůstane v metadatech poznámkového bloku při synchronizaci z úložiště do pracovního prostoru Fabric. V případě potřeby ručně přiřaďte poznámkový blok k nové položce lakehouse. Další informace najdete v tématu Integrace Lakehouse Git.

Git nastavení pro notebook

Panel nastavení Gitu umožňuje řídit, jak poznámkové bloky komunikují se správou zdrojového kódu, včetně možností napojení Gitu a správy souborů ve složce Resources, které jsou součástí potvrzení.

Poznámka:

Neupravujte notebook-settings.json v úložišti Git, abyste mohli řídit automatické vazby nebo prostředky Gitu. Tato nastavení můžete spravovat prostřednictvím stránky nastavení poznámkového bloku.

Automatické vazby Lakehouse v Gitu

Automatické vazby Lakehouse umožňují systému Fabric určit správný výchozí Lakehouse pro každý pracovní prostor připojený k Gitu. Díky tomu se při přesouvání poznámkových bloků mezi vývojovými, testovacími a produkčními pracovními prostory snižuje ruční přebinování.

Tuto funkci povolte v nastavení poznámkového bloku. Jakmile to povolíte, Fabric vytvoří notebook-settings.json v úložišti a automaticky spravuje tento soubor. Tento soubor ručně neupravujte.

Poznámka:

Integrace Gitu s poznámkovými bloky podporuje zachování vazby mezi poznámkovými bloky a připojenými datovými jezery při synchronizaci mezi pracovišti. Při synchronizaci poznámkového bloku s jiným pracovním prostorem si můžete zvolit, zda se má propojit s lakehouse ve zdrojovém pracovním prostoru nebo s lakehouse v novém pracovním prostoru. U poznámkových bloků, které už jsou ve verzi Gitu, se fyzické ID připojeného objektu Lakehouse v metadatech poznámkového bloku nahradí logickým ID. Tato změna se může zobrazit v zobrazení rozdílu Gitu.

Podpora složek zdrojů poznámkových bloků v Gitu

Poznámka:

Složka Prostředky prostředí a integrace s kanály nasazení a veřejnými rozhraními API se v současné době nepodporují.

Integrovaná složka Resources se dá commitovat do Gitu, aby skripty a konfigurační soubory byly verzovány společně s poznámkovým blokem.

Tato funkce je ve výchozím nastavení volitelná a vypnutá. Povolte ho z nastavení poznámkového bloku v části Nastavení Gitu. Po povolení se soubory ve složce Resources zahrnou do potvrzení. Vzhledem k tomu, že potvrzení mají limit 50 MB , použijte .gitignore pravidla souboru nebo Gitu k vyloučení velkých nebo dočasných souborů nebo složek.

Snímek obrazovky s prostředky poznámkového bloku v konfiguraci Gitu

Poznámka:

Projeví se pouze v integrované kořenové složce prostředků .gitignore.

Po konfiguraci pravidel Gitu a potvrzení změn Fabric uloží pravidla do fs-settings.json úložiště. "Fabric generuje a spravuje tento soubor, aby byla konfigurace úložiště konzistentní." Tento soubor také nedoporučujeme upravovat přímo v úložišti Git.

Snímek obrazovky se strukturou prostředků poznámkového bloku v konfiguraci Gitu

Poznámkový blok v kanálech nasazení

Kanály nasazení můžete použít k propagaci změn poznámkových bloků napříč fázemi, jako je vývoj, testování a produkce. Validujte aktualizace v dřívějších fázích před tím, než je povýšíte do produkčního prostředí.

Nasazení poznámkového bloku podporuje automatické přiřazení pro výchozí datové jezero a připojené prostředí, pokud jsou závislé položky ve stejném pracovním prostoru. Během nasazování může Fabric znovu navázat tyto závislosti na odpovídající položky v cílovém pracovním prostoru. Změny metadat se můžou zobrazit v rozdílovém zobrazení.

Pokud potřebujete konkrétní výchozí lakehouse pro cílovou fázi, nakonfigurujte pravidlo nasazení pro přepsání automatického propojení.

Nové uživatelské rozhraní kanálu nasazení se aktuálně používá v tomto článku. Na staré uživatelské rozhraní můžete přepnout vypnutím nového nasazovacího kanálu.

Poznámka:

Známý problém: Stav zamrzlé buňky v poznámkových blocích se během nasazování nezachová.

Pomocí následujících kroků implementujte poznámkové bloky prostřednictvím nasazovacího kanálu.

  1. Vytvořte nasazovací kanál nebo otevřete existující. Další informace najdete v tématu Začínáme s kanály nasazení.

  2. Přiřaďte pracovní prostory k různým fázím podle cílů nasazení.

  3. Vyberte, zobrazte a porovnejte položky, včetně poznámkových bloků, mezi fázemi. Zvýrazněný odznáček zobrazuje počet změněných položek mezi předchozí a aktuální fází.

    Snímek obrazovky poznámkového bloku v nasazovacím kanálu

  4. Vyberte Nasadit pro propagaci poznámkových bloků ve fázích Vývoj, Testování a Produkce.

    Snímek obrazovky s vybranými položkami a nasazením

  5. V okně Nasadit do této fáze zkontrolujte nové a změněné položky. Pokud chcete pokračovat v nasazení i v případě selhání jedné nebo více položek, vyberte Pokračovat v nasazení, pokud jedna nebo více položek selže.

    Po kontrole a potvrzení výběru vyberte Nasadit.

    Snímek obrazovky vyskakovacího okna s obsahem nasazení.png

  6. (Volitelné.) Pokud chcete vytvořit Pravidla nasazení, vyberte Pravidla nasazení pro položku cílové fáze v pipeline (například Test nebo Produkce).

    Obecné chování a omezení pravidel najdete v tématu Vytváření pravidel nasazení.

    Snímek obrazovky s položkou pravidel nasazení

  7. Nakonfigurujte výchozí pravidlo lakehouse pro každé nasazení poznámkového bloku.

    Toto pravidlo určuje, ke kterému lakehouse se poznámkový blok připojí v cílové fázi po nasazení.

    V podokně Nastavit pravidla nasazení vyberte dlaždici Výchozí jezero .

    Pomocí rozevíracích polí Od a To namapujte výchozí lakehouse zdrojové fáze na výchozí lakehouse cílové fáze:

    • Stejné jako u zdrojového lakehouse: Ponechte stejné výchozí nastavení lakehouse jako ve zdrojové fázi.
    • Není k dispozici (bez výchozího objektu lakehouse):: Odeberte výchozí nastavení objektu lakehouse v cílové fázi.
    • Jiné: Nahraďte výchozí jezero zdrojové fáze jiným lakehousem v cílové fázi.

    Pokud v rozevíracím seznamu Chcete vybrat jiné, zadejte podrobnosti o cílovém jezeře:

    • Lakehouse ID
    • Název jezera
    • ID pracovního prostoru Lakehouse

    Snímek obrazovky nastavení výchozího lakehouse

    Poznámka:

    Id Lakehouse se vyžaduje při konfiguraci tohoto pravidla. ID lakehouse můžete získat z URL adresy položky. Pravidla nasazení mají přednost před automatickými vazbami. Pokud je pravidlo nasazení nakonfigurované, přepíše automaticky přiřazené lakehouse.

  8. Monitorujte stav nasazení z historie nasazení.