Del via


Styring og installation af notesbogkilde

Denne artikel forklarer, hvordan man bruger Git-integration og implementeringspipelines med notebooks i Microsoft Fabric. Du lærer at forbinde et repository, administrere notebook-kildekoden og deployere notebooks på tværs af miljøer.

Før du starter

  • Forbind dit arbejdsområde til Git, før du gennemfører notebooks source-control-trin. For opsætningsinstruktioner, se Kom i gang med Git-integration.
  • Opret notebook-udrulningsregler på målstadiet (for eksempel Test eller Produktion), ikke på Udvikling.
  • For at oprette deployeringsregler skal du være ejer af genstanden.

Git-integration af notesbog

Fabric notebooks understøtter Git-integration med Azure DevOps til versionskontrol. Du kan versionsændringer i notesbøger, samarbejde ved at bruge branches og administrere notebook-livscyklusopdateringer direkte i Fabric.

Når du committer en notesbog sammen med dens tilknyttede afhængigheder (for eksempel miljøer), bevarer synkronisering til et andet arbejdsområde disse bindings. Fabric binder automatisk notesbogen til de tilsvarende ressourcer i det nye arbejdsområde.

For at understøtte denne adfærd gemmer Fabric logiske identifikatorer for tilknyttede ressourcer i notesbogens metadata. Som følge heraf kan Git-diffs vise metadataopdateringer fra fysiske til logiske ID'er.

Bemærk

Metadataopdateringer relateret til logiske ID'er og autobinding kan dukke op i Git diff-visninger, selv når notebook-koden ikke ændres.

Konfigurer en forbindelse

Fra workspace-indstillinger kan du oprette en forbindelse til dit repository for at committe og synkronisere ændringer. For opsætningsinstruktioner, se Kom i gang med Git-integration. Efter du har forbindet, vises dine elementer, inklusive notesbøger, i Source-kontrolpanelet .

Skærmbillede af kontrolpanelet for arbejdsområdets kilde.

Efter du har committet notebook-instanser til Git-repositoryet, kan du se notebook-mappestrukturen i repositoryet.

Du kan nu udføre Git-operationer, såsom Opret pull request.

Notesbogrepræsentation i Git

Følgende tekst viser filstrukturen for et notebook-element i Git-repositoryet:

.
├── Notebook_1.Notebook/
│   ├── Resources/ (Optional)
│   │   └── builtin/
│   │       ├── large_dataset.parquet
│   │       └── model_output.parquet
│   ├── .platform
│   ├── fs-settings.json (Optional)
│   ├── notebook-content.py
│   └── notebook-settings.json (Optional)
└── Readme.md
.
├── Notebook_2.Notebook/
│   ├── Resources/ (Optional)
│   │   └── builtin/
│   │       ├── large_dataset.parquet
│   │       └── model_output.parquet
│   ├── .platform
│   ├── fs-settings.json (Optional)
│   ├── notebook-content.sql
│   └── notebook-settings.json (Optional)
└── Readme.md

Når du committer et notesbogselement, gemmer Fabric det som kildefiler i stedet for en standardfil .ipynb . For eksempel gemmes en PySpark-notebook som notebook-content.py. Dette format er lettere at gennemgå i Git-diffs.

Kildefilen opbevarer notesbogsmetadata (inklusive standard lakehouse og tilknyttet miljø), markdown-celler og kodeceller som separate sektioner. Fabric bruger denne struktur til at rekonstruere notesbogen, når du synkroniserer tilbage til et arbejdsområde.

Notesbogcelleoutput er ikke inkluderet, når der synkroniseres til Git.

Følgende skærmbillede viser kildeformatet i Git-arkivet:

Skærmbillede af git-lagerindholdsformat for notesbog.

Bemærk

Hold notesbøger og deres afhængige miljøer i samme arbejdsområde, og installer både notesbøger og miljøelementer i Git. Fabric kortlægger disse relationer, når du synkroniserer med nye arbejdsområder.

Standard lakehouse-ID forbliver i notesbogens metadata, når du synkroniserer fra repositoryet til et Fabric-arbejdsområde. Hvis nødvendigt, bind notesbogen manuelt til det nye lakehouse-element. Du kan få flere oplysninger under Integration af Lakehouse Git.

Notebook Git-indstillinger

Git-indstillingspanelet lader dig styre, hvordan notebooks interagerer med versionskontrol, inklusive muligheder for Git-binding og styring af, hvilke Resources-mapper der er inkluderet i commits.

Bemærk

Rediger notebook-settings.json ikke i Git-repositoryet for at styre Git-autobinding eller ressourcer. Administrer disse indstillinger via notesbogsindstillingssiden i stedet.

Lakehouse Auto-binding i Git

Lakehouse Auto-Binding lader Fabric afgøre det korrekte standard lakehouse for hvert Git-forbundet arbejdsområde. Dette reducerer manuel genbinding, når du flytter notesbøger mellem udviklings-, test- og produktionsarbejdsområder.

Aktivér denne funktion fra notesbogens indstillinger. Efter du har aktiveret det, opretter notebook-settings.json Fabric filen i repositoryet og administrerer denne fil automatisk. Rediger ikke denne fil manuelt.

Skærmbillede af notebook git-binding.

Bemærk

Notebook Git-integration understøtter at bevare bindingsforholdet mellem notebooks og deres tilknyttede lakehouses, når man synkroniserer på tværs af arbejdsområder. Når du synkroniserer en notesbog med et andet arbejdsområde, kan du vælge, om den binder til lakehouse i kildearbejdsområdet eller lakehouse i det nye workspace. For notebooks, der allerede er versioneret i Git, erstattes det fysiske ID for det tilknyttede lakehouse i notebook-metadata med et logisk ID. Denne ændring kan optræde i Git diff-visningen.

Notebooks Resources Mappe-understøttelse i Git

Bemærk

Environment Resources-mappen og integrationen med deployment-pipelines og offentlige API'er understøttes ikke i øjeblikket.

Den indbyggede Resources-mappe kan dedikeres til Git, så scripts og konfigurationsfiler versioneres sammen med notebooken.

Denne funktion er valgfri og slået fra som standard. Aktivér det fra Notebook-indstillingerne i Git-indstillingssektionen. Efter du har aktiveret det, bliver filer i Resources-mappen inkluderet i commits. Da commits har en grænse på 50 MB , skal fil .gitignore - eller Git-regler bruges til at udelukke store eller midlertidige filer eller mapper.

Skærmbillede af notebook-ressourcer i git-konfiguration.

Bemærk

Kun i .gitignore den indbyggede ressourcerodsmappe træder i kraft.

Efter du har konfigureret Git-regler og committet ændringer, gemmer Fabric reglerne fs-settings.json i repositoryet. Fabric genererer og administrerer denne fil for at holde repository-konfigurationen konsistent. Vi anbefaler heller ikke at redigere denne fil direkte i Git-repositoriet.

Skærmbillede af notesbogens ressourcestruktur i git-konfiguration.

Notesbog i udrulningspipelines

Brug deployment-pipelines til at fremme notebook-ændringer på tværs af faser som Udvikling, Test og Produktion. Valider opdateringer i de tidlige faser, før du forfremmer dem til produktion.

Notebook-udrulning understøtter autobinding for standard lakehouse og tilknyttet miljø, når afhængige elementer er i samme arbejdsområde. Under udrulning kan Fabric ombinde disse afhængigheder til tilsvarende elementer i målarbejdsområdet. Metadataændringer kan vises i differentialvisningen.

Hvis du har brug for et specifikt mål-trins standard lakehouse, kan du konfigurere en deployment-regel, der tilsidesætter auto-binding.

Den nye deployment pipeline UI bruges i øjeblikket i denne artikel. Du kan skifte til det gamle UI ved at slå New Deployment-pipelinen fra.

Bemærk

Kendt problem: Status for frosne celler i notebooks bevares ikke under udrulning.

Brug følgende trin til at deploye notebooks gennem en deployment-pipeline.

  1. Opret en deployment-pipeline, eller åbn en eksisterende. Du kan få flere oplysninger under Kom i gang med udrulningspipelines.

  2. Tildel arbejdsområder til forskellige faser i henhold til dine udrulningsmål.

  3. Vælg, se og sammenlign elementer, inklusive notesbøger, mellem stadier. Det fremhævede badge viser antallet af ændrede genstande mellem den forrige og den nuværende fase.

    Skærmbillede af notesbog i udrulningspipeline.

  4. Vælg Deploy for at promovere notebooks på tværs af udviklings-, test- og produktionsfaserne .

    Skærmbillede af valg af elementer og installation.

  5. I vinduet Deploy to this stage kan du gennemgå de nye og ændrede elementer. For at fortsætte udrulning, selvom et eller flere elementer fejler, vælg Fortsæt udrulning, hvis et eller flere elementer fejler.

    Efter du har gennemgået og bekræftet udvælgelsen, vælg Deploy.

    Skærmbillede af installation af indhold pop-up.png.

  6. (Valgfrit.) For at oprette implementeringsregler skal du vælge Udrulningsregler på målstadiet i pipelinen (for eksempel Test eller Produktion).

    For generelle regeladfærd og begrænsninger, se Opret udrulningsregler.

    Skærmbillede af indtastning af installationsregler.

  7. Konfigurer en standard lakehouse-regel for hver notebook-udrulning.

    Denne regel styrer, hvilket lakehouse notebooken forbinder til i målstadiet efter udrulning.

    I feltet Set deployment rules , vælg Default lakehouse-flisen .

    Brug From og To dropdowns til at mappe kildestagets standard søhus til målstadens standard søhus:

    • Det samme gælder kilde lakehouse: Behold samme standard lakehouse-indstilling som kilde-stadiet.
    • N/A (ingen standard lakehouse): Fjern standard lakehouse-indstillingen i målfasen.
    • Andet: Erstat kildestadiet standard lakehouse med et andet lakehouse i målstadiet.

    Hvis du vælger Andet i Til-dropdownmenuen , skal du angive detaljerne om det ønskede søhus:

    • Lakehouse ID
    • Søhusets navn
    • Lakehouse arbejdsområde-ID

    Skærmbillede af angiv standard lakehouse.

    Bemærk

    Lakehouse ID kræves, når du konfigurerer denne regel. Du kan få lakehouse-ID'et fra item-URL'en. Udrulningsregler har prioritet over auto-binding. Hvis en udrulningsregel konfigureres, tilsidesætter den det automatisk bundne lakehouse.

  8. Overvåg installationsstatussen fra installationshistorikken.