Del via


Transformér data ved at køre en notesbog

Brug aktiviteten Notesbog til at køre notesbøger , du opretter i Microsoft Fabric, som en del af dine Data Factory-pipelines. Med notesbøger kan du køre Apache Spark-job for at hente, rydde op i eller transformere dine data som en del af dine dataarbejdsprocesser. Det er nemt at føje en notesbogsaktivitet til dine pipelines i Fabric, og denne vejledning fører dig gennem hvert trin.

Forudsætninger

For at komme i gang skal du fuldføre følgende forudsætninger:

Opret en notesbogaktivitet

  1. Opret en ny pipeline i dit arbejdsområde.

  2. Søg efter Notesbog i ruden Pipelineaktiviteter, og vælg den for at føje den til pipelinelærredet.

    Skærmbillede af brugergrænsefladen Fabric med ruden Aktiviteter og Notesbogaktivitet fremhævet.

  3. Vælg den nye notesbogaktivitet på lærredet, hvis den ikke allerede er valgt.

    Skærmbillede, der viser fanen Generelle indstillinger i notesbogaktiviteten.

    Se vejledningen til generelle indstillinger for at konfigurere fanen Generelle indstillinger.

Konfigurer indstillinger for notesbog

Vælg fanen Indstillinger.

Under Forbindelse skal du vælge autentificeringsmetoden for notebook-kørslen og angive de nødvendige legitimationsoplysninger.

Vælg en eksisterende notesbog fra notesbogsmenuen , og angiv eventuelt eventuelle parametre, der skal sendes til notesbogen.

Skærmbillede, der viser fanen Indstillinger for notesbog, der fremhæver fanen, hvor du kan vælge en notesbog, og hvor du kan tilføje parametre.

Angiv sessionsmærke

Hvis du vil minimere den tid, det tager at udføre notesbogjobbet, kan du eventuelt angive et sessionsmærke. Når du angiver sessionskoden, får Spark besked om at genbruge en eksisterende Spark-session, hvilket minimerer starttidspunktet. Alle vilkårlige strengværdier kan bruges til sessionskoden. Hvis der ikke findes en session, oprettes der en ny ved hjælp af kodeværdien.

Skærmbillede, der viser fanen Indstillinger for notesbog, der fremhæver fanen, hvor du kan tilføje sessionsmærke.

Bemærk

Hvis du vil kunne bruge sessionskoden, skal indstillingen Høj samtidighedstilstand for pipeline, der kører flere notesbøger, være slået til. Denne indstilling kan findes under tilstanden Høj samtidighed for Spark-indstillinger under indstillingerne for arbejdsområdet

Skærmbillede, der viser fanen Indstillinger for arbejdsområde, der fremhæver fanen, hvor du kan aktivere høj samtidighedstilstand for pipelines, der kører flere notesbøger.

Gem og kør eller planlæg pipelinen

Skift til fanen Hjem øverst i pipelineeditoren, og vælg knappen Gem for at gemme pipelinen. Vælg Kør for at køre den direkte eller Planlæg for at planlægge den. Du kan også få vist kørselsoversigten her eller konfigurere andre indstillinger.

Skærmbillede, der viser fanen Hjem i pipelineeditoren med tabulatornavnet, knapperne Gem, Kør og Planlæg fremhævet.

Kendte problemer

  • Nogle kunder ser måske ikke Workspace Identity (WI) dropdown-menuen, eller kan se den, men kan ikke oprette en forbindelse. Denne adfærd skyldes et kendt problem i en af vores underliggende platformkomponenter. Rettelsen arbejdes i øjeblikket på.