Del via


Oversikt over aktiviteter

Aktiviteter er byggesteinene som hjelper deg med å opprette ende-til-ende-dataarbeidsflyter i Microsoft Fabric. Tenk på dem som oppgavene som flytter og transformerer dataene dine for å dekke forretningsbehovene dine. Du kan bruke en kopieringsaktivitet til å flytte data fra SQL Server til Azure Blob Storage. Deretter kan du legge til en dataflytaktivitet eller notatblokkaktivitet for å behandle og transformere disse dataene før du laster dem inn i Azure Synapse Analytics for rapportering.

Aktiviteter grupperes sammen i pipeliner for å oppnå bestemte mål. Du kan for eksempel opprette et datasamlebånd som:

  • Henter inn loggdata fra forskjellige kilder
  • Renser og organiserer disse dataene
  • Kjører analyse for å få innsikt

Ved å gruppere aktivitetene i et datasamlebånd kan du administrere alle disse trinnene som én enhet i stedet for å håndtere hver aktivitet separat. Du kan distribuere og planlegge hele datasamlebåndet samtidig, slik at det kan kjøres når du trenger det.

Microsoft Fabric tilbyr tre typer aktiviteter:

Dataflyttingsaktiviteter

Disse aktivitetene hjelper deg med å flytte data fra ett sted til et annet i pipelinen.

Bevegelsesaktivitet Description
Kopier data Du kan kopiere data fra en hvilken som helst støttet kilde til en hvilken som helst støttet destinasjon. Se oversikten over koblinger for å se hva som er tilgjengelig.
Kopier jobb Kopieringsjobber er en forenklet metode for å flytte data raskt.

Hvis du trenger å velge mellom ulike alternativer for dataflytting, kan du se artikkelen om beslutningsveiledning for dataflytting .

Datatransformeringsaktiviteter

Disse aktivitetene hjelper deg med å behandle og transformere dataene dine. Du kan bruke dem enkeltvis eller lenke dem sammen med andre aktiviteter.

Hvis du vil ha mer informasjon, kan du se artikkelen om datatransformasjonsaktiviteter .

Datatransformasjonsaktivitet Databehandlingsmiljø
Kopier data Databehandlingsbehandling av Microsoft Fabric
Gen2 for dataflyt Databehandlingsbehandling av Microsoft Fabric
Slette data Databehandlingsbehandling av Microsoft Fabric
Stoff notatbok Apache Spark-klynger administrert av Microsoft Fabric
HDInsight-aktivitet Apache Spark-klynger administrert av Microsoft Fabric
Spark-jobbdefinisjon Apache Spark-klynger administrert av Microsoft Fabric
Lagret prosedyre Azure SQL, Azure Synapse Analytics eller SQL Server
SQL-skript Azure SQL, Azure Synapse Analytics eller SQL Server

Kontrollflytaktiviteter

Disse aktivitetene hjelper deg med å kontrollere hvordan datasamlebåndet kjøres:

Kontroller aktivitet Description
Legg til variabel Legg til en verdi i en eksisterende matrisevariabel.
Azure Batch-aktivitet Kjører et Azure Batch-skript.
Azure Databricks-aktivitet Kjører en Azure Databricks-jobb (Notebook, Jar, Python).
Azure Machine Learning-aktivitet Kjører en Azure Machine Learning-jobb.
Deaktiver aktivitet Deaktiverer en annen aktivitet.
Fail Forårsake kjøring av datasamlebånd mislykkes med en tilpasset feilmelding og feilkode.
Filter Bruk et filteruttrykk på en inndatamatrise.
ForEach ForEach-aktivitet definerer en gjentatt kontrollflyt i datasamlebåndet. Denne aktiviteten brukes til å gjenta en samling og utfører angitte aktiviteter i en løkke. Sløyfeimplementeringen av denne aktiviteten ligner på Foreach-løkkestrukturen på programmeringsspråk.
Funksjoner aktivitet Utfører en Azure-funksjon.
Hent metadata GetMetadata-aktivitet kan brukes til å hente metadata fra alle data i en Data Factory- eller Synapse-datasamlebånd.
Hvis tilstand Hvis-betingelsen kan brukes til gren basert på betingelse som evalueres til sann eller usann. If Condition-aktiviteten gir den samme funksjonaliteten som en if-setning gir i programmeringsspråk. Det evaluerer et sett med aktiviteter når betingelsen evalueres til true og et annet sett med aktiviteter når betingelsen evalueres til false.
Aktivere datasamlebånd Utfør datasamlebåndaktivitet gjør det mulig for en datafabrikk eller synapse-datasamlebånd å aktivere et annet datasamlebånd.
KQL-aktivitet Utfører et KQL-skript mot en Kusto-forekomst.
Vedlikehold av innsjøhus Utfør rutinemessig tabellvedlikehold på en Lakehouse fra en Microsoft Fabric-pipeline.
Oppslagsaktivitet Oppslagsaktivitet kan brukes til å lese eller slå opp en post/tabellnavn/-verdi fra en ekstern kilde. Dette utdataene kan refereres videre ved å utføre aktiviteter.
Refresh SQL Endpoint-aktivitet Oppdaterer et Lakehouse SQL-endepunkt for å gjenspeile de nyeste dataene.
Angi variabel Angi verdien for en eksisterende variabel.
Bytt aktivitet Implementerer et bryteruttrykk som tillater flere etterfølgende aktiviteter for hvert potensielle resultat av uttrykket.
Teams-aktivitet Legger inn en melding i en Teams-kanal eller gruppechat.
Inntil aktivitet Implementerer Do-Until-løkke som ligner på Do-Until looping-strukturen på programmeringsspråk. Det utfører et sett med aktiviteter i en løkke til betingelsen som er knyttet til aktiviteten, evalueres til sann. Du kan angi en tidsavbruddsverdi for frem til-aktiviteten.
Vent-aktivitet Når du bruker en venteaktivitet i et datasamlebånd, venter datasamlebåndet på det angitte tidspunktet før du fortsetter med kjøring av etterfølgende aktiviteter.
Nettaktivitet Webaktivitet kan brukes til å kalle et egendefinert REST-endepunkt fra et datasamlebånd.
Webhook-aktivitet Bruk webhook-aktiviteten, ring et endepunkt og send en url-adresse for tilbakeringing. Datasamlebåndkjøringen venter på at tilbakeringingen aktiveres før du fortsetter til neste aktivitet.

Legge til aktiviteter i et datasamlebånd med Microsoft Fabric-brukergrensesnittet

Slik legger du til og konfigurerer aktiviteter i datasamlebåndet:

  1. Opprett et nytt datasamlebånd i arbeidsområdet.
  2. Gå til Aktiviteter-fanen og bla gjennom de tilgjengelige aktivitetene. Rull til høyre for å se alle alternativene, og velg deretter en aktivitet for å legge den til i redigeringsprogrammet for datasamlebånd.
  3. Når du legger til en aktivitet og velger den på lerretet, ser du de generelle innstillingene i egenskapsruten nedenfor.
  4. Hver aktivitet har andre konfigurasjonsalternativer i andre kategorier i egenskapsruten.

Skjermbilde som viser redigeringsprogrammet for datasamlebåndet med Aktiviteter-fanen, verktøylinjen, en kopiaktivitet og Generelt-fanen for egenskapene, uthevet.

Generelle innstillinger

Når du legger til en ny aktivitet i et datasamlebånd og velger det, ser du egenskapene nederst på skjermen. Disse inkluderer Generelt, Innstillinger og noen ganger andre faner.

Skjermbilde som viser fanen Generelle innstillinger for en aktivitet.

Hver aktivitet inkluderer feltene Navn og Beskrivelse i de generelle innstillingene. Noen aktiviteter har også disse alternativene:

Setting Description
Timeout Hvor lenge en aktivitet kan pågå før tidsutbrudd. Standard er 12 timer, og maksimum er syv dager. Bruk formatet D.HH:MM:SS.
Retry Hvor mange ganger du skal prøve på nytt hvis aktiviteten mislykkes.
(Avanserte egenskaper) Prøv intervall på nytt (sek) Hvor mange sekunder du skal vente mellom forsøkene på nytt.
(Avanserte egenskaper) Sikker utdata Når dette alternativet er valgt, vises ikke aktivitetsutdata i logger.
(Avanserte egenskaper) Sikre inndata Når dette alternativet er valgt, vises ikke aktivitetsinndata i logger.

Note

Som standard kan du ha opptil 120 aktiviteter per datasamlebånd. Dette inkluderer indre aktiviteter for containere.

Deaktivere en aktivitet

Du kan deaktivere én eller flere aktiviteter fra en pipeline for å hoppe over dem under validering og pipelinekjøringer. Denne funksjonen forbedrer effektiviteten til pipelineutviklere, slik at du kan kommentere ut deler av pipelinen uten å slette den fra canvasen. Du kan aktivere aktivitetene igjen på et senere tidspunkt.

Deaktiver aktiviteter

Det finnes to måter å deaktivere en aktivitet på: deaktivere én aktivitet fra fanen Generelt, eller deaktivere flere aktiviteter med høyreklikk.

Lagre endringene for å deaktivere aktivitetene under neste planlagte pipeline-kjøring.

Deaktiver en enkelt aktivitet

  1. Velg aktiviteten du vil deaktivere
  2. Under fanen Generelt , velg Deaktivert for aktivitetstilstand
  3. Velg en stat for å markere aktivitet som. Velg mellom Suksessert, Mislykket eller Hoppet over

Skjermbilde av Fabric Data Factory pipeline-editor med ActivityDeaktivert webaktivitet satt til Inaktiv i Generelle innstillinger.

Deaktiver flere aktiviteter

  1. Trykk ned Ctrl-tasten for å multiselectere. Bruk musen til å venstreklikke på alle aktiviteter du vil deaktivere
  2. Høyreklikk for å åpne nedtrekksmenyen
  3. Velg Deaktiver for å deaktivere dem alle
  4. For å finjustere innstillingene for aktivitet som, gå til fanen Generelt , og gjør nødvendige endringer

Skjermbilde av hvordan man deaktiverer flere aktiviteter samtidig.

Reaktiver aktiviteter

For å reaktivere aktivitetene, velg Aktivert for Aktivitetstilstanden, og de går tilbake til sine tidligere atferder, som forventet.

Inaktiv aktivitetsatferd

En inaktiv aktivitet oppfører seg annerledes i en pipeline.

  • På lerretet er den inaktive aktiviteten grået ut, med Inaktiv-skiltet plassert ved siden av aktivitetstypen

  • På lerretet plasseres et statustegn (Suksessert, Mislykket eller Hoppet over) på boksen for å visualisere -aktiviteten som innstilling

  • Aktiviteten er ekskludert fra pipelinevalidering. Derfor trenger du ikke å oppgi alle nødvendige felt for en inaktiv aktivitet.

  • Under feilsøkingskjøring og pipeline-kjøring vil aktiviteten faktisk ikke kjøres. I stedet kjører den en plassholderlinje, med den reserverte statusen Inaktiv

  • Forgreningsalternativet styres av Merk-aktivitet som valg. Med andre ord:

    • Hvis du markerer aktiviteten som Succeeded, kjører UponSuccess- eller UponCompleten-grenen
    • Hvis du markerer aktiviteten som Failed, kjører UponFailure- eller UponCompleten-grenen
    • Hvis du markerer aktiviteten som hoppet over, kjører UponSkip-grenen

    Skjermbilde som viser aktivitetskjøring av en inaktiv aktivitet.

Beste praksis for deaktivering

Deaktivering er et kraftig verktøy for pipelineutviklere. Det lar utviklere «kommentere ut» deler av koden, uten å permanent slette aktivitetene. Den skinner i følgende situasjoner:

  • Når man utvikler en pipeline, kan utvikleren legge til midlertidige inaktive aktiviteter før alle nødvendige felt fylles. For eksempel trenger jeg en kopieringsaktivitet fra SQL Server til Data Warehouse, men jeg har ikke satt opp alle tilkoblingene ennå. Så jeg bruker en inaktiv kopiaktivitet som plassholder for iterativ utviklingsprosess.
  • Etter utrulling kan utvikleren kommentere ut visse aktiviteter som stadig skaper problemer for å unngå kostbare omprøvinger. For eksempel har min lokale SQL-server problemer med nettverkstilkoblingen, og jeg vet helt sikkert at kopieringsaktivitetene mine feiler. Jeg kan ønske å deaktivere kopieringsaktiviteten for å unngå at gjenprøvingsforespørsler oversvømmer det sprø systemet.

Note

En inaktiv aktivitet kjører aldri egentlig. Dette betyr at aktiviteten ikke vil ha et feilfelt, eller sine typiske utdatafelt. Enhver referanse til manglende felt kan gi feil nedstrøms.