Del via


Forskelle mellem Azure Data Factory og Fabric Data Factory

Data Factory i Microsoft Fabric er den næste generation af Azure Data Factory, der er bygget til at håndtere dine mest komplekse dataintegrationsudfordringer med en enklere og mere effektiv tilgang.

Denne vejledning hjælper dig med at forstå de vigtigste forskelle mellem disse to tjenester, så du kan træffe det rigtige valg for din virksomhed. Vi gennemgår, hvad der er nyt, hvad der er anderledes, og hvilke fordele Fabric giver ved bordet.

Fabric Data Factory er den næste generation af Azure Data Factory, der er designet til at forenkle og forbedre arbejdsprocesser for dataintegration. Dette afsnit introducerer de vigtigste funktioner og fordele ved Fabric Data Factory.

Er du klar til at udforske dine overførselsmuligheder? Se vores migreringsvejledning.

Sammenlign funktioner side om side

Sådan stabler kernefunktionerne sig mellem Azure Data Factory og Fabric Data Factory. Vi har fremhævet, hvad der er ændret, hvad der er nyt, og hvad der forbliver det samme.

Azure Data Factory Datafabrik i Fabric Hvad er anderledes
Pipeline Pipeline Bedre integration: Pipelines i Fabric fungerer problemfrit med Lakehouse, Data Warehouse og andre Fabric-tjenester med det samme. Strukturpipelines indeholder flere SaaS-baserede aktiviteter og adskiller sig i JSON-definitioner. Se vores sammenligning af pipelinefunktioner for at få flere oplysninger.
Tilknytning af dataflow Dataflow Gen2 Nemmere at bruge: Dataflow Gen2 giver dig en enklere oplevelse, når du skal bygge transformationer. Vi føjer hele tiden flere tilknytningsfunktioner for dataflow til Gen2.
Aktiviteter Aktiviteter Der kommer flere aktiviteter: Vi arbejder på at overføre alle dine foretrukne ADF-aktiviteter til Fabric. Derudover får du nye, f.eks. Office 365 Outlook-aktiviteten, der ikke er tilgængelig i ADF. Se vores aktivitetssammenligning for detaljer.
Datasæt Kun forbindelser Enklere tilgang: Ikke flere komplekse konfigurationer af datasæt. For Data Factory i Fabric bruger du forbindelser til at linke til dine datakilder og begynde at arbejde. Fabric eliminerer datasæt og definerer dataegenskaber indbygget i aktiviteter.
Sammenkædet tjeneste Forbindelser Mere intuitiv: Forbindelser fungerer som sammenkædede tjenester, men er lettere at konfigurere og administrere.
Udløsere Udløsere for planlægnings- og filhændelser Indbygget planlægning: Brug Fabric's planlægnings- og reflekshændelser til automatisk at køre dine pipelines. Filhændelsesudløsere fungerer oprindeligt i Fabric uden ekstra konfiguration. Fabric integrerer triggere i sin Activator-ramme, i modsætning til ADF's selvstændige triggere.
Publicer Gem og kør Intet udgivelsestrin: I Fabric skal du springe publiceringstrinnet helt over. Du skal blot vælge Gem for at gemme dit arbejde eller vælge Kør for at gemme og udføre pipelinen med det samme.
Kørsel af Autoresolve og Azure Integration Ikke nødvendig Forenklet arkitektur: Det er ikke nødvendigt at administrere integrationskørsler. Fabric håndterer beregningen for dig.
Kørsel af integration via selvvært Datagateway i det lokale miljø Samme adgang i det lokale miljø: Opret forbindelse til dine data i det lokale miljø ved hjælp af den velkendte datagateway i det lokale miljø. Få mere at vide i vores vejledning til dataadgang i det lokale miljø.
Kørsel af Azure-SSIS-integration Skal bestemmes Fremtidig funktionalitet i Fabric: Vi arbejder stadig på designet til SSIS-integration i Fabric.
Administrerede virtuelle netværk og private slutpunkter Skal bestemmes. Fremtidig funktionalitet i Fabric: Vi arbejder stadig på integration for administrerede virtuelle netværk og private slutpunkter i Fabric.
Udtrykssprog Udtrykssprog Samme udtryk: Din eksisterende udtryk viden overførsler direkte. Syntaksen er næsten identisk.
Godkendelsestyper Godkendelsestyper Flere indstillinger: Alle dine populære ADF-godkendelsesmetoder fungerer i Fabric, og vi har tilføjet nye godkendelsestyper.
CI/CD CI/CD Forbedrede funktioner ud over ADF omfatter nem udvælgelse af kirsebær, promovering af individuelle genstande, aktivering af Git-repo og indbyggede SaaS CI/CD-muligheder.
Eksport/import af ARM-skabeloner Gem som Hurtig duplikering: I Fabric skal du bruge "Gem som" til hurtigt at duplikere pipelines til udvikling eller test.
Overvågning Overvågningshub + kørselshistorik Avanceret overvågning: Overvågningshubben giver en moderne oplevelse med indsigt på tværs af arbejdsområder og bedre detailudledningsfunktioner.
Fejlfinding Interaktiv tilstand Forenklet fejlfinding: Fabric eliminerer ADF's fejlfindingstilstand. Du er altid i interaktiv tilstand.
Registrering af ændringsdata (CDC) Kopier job Trinvis dataflytning: Fabric administrerer trinvis dataflytning via kopijob i stedet for CDC-artefakter.
Azure Synapse-link Mirroring Datareplikering: Fabric erstatter Azure Synapse Link med spejlingsfunktioner til datareplikering.
Udfør pipelineaktivitet Aktivér pipelineaktivitet Aktivering på tværs af platforme: Fabric forbedrer ADF's Execute pipeline-aktivitet med aktivering på tværs af platforme.

Sammenligning af pipelinefunktioner

kategori ADF-rørledninger Rørledninger til stof
Type af tjeneste PaaS-tjeneste til dataintegration SaaS-tjeneste til dataintegration
Oprettelsesmiljø Azure portal (ADF Studio) Fabric / PBI workspace (samlet UX med Lakehouses, Warehouses osv.)
Orkestrering af pipeline Pipelines med alle funktioner med aktiviteter, triggere, parametre Samme orkestreringsmodel, genfortolket til Fabric UX
Dataflytning Kopiaktivitet, tilknytning af dataflow, IR-understøttelse i det lokale miljø, administreret virtuelt netværk Kopiaktivitet, Dataflow Gen2, indbygget forbindelse til OneLake- og Fabric-elementer, datagateway i det lokale miljø, virtuel netværksgateway
Beregning / IR Selvhostet, SSIS og Azure IR (til bevægelse + transformation) Cloudforbindelser, gateway i det lokale miljø og virtuel netværksgateway
Datastrømme Azure Blob, Data Lake Storage, SQL, 100+ connectorer Samme stik + indbygget OneLake-integration, tættere justering af Fabric-arbejdsområdet
Overvågning Pipelines og dataflow i ADF Studio med kørsler, udløsere, beskeder Overvågning af hub og overvågning af arbejdsområder med ensartede visninger på tværs af pipelines, dataflows, notesbøger, databaser osv.
Udløsere Tidsplaner, tumbling-vindue, hændelsesbaserede udløsere Tidsplaner, hændelsesudløsere, tumbling-vinduesudløsere som intervalplaner
CI/CD ARM-skabeloner + Azure DevOps- eller GitHub-lagerintegration Indbyggede udrulningspipelines i Fabric; Promovering på arbejdsområdeniveau (Dev → Test → Production) og integration af eksternt lager
Sikkerhed Administrerede identiteter, Key Vault-integration, private slutpunkter Samme sikkerhedsmodel plus Fabric workspace RBAC; OneLake-sikkerhedsintegration
Pricing Azure-udnyttelsesbaseret betalt efter forbrug (pr. aktivitetskørsel, dataflytning og beregning) Kapacitetsbaseret (Fabric F SKU) uden gebyrer for eksterne aktiviteter eller pipelineaktiviteter, kun aktivitetskørsler og pipelinedataflytning

Sammenligning af aktiviteter

Med Data Factory i Microsoft Fabric fortsætter vi med at opretholde en høj grad af kontinuitet med Azure Data Factory. Ca. 90% af aktiviteter, der er tilgængelige i ADF, er allerede tilgængelige under Data Factory in Fabric. Her er en oversigt over aktiviteterne og deres tilgængelighed i både ADF og Data Factory i Fabric:

Aktivitet ADF Datafabrik i Fabric
ADX/KQL Y Y
Tilføj variabel Y Y
Azure Batch Y Y
Azure Databricks Aktivitet i notesbogJar-aktivitetPython-aktivitetJobaktivitet Azure Databricks-aktivitet
Azure Machine Learning Y Y
Batchkørsel af Azure Machine Learning Frarådet NIELSEN
Opdateringsressource til Azure Machine Learning Frarådet NIELSEN
Kopiér Kopier data Kopier aktivitet
Dataflow Gen2 NIELSEN Y
Slet Y Y
Udfør/påkald pipeline Udfør pipeline Aktivere pipeline
Notesbøger i stof NIELSEN Y
Dumpet Y Y
Filter Y Y
For hver Y Y
Functions Azure, funktionen Funktion aktivitet
Hent metadata Y Y
HDInsight BikubeaktivitetGriseaktivitetKortReducer aktivitetGnistaktivitetStreamingaktivitet HDInsight-aktivitet
Hvis betingelse Y Y
Søg Y Y
Kortlægning af dataflow Y Dataflow Gen2
Office 365 Outlook NIELSEN Y
Power-forespørgsel (kun ADF – Wrangling Dataflow) Frarådet NIELSEN
Script Y Y
Opdatering af semantisk model NIELSEN Y
Indstil variabel Y Y
Sproc Y Y
SSIS Y NIELSEN
Gemt procedure Y Y
Switch Y Y
Synapse Notebook og SJD-aktiviteter Y NIELSEN
Teams NIELSEN Y
Indtil Y Y
Validering Y Hent metadata & If-betingelse
Wait Y Y
web Y Y
Webhook Y Y
Organisering af dataflow Y Dataflow Gen2

Nye aktiviteter i Fabric Data Factory

Ud over at opretholde aktivitetskontinuitet introducerer Data Factory i Fabric nogle nye aktiviteter, der opfylder dine større orkestreringsbehov. Disse nye aktiviteter er:

  1. Outlook: Tilgængelig i Fabric Data Factory for at lette integrationen med Outlook-tjenester.
  2. Teams: Tilgængelig i Fabric Data Factory for at muliggøre orkestrering af Microsoft Teams-aktiviteter.
  3. Opdatering af semantisk model: Tilgængelig i Fabric Data Factory for at forbedre funktionerne til opdatering af semantiske modeller i Power BI.
  4. Dataflow Gen2: Tilgængelig i Fabric Data Factory for at styrke dataorkestrering med avancerede dataflowfunktioner.

Du kan finde en liste over alle tilgængelige Fabric Data Factory-aktiviteter i aktivitetsoversigten.

Sammenligning af stik

Du kan finde en sammenligning af alle connectorer og deres tilgængelighed i Azure Data Factory og Fabric Data Factory i artiklen Sammenligning af connectorer.

Selvhostet Integration Runtime (SHIR) vs. OPDG (On-premises Data Gateway)

Notat

De tjenester, der støttes af SHIR og ODPG, er forskellige:

  • Selvhostet Integration Runtime (SHIR): Understøtter Azure Data Factory, Azure Synapse Analytics, Azure Machine Learning Studio og Azure Purview.
  • Datagateway i det lokale miljø (OPDG): Understøtter Power BI, Power Apps, Power Automate, Azure Analysis Services, Logic Apps, Fabric Dataflow Gen2, Fabric Pipeline, Fabric Copy Job og Fabric Mirroring.
kategori Selvhostet Integration Runtime (SHIR) Datagateway i det lokale miljø (OPDG)
Understøttede tjenester - Azure Data Factory
- Azure Machine Learning-studie
- Azure Synapse Analytics
- Azure Purview
- Power BI
- Power Apps
- Power Automate
- Azure Analysis Services
- Logiske apps
- Fabric Dataflow Gen2
- Rørledning til stof
- Kopi af stof
- Spejling af stof
Installation og registrering - Registreret med nøgle
- Kører i servicetilstand
- Registreret med Microsoft Entra ID-konto
- Understøtter brugertilstand
Perron -Windows
- Containerbillede understøttes
- Kun Windows
- Ingen understøttelse af containere
Understøttelse af proxy - Understøtter både system og brugerdefineret proxy - Understøtter brugerdefineret proxy
Binding af regioner - Rettet til Data Factory-området
- Kan ikke ændre standardområde
- Region kan ændres
Brugerdefineret relæ - Understøttes ikke -Understøttes; Kunder kan medbringe deres eget relæ
Deling på tværs af tjenester - Deles med op til 120 datafabrikker
- Kan ikke deles på tværs af ADF-, Synapse-, Purview- eller Synapse-arbejdsområder
- Tilgængelig for alle understøttede tjenester i en lejer
Høj tilgængelighed (HA) - Op til 8 noder (4 standard) - Op til 10 noder
Gendannelse - Kræver geninstallation - Gendannelsesnøgle understøttes
Belastningsjustering - Belastningsjustering på opgaveniveau baseret på tilgængeligt antal medarbejdere (CPU + hukommelse) - Belastningsjustering på forespørgselsniveau
- Round robin eller tilfældig fordeling muligheder
Opbevaring af legitimationsoplysninger - Gemt lokalt på SHIR-noder
- Azure Key Vault understøttes
- Gemt centralt i Gateway cloud-tjeneste
- Ingen Key Vault-integration
Automatisk opdatering -Understøttes - Understøttes ikke
Mulighed for udvidelse af stik - Understøttes ikke -Understøttes
Interaktiv redigering -Understøttes -Understøttes
Privat link til kontrolflow -Understøttes - Understøttes ikke
Versionering - To udgivelser om måneden; en skubbet som autoopdatering
- Understøtter de sidste 12 måneders udgivelser
- En udgivelse pr. måned
- Understøtter de sidste 6 udgivelser
Begrænsning af CPU og hukommelse - Understøttes ikke -Understøttes
Grænser for gennemløb - Ingen hård grænse; afhængig af netværksbåndbredde Tjenestespecifikke grænser:
Power Apps/Power Automate/Logic Apps:
- Skrivning: Overførselsgrænse på 2 MB
- Læs: 2 MB anmodningsgrænse, 8 MB komprimeret svargrænse
- Grænse for GET-anmodnings-URL: 2.048 tegn
Power BI Direct-forespørgsel: 16 MB ukomprimeret svargrænse

ADF-administreret virtuelt netværk vs. datagateway til virtuelt strukturnetværk

Azure Data Factory (ADF) Managed Virtual Network og Microsoft Fabric Virtual Network (virtuelt netværk) Data Gateway hjælper dig begge med at oprette forbindelse til datakilder på en sikker måde uden at udsætte dem for det offentlige internet. Selvom begge muligheder understøtter privat forbindelse til arbejdsbelastninger i skyen, er de forskellige med hensyn til, hvordan de er konfigureret, hvem der administrerer dem, og hvilke tjenester de understøtter.

  • ADF-administreret VNET
    Microsoft ejer og administrerer netværksmiljøet. Du får en simpel opsætning, men du kan ikke styre netværksindstillingerne eller firewallreglerne.

  • Fabric VNET-datagateway
    Du udruller gatewayen i dit eget virtuelle Azure-netværk. Dette giver dig fuld kontrol over netværk, firewall og skalering. Du bestemmer, hvordan gatewayen opretter forbindelse til dine ressourcer, og administrerer alle netværksindstillinger.

Brug nedenstående tabel til at sammenligne de vigtigste forskelle og vælge den indstilling, der passer til dine arbejdsbelastnings- og styringsbehov.

kategori ADF-administreret virtuelt netværk Datagateway til virtuelt strukturnetværk
Understøttede tjenester Azure Data Factory- og Synapse-pipelines. Microsoft Fabric Dataflow Gen2, Fabric-datapipelines, Fabric Copy Job, Fabric Mirroring, Semantiske Power BI-modeller og sideinddelte Power BI-rapporter
VNET-ejerskab Microsoft-administreret virtuelt netværk (kunden styrer ikke netværket). Kundeadministreret virtuelt netværk (kunden har fuld kontrol).
Private slutpunkter Automatisk oprettet og administreret af ADF for understøttede tjenester (Azure Storage, SQL DB osv.). Kunder konfigurerer Virtual Network Gateway til at forbinde Fabric-arbejdsbelastninger til ressourcer i deres virtuelle netværk.
Kontrol af netværk Begrænset – kunder kan kun tillade virtuel netværksintegrationskørsel til private slutpunkter. Fuld kontrol – kunden konfigurerer firewall, NSG-regler, routing i deres eget virtuelle netværk.
Installation / implementering Ingen installation nødvendig; fuldt administreret af Microsoft i et skjult virtuelt netværk. Kræver installation af virtuelt netværk Data Gateway i kundens virtuelle netværk.
Høj tilgængelighed Microsoft-administreret, automatisk skaleret inde i ADF's virtuelle netværk. Skift til reservetilstand, når du aktiverer TTL. Understøtter skalering og HA (nodebaserede klynger), men kører i kundeadministreret virtuelt netværk. Understøtter op til 7 noder.

Nøglefunktioner i Fabric Data Factory

I Fabric Data Factory er det utroligt nemt og hurtigt at opbygge din pipeline, dataflow og andre Data Factory-elementer på grund af indbygget integration med Microsofts banebrydende AI-funktion Co-Pilot. Med Copilot til Data Factory kan du bruge naturligt sprog til nemt at definere dine dataintegrationsprojekter.

Integration af Native Lakehouse og Data Warehouse

En af de største fordele ved Fabric Data Factory er, hvordan den opretter forbindelse til dine dataplatforme. Lakehouse og Data Warehouse fungerer både som kilder og destinationer i dine pipelines, hvilket gør det nemt at bygge integrerede dataprojekter.

Skærmbillede, der viser fanen med datakilden lakehouse og data warehouse.

Skærmbillede, der viser fanen for destination for lakehouse og data warehouse.

Smarte mailmeddelelser med Office 365

Har du brug for at holde dit team i løkken? Med Office 365 Outlook-aktiviteten kan du sende tilpassede mailmeddelelser om pipelinekørsler, aktivitetsstatus og resultater – alt sammen med enkel konfiguration. Ikke flere kontrol af dashboards hele tiden eller skrivning af brugerdefineret meddelelseskode.

Skærmbillede, der viser denne Outlook-aktivitet i Office 365.

Strømlinet oplevelse af dataforbindelse

Fabrics moderne Hent data-oplevelse gør det hurtigt at konfigurere kopieringspipelines og oprette nye forbindelser. Du bruger mindre tid på at konfigurere og mere tid på at hente dine data, hvor de skal hen.

Skærmbillede, der viser, at En moderne og nem Hent data-oplevelse.

Skærmbillede, der viser, hvordan du opretter en ny forbindelse.

Forbedringer af brugervenlighed i CI/CD-oplevelsen

I Fabric er CI/CD-oplevelsen meget nemmere og mere fleksibel end i Azure Data Factory eller Synapse. Der er ingen forbindelse mellem CI/CD- og ARM-skabeloner i Fabric, hvilket gør det supernemt at håndplukke individuelle dele af dit Fabric-arbejdsområde til indtjekning, udtjekning, validering og samarbejde. I ADF og Synapse er din eneste mulighed for CI/CD at bruge dit eget Git-lager. I Fabric kan du dog vælge at bruge den indbyggede funktion til udrulningspipelines, der ikke kræver, at du medbringer dit eget eksterne Git-lager.

Overvågning og indsigt på næste niveau

Overvågningsoplevelsen i Fabric Data Factory er her, hvor du virkelig kan se forskellen. Overvågningshubben giver dig en komplet visning af alle dine arbejdsbelastninger, og du kan analysere ned i enhver aktivitet for at få detaljeret indsigt. Analyse på tværs af arbejdsområder er indbygget, så du kan se det store billede på tværs af hele organisationen.

Skærmbillede, der viser overvågningshubben og elementerne i Data Factory.

Når du foretager fejlfinding af kopieringsaktiviteter, vil du elske den detaljerede oversigtsvisning. Vælg knappen med kørselsoplysninger (ikonet briller) for at se nøjagtigt, hvad der skete. Opdelingen Varighed viser dig, hvor lang tid hver fase tog, hvilket gør optimering af ydeevnen nemmere.

Skærmbillede, der viser overvågningsresultaterne for pipelinekopi, indeholder detaljerede oplysninger om kopiaktivitet.

Skærmbillede, der viser oplysninger om kopiering af data.

Duplikering af hurtig pipeline

Har du brug for at oprette en lignende pipeline? Funktionen Gem som giver dig mulighed for at duplikere en eksisterende pipeline på få sekunder. Den er perfekt til oprettelse af udviklingsversioner, test af variationer eller konfiguration af lignende arbejdsprocesser.

Skærmbillede, der viser Gem som i Fabric-pipelinen.

Du kan få flere oplysninger i følgende ressourcer: