Dela via


Vad är Data Factory i Microsoft Fabric?

Data Factory ger dig en modern dataintegreringsupplevelse för att mata in, förbereda och transformera data från en omfattande uppsättning datakällor (till exempel databaser, informationslager, Lakehouse, realtidsdata med mera). Oavsett om du är medborgare eller professionell utvecklare kommer du att kunna transformera data med intelligenta omvandlingar och utnyttja en omfattande uppsättning aktiviteter. Vi kan skapa pipelines för att köra en eller flera aktiviteter, komma åt datakällor eller tjänster via länkade tjänster, och när vi har skapat en pipeline kan vi lägga till utlösare för att automatiskt köra våra processer vid specifika tidpunkter eller som svar på föränderliga scenarier. Med Data Factory i Microsoft Fabric ger vi funktioner för snabb kopiering (dataförflyttning) till både dataflöden och datapipelines. Med Snabb kopiering kan du flytta data mellan dina favoritdatalager snabbt. Det viktigaste är att snabbkopiering gör att du kan hämta data till Lakehouse och Data Warehouse i Microsoft Fabric för analys.

Det finns två primära funktioner på hög nivå som Data Factory implementerar: dataflöden och pipelines.

  • Med dataflöden kan du använda mer än 300 transformeringar i dataflödesdesignern, så att du kan transformera data enklare och med större flexibilitet än något annat verktyg , inklusive smarta AI-baserade datatransformeringar.
  • Med datapipelines kan du utnyttja de avancerade funktionerna för dataorkestrering för att skapa flexibla dataarbetsflöden som uppfyller företagets behov.

Dataflöden

Dataflöden ger ett lågkodsgränssnitt för att mata in data från hundratals datakällor och transformera dina data med hjälp av över 300 datatransformeringar. Du kan sedan läsa in resulterande data till flera mål, till exempel Azure SQL-databaser med mera. Dataflöden kan köras upprepade gånger med manuell eller schemalagd uppdatering, eller som en del av en datapipelineorkestrering.

Dataflöden skapas med den välbekanta Power Query-upplevelsen som är tillgänglig i dag i flera Microsoft-produkter och -tjänster som Excel, Power BI, Power Platform, Dynamics 365 Insights-program med mera. Power Query ger alla användare, från medborgare till professionella dataintegrerare, möjlighet att utföra datainmatning och datatransformeringar i sin dataegendom. Utför kopplingar, aggregeringar, datarensning, anpassade transformeringar och mycket mer från ett lättanvänt, visuellt användargränssnitt med låg kod.

Skärmbild av Power BI-användargränssnittet som visar dataflödesupplevelsen.

Datapipelines

Datapipelines möjliggör kraftfulla arbetsflödesfunktioner i molnskala. Med datapipelines kan du skapa komplexa arbetsflöden som kan uppdatera ditt dataflöde, flytta PB-storleksdata och definiera avancerade kontrollflödespipelines.

Använd datapipelines för att skapa komplexa ETL- och datafabriksarbetsflöden som kan utföra många olika uppgifter i stor skala. Kontrollflödesfunktioner är inbyggda i datapipelines som gör att du kan skapa arbetsflödeslogik som tillhandahåller loopar och villkor.

Lägg till en konfigurationsdriven kopieringsaktivitet tillsammans med din dataflödesuppdatering med låg kod i en enda pipeline för en ETL-datapipeline från slutpunkt till slutpunkt. Du kan till och med lägga till kod första aktiviteter för Spark Notebooks, SQL-skript, lagrade procs med mera.

Skärmbild av användargränssnittet som visar kopieringsaktivitet.

Kom igång med Microsoft Fabric genom att gå till Snabbstart: Skapa ditt första Dataflöde Gen2 för att hämta och transformera data.