Dataflödesmappning i Azure Data Factory

GÄLLER FÖR: Azure Data Factory Azure Synapse Analytics

Dricks

Prova Data Factory i Microsoft Fabric, en allt-i-ett-analyslösning för företag. Microsoft Fabric omfattar allt från dataflytt till datavetenskap, realtidsanalys, business intelligence och rapportering. Lär dig hur du startar en ny utvärderingsversion kostnadsfritt!

Vad är Mappa dataflöden?

Mappning av dataflöden är visuellt utformade datatransformeringar i Azure Data Factory. Med dataflöden kan datatekniker utveckla datatransformeringslogik utan att skriva kod. De resulterande dataflödena körs som aktiviteter i Azure Data Factory-pipelines som använder utskalade Apache Spark-kluster. Dataflödesaktiviteter kan operationaliseras med hjälp av befintliga funktioner för schemaläggning, kontroll, flöde och övervakning i Azure Data Factory.

Mappning av dataflöden ger en helt visuell upplevelse utan att kodning krävs. Dina dataflöden körs i ADF-hanterade körningskluster för utskalad databearbetning. Azure Data Factory hanterar all kodöversättning, sökvägsoptimering och körning av dina dataflödesjobb.

Komma igång

Dataflöden skapas från fönstret fabriksresurser, till exempel pipelines och datauppsättningar. Om du vill skapa ett dataflöde väljer du plustecknet bredvid Fabriksresurser och väljer sedan Dataflöde.

Screenshot showing a new data flow. Den här åtgärden tar dig till dataflödesarbetsytan, där du kan skapa din omvandlingslogik. Välj Lägg till källa för att börja konfigurera källtransformeringen. Mer information finns i Källtransformering.

Redigera dataflöden

Mappning av dataflöde har en unik redigeringsarbetsyta som är utformad för att göra det enkelt att skapa transformeringslogik. Dataflödesarbetsytan är uppdelad i tre delar: det övre fältet, diagrammet och konfigurationspanelen.

Screenshot shows the data flow canvas with top bar, graph, and configuration panel labeled.

Diagram

Diagrammet visar transformeringsströmmen. Den visar ursprunget för källdata när de flödar till en eller flera mottagare. Om du vill lägga till en ny källa väljer du Lägg till källa. Om du vill lägga till en ny transformering väljer du plustecknet längst ned till höger i en befintlig transformering. Läs mer om hur du hanterar dataflödesdiagrammet.

Screenshot shows the graph part of the canvas with a Search text box.

Konfigurationspanel

Konfigurationspanelen visar de inställningar som är specifika för den aktuella transformeringen. Om ingen transformering har valts visas dataflödet. I den övergripande dataflödeskonfigurationen kan du lägga till parametrar via fliken Parametrar . Mer information finns i Mappa dataflödesparametrar.

Varje transformering innehåller minst fyra konfigurationsflikar.

Transformeringsinställningar

Den första fliken i konfigurationsfönstret för varje transformering innehåller de inställningar som är specifika för omvandlingen. Mer information finns på dokumentationssidan för omvandlingen.

Screenshot showing the source settings tab.

Optimera

Fliken Optimera innehåller inställningar för att konfigurera partitioneringsscheman. Mer information om hur du optimerar dina dataflöden finns i prestandaguiden för dataflödesmappning.

Screenshot shows the Optimize tab, which includes Partition option, Partition type, and Number of partitions.

Undersöka

Fliken Inspektera visar metadata för dataströmmen som du transformerar. Du kan se kolumnantal, ändrade kolumner, tillagda kolumner, datatyper, kolumnordning och kolumnreferenser. Granska är en skrivskyddad vy över dina metadata. Du behöver inte ha felsökningsläget aktiverat för att se metadata i fönstret Inspektera .

Inspect

När du ändrar formen på dina data genom transformeringar visas flödet för metadataändringar i fönstret Inspektera . Om det inte finns något definierat schema i källtransformeringen visas inte metadata i fönstret Inspektera . Brist på metadata är vanligt i scenarier med schemaavvikelser.

Förhandsgranskning av data

Om felsökningsläget är aktiverat ger fliken Förhandsgranskning av data en interaktiv ögonblicksbild av data vid varje transformering. Mer information finns i Dataförhandsgranskning i felsökningsläge.

Övre stapel

Det övre fältet innehåller åtgärder som påverkar hela dataflödet, till exempel sparande och validering. Du kan också visa den underliggande JSON-koden och dataflödesskriptet för din omvandlingslogik. Mer information finns i avsnittet om dataflödesskriptet.

Tillgängliga transformeringar

Visa översikten över transformering av dataflödesmappning för att hämta en lista över tillgängliga transformeringar.

Dataflödesdatatyper

  • matris
  • binary
  • boolean
  • Komplexa
  • decimal (inkluderar precision)
  • datum
  • flyttal
  • integer
  • lång
  • map
  • short
  • sträng
  • timestamp

Dataflödesaktivitet

Mappning av dataflöden operationaliseras i ADF-pipelines med hjälp av dataflödesaktiviteten. Allt en användare behöver göra är att ange vilken integrationskörning som ska användas och skicka in parametervärden. Mer information finns i Azure Integration Runtime.

Felsökningsläge

Med felsökningsläget kan du interaktivt se resultatet av varje transformeringssteg medan du skapar och felsöker dina dataflöden. Felsökningssessionen kan användas både i när du skapar dataflödeslogik och kör pipeline-felsökningskörningar med dataflödesaktiviteter. Mer information finns i dokumentationen för felsökningsläge.

Övervaka dataflöden

Dataflödesmappning integreras med befintliga Azure Data Factory-funktioner för övervakning. Information om hur du förstår dataflödesövervakningsutdata finns i övervaka mappning av dataflöden.

Azure Data Factory-teamet har skapat en prestandajusteringsguide som hjälper dig att optimera körningstiden för dina dataflöden när du har skapat din affärslogik.

Tillgängliga regioner

Mappning av dataflöden är tillgängliga i följande regioner i ADF:

Azure-region Dataflöden i ADF
Australien, centrala
Australien, centrala 2
Australien, östra
Sydöstra Australien
Brasilien, södra
Kanada, centrala
Indien, centrala
Centrala USA
Kina, östra
Östra Kina 2
Kina, icke-regionalt
Kina, norra
Norra Kina 2
Norra Kina 3
Asien, östra
USA, östra
USA, östra 2
Centrala Frankrike
Södra Frankrike
Tyskland, centrala
Tyskland, regionsoberoende (nationellt)
Tyskland, norra (offentligt)
Tyskland, nordöstra (nationellt)
Tyskland, västra centrala (offentligt)
Japan, östra
Västra Japan
Sydkorea, centrala
Sydkorea, södra
USA, norra centrala
Europa, norra
Norge, östra
Norge, västra
Sydafrika, norra
Sydafrika, västra
USA, södra centrala
Indien, södra
Sydostasien
Schweiz, norra
Schweiz, västra
Förenade Arabemiraten, centrala
Förenade Arabemiraten, norra
Södra Storbritannien
Västra Storbritannien
US DoD, centrala
US DoD, östra
US Gov, Arizona
US Gov, regionsoberoende
US Gov, Texas
US Gov, Virginia
USA, västra centrala
Europa, västra
Västra Indien
Västra USA
Västra USA 2
Västra USA 3