Kom igång med Azure Data Factory

GÄLLER FÖR: Azure Data Factory Azure Synapse Analytics

Tips

Data Factory i Microsoft Fabric är nästa generations Azure Data Factory, med en enklare arkitektur, inbyggd AI och nya funktioner. Om dataintegrering är nytt för dig börjar du med Fabric Data Factory. Befintliga ADF-arbetsbelastningar kan uppgraderas till Fabric för att få åtkomst till nya funktioner inom datavetenskap, realtidsanalys och rapportering.

Välkommen till Azure Data Factory! Den här artikeln hjälper dig att skapa din första datafabrik och pipeline på fem minuter.

Den Azure Resource Manager mallen (ARM-mall) i den här artikeln skapar och konfigurerar allt du behöver. Sedan kan du gå till din demodatafabrik och utlösa pipelinen, som flyttar exempeldata från en Azure Blob Storage mapp till en annan.

Förutsättningar

Om du inte har någon Azure prenumeration skapar du ett free-konto innan du börjar.

Videosammanfattning

Följande video innehåller en genomgång av exemplet i den här artikeln:

Steg 1: Använd demonstrationen för att skapa resurser

I det här demoscenariot använder du copy-aktiviteten i en datafabrik för att kopiera en blob med namnet moviesDB2.csv från en indatamapp i Azure Blob Storage till en utdatamapp. I ett verkligt användningsscenario kan kopieringen vara mellan de många stödda datakällor och mottagare som finns i tjänsten. Det kan också omfatta transformeringar i data.

  1. Välj följande knapp.

    Prova din första datatillverkningsdemo

    Om du väljer knappen skapas följande Azure resurser:

    • Ett Azure Data Factory konto
    • En datafabrik som innehåller en pipeline med en kopieringsaktivitet
    • Ett Azure Blob Storage-konto med moviesDB2.csv uppladdat i en indata-mapp som källmapp
    • En länkad tjänst för att ansluta datafabriken till Blob Storage
  2. Du dirigeras till konfigurationssidan för att distribuera mallen. På den här sidan:

    1. För Resursgrupp väljer du Skapa ny för att skapa en resursgrupp. Du kan lämna alla andra värden med deras standardvärden.

    2. Välj Granska + skapa och välj sedan Skapa för att distribuera resurserna.

    Skärmbild av sidan för att distribuera en mall för att skapa resurser.

Note

Användaren som distribuerar mallen måste tilldela en roll till en hanterad identitet. Det här steget kräver behörigheter som kan beviljas via rollen Ägare, Administratör för användaråtkomst eller Hanterad identitetsoperator.

Alla resurser i denna demo skapas i den nya resursgruppen, så att du enkelt kan rensa dem senare.

Steg 2: Granska distribuerade resurser

  1. I meddelandet som visar att distributionen har slutförts väljer du Gå till resursgrupp.

    Screenshot av Azure-portalsidan som visar en lyckad distribution av demomallen.

  2. Resursgruppen innehåller den nya datafabriken, Blob Storage-konto och den hanterade identitet som distributionen skapade. Välj datafabriken i resursgruppen för att visa den.

    Skärmbild av innehållet i resursgruppen som skapades för demonstrationen, med datafabriken markerad.

  3. Välj knappen Launch studio.

    Screenshot i Azure-portalen med information om den nyligen skapade datafabriken med knappen för att öppna Azure Data Factory Studio markerad.

  4. I Azure Data Factory Studio:

    1. Välj fliken Författare.Author tab
    2. Välj den pipeline som mallen skapade.
    3. Kontrollera källdata genom att välja Open.

    Screenshot i Azure Data Factory Studio som visar pipelinen som skapats av template.

  5. I källdatasettet, välj Bläddra för att visa den indatafil som skapats för demonstrationen.

    Skärmdump av datamängdskällan, med knappen

    Observera filen moviesDB2.csv, som redan har laddats upp i inmatningsmappen.

    Skärmbild av innehållet i indatamappen som visar indatafilen som användes i demonstrationen.

Steg 3: Utlös demopipelinen för körning

  1. Välj Lägg till trigger, och välj sedan Trigga nu.

    Skärmdump av knappen för att starta demo-pipelinen.

  2. På den högra panelen, under Pipeline körning, välj OK.

Övervaka arbetsflödet

  1. Välj fliken ÖvervakaMonitor tab. Den här fliken ger en översikt över dina pipeline-körningar, inklusive starttid och status.

    Skärmdump av fliken för övervakning av pipelines körningar i en datafabrik.

  2. I den här snabbstarten har pipelinen bara en aktivitetstyp: Kopiera data. Välj pipelinens namn för att visa detaljerna för kopieringsaktivitetens körresultat.

    Skärmdump av körresultaten för en kopieringsaktivitet på fliken för övervakning av en datafabrik.

  3. Välj ikonen Detaljer för att visa den detaljerade kopieringsprocessen. I resultaten är Data läst och Data skrivet storlekar lika, och en fil lästes och skrevs. Denna information bevisar att all data kopierades framgångsrikt till destinationen.

    Skärmbild av detaljerade körningsresultat för en kopieringsaktivitet.

Rensa resurser

Du kan städa upp alla resurser som du skapade i den här artikeln på två olika sätt:

  • Du kan ta bort hela Azure resursgruppen, som innehåller alla resurser som skapats i den.

  • Om du vill behålla vissa resurser intakta går du till resursgruppen och tar bara bort de specifika resurser som du vill ta bort.

    Om du till exempel använder den här mallen för att skapa en datafabrik för användning i en annan självstudie kan du ta bort de andra resurserna men bara behålla datafabriken.

I denna artikel skapade du en datafabrik som innehåller en datarörledning med en kopieringsaktivitet. Om du vill veta mer om Azure Data Factory fortsätter du till följande artikel och träningsmodul: