Dela via


Självstudiekurs om Lakehouse: Mata in data i lakehouse

I den här självstudien matar du in fler dimensions- och faktatabeller från Wide World Importers (WWI) till lakehouse.

Förutsättningar

Mata in data

I det här avsnittet använder du aktiviteten Kopiera data i Data Factory-pipelinen för att mata in exempeldata från ett Azure-lagringskonto till avsnittet Filer i lakehouse som du skapade tidigare.

  1. Välj Arbetsytor i det vänstra navigeringsfönstret och välj sedan din nya arbetsyta på menyn Arbetsytor . Objektvyn för arbetsytan visas.

  2. Från menyalternativet +Nytt i menyfliksområdet för arbetsytan väljer du Datapipeline.

    Skärmbild som visar hur du skapar en ny datapipeline.

  3. I dialogrutan Ny pipeline anger du namnet som IngestDataFromSourceToLakehouse och väljer Skapa. En ny datafabrikspipeline skapas och öppnas.

  4. I din nyligen skapade datafabrikspipeline väljer du Pipeline-aktivitet för att lägga till en aktivitet i pipelinen och väljer Kopiera data. Den här åtgärden lägger till kopieringsdataaktivitet till pipelinearbetsytan.

    Skärmbild som visar var du väljer Pipeline-aktivitet och Kopiera data.

  5. Välj den nyligen tillagda kopieringsdataaktiviteten från arbetsytan. Aktivitetsegenskaper visas i ett fönster under arbetsytan (du kan behöva expandera fönstret uppåt genom att dra den övre kanten). På fliken Allmänt i egenskapsfönstret skriver du Datakopiering till Lakehouse i fältet Namn .

    Skärmbild som visar var kopieringsaktivitetens namn ska läggas till på fliken Allmänt.

  6. På fliken Källa för den valda kopieringsdataaktiviteten väljer du Extern som datalagertyp och väljer sedan + Ny för att skapa en ny anslutning till datakällan.

    Skärmbild som visar var du väljer Extern och + Ny på fliken Källa.

  7. I den här självstudien är alla exempeldata tillgängliga i en offentlig container med Azure Blob Storage. Du ansluter till den här containern för att kopiera data från den. På den första skärmen Ny anslutning väljer du Azure Blob Storage och sedan Fortsätt.

    Skärmbild av guiden Ny anslutning som visar var du väljer Azure Blob Storage.

  8. På skärmen Anslutningsinställningar anger du följande information och väljer Skapa för att skapa anslutningen till datakällan.

    Property Värde
    Kontonamn eller URL https://azuresynapsestorage.blob.core.windows.net/sampledata
    Connection Skapa en ny anslutning
    Anslutningens namn wwisampledata
    Typ av autentisering Anonym

    Skärmbild av skärmen Anslutningsinställningar som visar var du anger informationen och väljer Skapa.

  9. När den nya anslutningen har skapats går du tillbaka till fliken Källa för kopieringsdataaktiviteten och den nyligen skapade anslutningen är markerad som standard. Ange följande egenskaper innan du flyttar till målinställningarna.

    Property Värde
    Typ av datalager Externt
    Connection wwisampledata
    Filsökvägstyp Filsökväg
    Filsökväg Containernamn (första textrutan): sampledata
    Katalognamn (andra textrutan): WideWorldImportersDW/parquet
    Rekursivt Kontrollerad
    File format Binära

    Skärmbild av källfliken som visar var du kan ange den specifika informationen.

  10. Ange följande egenskaper på fliken Mål för den valda kopieringsdataaktiviteten:

    Property Värde
    Typ av datalager Arbetsyta
    Datalagertyp för arbetsyta Sjöhus
    Sjöhus wwilakehouse
    Rotmapp Filer
    Filsökväg Katalognamn (första textrutan): wwi-raw-data
    File format Binära

    Skärmbild av fliken Mål som visar var du anger specifik information.

  11. Du har konfigurerat kopieringsdataaktiviteten. Välj spara-ikonen i det övre menyfliksområdet (under Start) för att spara ändringarna och välj Kör för att köra pipelinen och dess aktivitet. Du kan också schemalägga pipelines för att uppdatera data med definierade intervall för att uppfylla dina affärskrav. I den här självstudien kör vi pipelinen bara en gång genom att välja Kör.

    Den här åtgärden utlöser datakopiering från den underliggande datakällan till det angivna sjöhuset och kan ta upp till en minut att slutföra. Du kan övervaka körningen av pipelinen och dess aktivitet under fliken Utdata , som visas när du klickar var som helst på arbetsytan. Du kan också välja glasögonikonen, som visas när du hovrar över namnet, för att titta på information om dataöverföringen.

    Skärmbild som visar var du väljer Spara och kör och var du hittar ikonen för körningsinformation och glasögon på fliken Utdata.

  12. När data har kopierats går du till objektvyn för arbetsytan och väljer ditt nya sjöhus (wwilakehouse) för att starta utforskarvyn.

    Skärmbild som visar var du väljer lakehouse för att starta Utforskarvyn.

  13. Kontrollera att en ny mapp wwi-raw-data visas i Utforskarvyn och att data för alla tabeller kopieras där.

    Skärmbild som visar att källdata kopieras till Lakehouse Explorer.

Information om hur du läser in inkrementella data i ett sjöhus finns i Inkrementellt läsa in data från ett informationslager till ett sjöhus.

Gå vidare