Delen via


Gegevens opnemen in uw warehouse met behulp van gegevenspijplijnen

Van toepassing op: Warehouse in Microsoft Fabric

Gegevenspijplijnen bieden een alternatief voor het gebruik van de opdracht COPY via een grafische gebruikersinterface. Een gegevenspijplijn is een logische groepering van activiteiten die samen een gegevensopnametaak uitvoeren. Met pijplijnen kunt u ETL-activiteiten (extract, transform and load) beheren in plaats van elk afzonderlijk te beheren.

In deze zelfstudie maakt u een nieuwe pijplijn waarmee voorbeeldgegevens in een magazijn in Microsoft Fabric worden geladen.

Notitie

Sommige functies van Azure Data Factory zijn niet beschikbaar in Microsoft Fabric, maar de concepten zijn uitwisselbaar. Meer informatie over Azure Data Factory en pijplijnen in pijplijnen en activiteiten in Azure Data Factory en Azure Synapse Analytics. Ga voor een quickstart naar Quickstart: Uw eerste pijplijn maken om gegevens te kopiëren.

Een gegevenspijplijn maken

  1. Als u een nieuwe pijplijn wilt maken, gaat u naar uw werkruimte, selecteert u de knop +Nieuw en selecteert u Gegevenspijplijn. Schermopname van het bovenste gedeelte van de werkruimte van de gebruiker met de knop Nieuw en met de opties Warehouse, Data Pipeline en Show All.

  2. Geef in het dialoogvenster Nieuwe pijplijn een naam op voor de nieuwe pijplijn en selecteer Maken.

  3. U komt terecht in het canvasgebied van de pijplijn, waar u drie opties ziet om aan de slag te gaan: Een pijplijnactiviteit toevoegen, gegevens kopiëren en een taak kiezen die u wilt starten.

    Schermopname van de drie opties die moeten worden geselecteerd voor het starten van opname.

    Elk van deze opties biedt verschillende alternatieven voor het maken van een pijplijn:

    • Pijplijnactiviteit toevoegen: met deze optie wordt de pijplijneditor gestart, waar u nieuwe pijplijnen helemaal zelf kunt maken met behulp van pijplijnactiviteiten.
    • Gegevens kopiëren: met deze optie wordt een stapsgewijze assistent gestart waarmee u een gegevensbron, een bestemming en opties voor het laden van gegevens, zoals de kolomtoewijzingen, kunt selecteren. Na voltooiing wordt er een nieuwe pijplijnactiviteit gemaakt met een kopieergegevenstaak die al voor u is geconfigureerd.
    • Kies een taak die u wilt starten: met deze optie wordt een set vooraf gedefinieerde sjablonen gestart om u te helpen aan de slag te gaan met pijplijnen op basis van verschillende scenario's.

    Kies de optie Gegevens kopiëren om de assistent Kopiëren te starten.

  4. Op de eerste pagina van de assistent Gegevens kopiëren kunt u uw eigen gegevens uit verschillende gegevensbronnen kiezen of een van de opgegeven voorbeelden selecteren om aan de slag te gaan. Voor deze zelfstudie gebruiken we het COVID-19 Data Lake-voorbeeld . Selecteer deze optie en selecteer Volgende.

    Schermopname van keuzes voor het gebruik van voorbeeldgegevens of andere gegevensbronnen.

  5. Op de volgende pagina kunt u een gegevensset, de bronbestandsindeling selecteren en een voorbeeld van de geselecteerde gegevensset bekijken. Selecteer Bing COVID-19, de CSV-indeling en selecteer Volgende.

    Schermopname met verschillende opties voor gegevenssets voor het COVID-19-voorbeeld, bestandsindelingen en een raster met een voorbeeld van de gegevens.

  6. Op de volgende pagina, Gegevensbestemmingen, kunt u het type van de doelwerkruimte configureren. We laden gegevens in een magazijn in onze werkruimte, dus selecteer het tabblad Magazijn en de optie Datawarehouse . Selecteer Volgende.

    Schermopname met verschillende doelopties.

  7. Nu is het tijd om het magazijn te kiezen om gegevens in te laden. Selecteer uw gewenste magazijn in de vervolgkeuzelijst en selecteer Volgende.

    Schermopname van een vervolgkeuzelijst met een magazijn geselecteerd.

  8. De laatste stap voor het configureren van de bestemming is het opgeven van een naam voor de doeltabel en het configureren van de kolomtoewijzingen. Hier kunt u ervoor kiezen om de gegevens in een nieuwe tabel of in een bestaande tabel te laden, een schema- en tabelnamen op te geven, kolomnamen te wijzigen, kolommen te verwijderen of de toewijzingen te wijzigen. U kunt de standaardinstellingen accepteren of de instellingen aanpassen aan uw voorkeur.

    Schermopname van de opties voor het laden van gegevens in een bestaande tabel of het maken van een nieuwe tabel.

    Wanneer u klaar bent met het controleren van de opties, selecteert u Volgende.

  9. Op de volgende pagina kunt u fasering gebruiken of geavanceerde opties opgeven voor de bewerking voor het kopiëren van gegevens (die gebruikmaakt van de T-SQL COPY-opdracht). Controleer de opties zonder deze te wijzigen en selecteer Volgende.

  10. De laatste pagina in de assistent biedt een overzicht van de kopieeractiviteit. Selecteer de optie Gegevensoverdracht direct starten en selecteer Opslaan en uitvoeren.

    Schermopname van de optie om de bewerking voor gegevensoverdracht onmiddellijk te starten en de knoppen Terug en Opslaan + Uitvoeren.

  11. U wordt omgeleid naar het canvasgebied van de pijplijn, waar al een nieuwe kopieergegevensactiviteit voor u is geconfigureerd. De pijplijn wordt automatisch uitgevoerd. U kunt de status van uw pijplijn controleren in het deelvenster Uitvoer :

    Schermopname van het pijplijncanvas met een Copy-activiteit in het midden en de uitvoeringsstatus van de pijplijn met de huidige status wordt uitgevoerd.

  12. Na een paar seconden is uw pijplijn voltooid. Als u terug naar uw magazijn navigeert, kunt u uw tabel selecteren om een voorbeeld van de gegevens te bekijken en te bevestigen dat de kopieerbewerking is voltooid.

    Schermopname van een magazijn met de bing_covid_19 tabel geselecteerd en een raster met een voorbeeld van de gegevens in de tabel.

Voor meer informatie over gegevensopname in uw warehouse in Microsoft Fabric gaat u naar:

Volgende stap