Delen via


Gegevens verplaatsen van Azure SQL DB naar Lakehouse via een gegevenspijplijn

In deze zelfstudie bouwt u een gegevenspijplijn om gegevens in Azure SQL Database te verplaatsen naar Lakehouse. In deze ervaring ziet u een korte demo over het gebruik van activiteit voor het kopiëren van gegevenspijplijnen en het laden van gegevens in Lakehouse.

Vereisten

Om aan de slag te gaan, moet u aan de volgende vereisten voldoen:

  • Een Microsoft Fabric-tenantaccount met een actief abonnement. Gratis een account maken
  • Zorg ervoor dat u een werkruimte met Microsoft Fabric hebt: Maak een werkruimte.

Een gegevenspijplijn maken

  1. Navigeer naar Power BI.

  2. Selecteer het Power BI-pictogram in de linkerbenedenhoek van het scherm en selecteer vervolgens Data factory om de startpagina van Data Factory te openen.

  3. Navigeer naar uw Microsoft Fabric-werkruimte. Als u een nieuwe werkruimte hebt gemaakt in de vorige sectie Vereisten, gebruikt u deze.

    Schermopname van het werkruimtevenster waar u naar uw werkruimte navigeert.

  4. Selecteer Gegevenspijplijn en voer vervolgens een pijplijnnaam in om een nieuwe pijplijn te maken.

    Schermopname van de knop Nieuwe gegevenspijplijn in de zojuist gemaakte werkruimte.

    Schermopname van de naam van het maken van een nieuwe pijplijn.

Gegevens kopiëren met behulp van een gegevenspijplijn

In deze sessie begint u met het bouwen van uw gegevenspijplijn door de onderstaande stappen te volgen voor het kopiëren van gegevens van Azure SQL Database naar Lakehouse.

Een kopieeractiviteit toevoegen

  1. Open een bestaande gegevenspijplijn of maak een nieuwe gegevenspijplijn.

  2. Voeg een kopieeractiviteit toe door pijplijnactiviteit toevoegen te selecteren Copy-activiteit>

    Schermopname van twee manieren om een kopieeractiviteit toe te voegen.

Uw bron configureren op het tabblad Bron

  1. Selecteer + Nieuw naast de verbinding om een verbinding met uw gegevensbron te maken.

    Schermopname die laat zien waar u Nieuw moet selecteren.

    1. Kies het gegevensbrontype in het pop-upvenster. U gebruikt Azure SQL Database als voorbeeld. Selecteer Azure SQL Database en vervolgens Doorgaan.

      Schermopname die laat zien hoe u de gegevensbron selecteert.

    2. Hiermee gaat u naar de pagina voor het maken van de verbinding. Vul de vereiste verbindingsgegevens in het deelvenster in en selecteer Vervolgens Maken. Raadpleeg elk connectorartikel voor meer informatie over het maken van een verbinding voor elk type gegevensbron.

      Schermopname van de pagina Nieuwe verbinding.

    3. Zodra de verbinding is gemaakt, gaat u terug naar de gegevenspijplijnpagina. Selecteer Vervolgens Vernieuwen om de verbinding op te halen die u hebt gemaakt in de vervolgkeuzelijst. U kunt ook rechtstreeks in de vervolgkeuzelijst een bestaande Azure SQL Database-verbinding kiezen als u deze al hebt gemaakt. De mogelijkheden van Verbinding testen en Bewerken zijn beschikbaar voor elke geselecteerde verbinding. Selecteer vervolgens Azure SQL Database in verbindingstype .

      Schermopname die laat zien waar u de verbinding kunt vernieuwen.

  2. Geef een tabel op die moet worden gekopieerd. Selecteer Voorbeeldgegevens om een voorbeeld van uw brontabel te bekijken. U kunt ook de query- en opgeslagen procedure gebruiken om gegevens uit uw bron te lezen.

    Schermopname met opties voor brontabelinstellingen.

  3. Vouw Geavanceerd uit voor meer geavanceerde instellingen.

    Schermopname van geavanceerde instellingen.

Uw bestemming configureren op het doeltabblad

  1. Kies uw doeltype. Dit kan uw interne eersteklas gegevensarchief zijn vanuit uw werkruimte, zoals Lakehouse of uw externe gegevensarchieven. U gebruikt Lakehouse als voorbeeld.

    Schermopname die laat zien waar het doeltype moet worden geselecteerd.

  2. Kies ervoor om Lakehouse te gebruiken in het gegevensarchieftype Werkruimte. Selecteer + Nieuw en hiermee gaat u naar de pagina voor het maken van Lakehouse. Geef uw Lakehouse-naam op en selecteer Vervolgens Maken.

    Schermopname van het maken van Lakehouse.

  3. Zodra de verbinding is gemaakt, gaat u terug naar de gegevenspijplijnpagina. Selecteer Vervolgens Vernieuwen om de verbinding op te halen die u hebt gemaakt in de vervolgkeuzelijst. U kunt ook een bestaande Lakehouse-verbinding in de vervolgkeuzelijst rechtstreeks kiezen als u deze al eerder hebt gemaakt.

    Schermopname van het selecteren van verbinding.

  4. Geef een tabel op of stel het bestandspad in om het bestand of de map als doel te definiëren. Selecteer hier Tabellen en geef een tabel op om gegevens te schrijven.

    Schermopname die laat zien waar u tabelinstellingen kunt vinden.

  5. Vouw Geavanceerd uit voor meer geavanceerde instellingen.

    Schermopname van geavanceerde opties.

U kunt nu uw gegevenspijplijn opslaan met deze enkele kopieeractiviteit of doorgaan met het ontwerpen van uw gegevenspijplijn.

Uw gegevenspijplijn uitvoeren en plannen

Nadat u de configuratie van uw gegevenspijplijn hebt voltooid, voert u de gegevenspijplijn uit om de kopieeractiviteit te activeren. U kunt de uitvoering van uw gegevenspijplijn ook zo nodig plannen.

  1. Ga naar het tabblad Start en selecteer Uitvoeren. Er wordt een bevestigingsvenster weergegeven. Selecteer Vervolgens Opslaan en uitvoeren om de activiteit te starten.

    Schermopname van het opslaan en uitvoeren van activiteit.

  2. U kunt het actieve proces controleren en de resultaten controleren op het tabblad Uitvoer onder het canvas van de gegevenspijplijn. Selecteer de knop details van de uitvoering (met het brilpictogram gemarkeerd) om de details van de uitvoering weer te geven.

    Schermopname van de uitvoer van de gegevenspijplijn.

  3. De uitvoeringsdetails laten zien hoeveel gegevens zijn gelezen en geschreven en verschillende andere details over de uitvoering.

    Schermopname van de details van de kopieeractiviteit.

  4. U kunt ook plannen dat de gegevenspijplijn wordt uitgevoerd met een specifieke frequentie, indien nodig. Hieronder ziet u een voorbeeld van het plannen van de gegevenspijplijn om de 15 minuten uit te voeren. U kunt ook de begin- en eindtijd voor uw planning opgeven. Als u geen begintijd opgeeft, is de begintijd de tijd waarop uw planning van toepassing is. Als u geen eindtijd opgeeft, blijft de uitvoering van uw gegevenspijplijn elke 15 minuten terugkeren.

    Schermopname van het plannen van de gegevenspijplijn.