Delen via


Gegevens opnemen in Azure Data Lake Storage Gen2

In dit artikel leert u hoe u gegevens opneemt van de ene locatie naar de andere in een Azure Data Lake Gen 2-opslagaccount (Azure Data Lake Gen 2) met behulp van Azure Synapse Analytics.

Vereiste voorwaarden

  • Azure-abonnement: Als u geen Azure-abonnement hebt, maakt u een gratis Azure-account voordat u begint.
  • Azure Storage-account: u gebruikt Azure Data Lake Gen 2 als brongegevensarchief . Als u geen opslagaccount hebt, raadpleegt u Een Azure Storage-account maken voor stappen om er een te maken.

Gekoppelde services maken

In Azure Synapse Analytics definieert u de verbindingsgegevens voor andere services in een gekoppelde service. In deze sectie voegt u Azure Synapse Analytics en Azure Data Lake Gen 2 toe als gekoppelde services.

  1. Open de UX van Azure Synapse Analytics en ga naar het tabblad Beheren .
  2. Selecteer Gekoppelde services onder Externe verbindingen.
  3. Selecteer Nieuw om een gekoppelde service toe te voegen.
  4. Selecteer de tegel Azure Data Lake Storage Gen2 in de lijst en selecteer Doorgaan.
  5. Voer uw verificatiereferenties in. Accountsleutel, service-principal en beheerde identiteit zijn momenteel ondersteunde verificatiemethoden. Selecteer de testverbinding om te controleren of uw referenties juist zijn.
  6. Selecteer Maken nadat dit is voltooid.

Pijplijn maken

Een pijplijn bevat de logische stroom voor het uitvoeren van een reeks activiteiten. In deze sectie maakt u een pijplijn met een kopieeractiviteit waarmee gegevens uit Azure Data Lake Gen 2 worden opgenomen in een toegewezen SQL-pool.

  1. Ga naar het tabblad Orchestrate . Selecteer het pluspictogram naast de pijplijnheader en selecteer Pijplijn.
  2. Sleep onder Verplaatsen en transformeren in het deelvenster Activiteiten gegevens kopiëren naar het pijplijncanvas.
  3. Selecteer de kopieeractiviteit en ga naar het tabblad Bron . Selecteer Nieuw om een nieuwe brongegevensset te maken.
  4. Selecteer Azure Data Lake Storage Gen2 als uw gegevensarchief en selecteer Doorgaan.
  5. Selecteer DelimitedText als uw indeling en selecteer Doorgaan.
  6. Selecteer in het deelvenster Eigenschappen instellen de gekoppelde ADLS-service die u hebt gemaakt. Geef het bestandspad van de brongegevens op en geef op of de eerste rij een koptekst heeft. U kunt het schema importeren uit het bestandsarchief of een voorbeeldbestand. Wanneer u klaar bent, selecteert u OK.
  7. Ga naar het tabblad Sink . Selecteer Nieuw om een nieuwe sinkgegevensset te maken.
  8. Selecteer Azure Data Lake Storage Gen2 als uw gegevensarchief en selecteer Doorgaan.
  9. Selecteer DelimitedText als uw indeling en selecteer Doorgaan.
  10. Selecteer in het deelvenster Eigenschappen instellen de gekoppelde ADLS-service die u hebt gemaakt. Geef het pad op van de map waarin u gegevens wilt schrijven. Wanneer u klaar bent, selecteert u OK.

Fouten opsporen en pijplijn publiceren

Zodra u klaar bent met het configureren van uw pijplijn, kunt u een foutopsporingsuitvoering uitvoeren voordat u uw artefacten publiceert om te controleren of alles juist is.

  1. Selecteer Fouten opsporen om fouten op te sporen in de pijplijn. De status van de pijplijnuitvoering wordt weergegeven op het tabblad Uitvoer onder in het venster.
  2. Zodra de pijplijn succesvol kan worden uitgevoerd, selecteert u Alles publiceren in de bovenste werkbalk. Met deze actie worden entiteiten (gegevenssets en pijplijnen) gepubliceerd die u hebt gemaakt in de Synapse Analytics-service.
  3. Wacht totdat het bericht Successfully published wordt weergegeven. Als u meldingsberichten wilt zien, selecteert u de belknop rechtsboven.

De pijplijn activeren en bewaken

In deze stap activeert u handmatig de pijplijn die in de vorige stap is gepubliceerd.

  1. Selecteer op de werkbalk de optie Trigger toevoegen en selecteer vervolgens Nu activeren. Selecteer Voltooien op de pagina Pijplijnuitvoering.
  2. Ga naar het tabblad Monitor in de linkerzijbalk. U ziet een pijplijn die wordt geactiveerd door een handmatige trigger. U kunt via de links in de kolom Acties details van de activiteiten bekijken en de pijplijn opnieuw uitvoeren.
  3. Als u activiteitsuitvoeringen wilt zien die zijn gekoppeld aan de pijplijnuitvoering, selecteert u de koppeling Uitvoeringen van activiteit weergeven in de kolom Acties . In dit voorbeeld is er slechts één activiteit, dus u ziet slechts één vermelding in de lijst. Selecteer de koppeling Details (brilpictogram) in de kolom Acties voor meer informatie over de kopieerbewerking. Selecteer Pijplijnuitvoeringen bovenaan om terug te gaan naar de weergave Pijplijnuitvoeringen. Selecteer Vernieuwen om de weergave te vernieuwen.
  4. Controleer of uw gegevens correct zijn geschreven in de toegewezen SQL-pool.

Volgende stappen

Zie het artikel Gegevens opnemen in een toegewezen SQL-pool voor meer informatie over gegevensintegratie voor Azure Synapse Analytics.