Delen via


Ondersteuning voor dataflow Gen2 met CI/CD- en Git-integratie

Dataflow Gen2 biedt nu ondersteuning voor continue integratie/continue implementatie (CI/CD) en Git-integratie. Met deze functie kunt u gegevensstromen maken, bewerken en beheren in een Git-opslagplaats die is verbonden met uw infrastructuurwerkruimte. Daarnaast kunt u de functie implementatiepijplijnen gebruiken om de implementatie van gegevensstromen vanuit uw werkruimte naar andere werkruimten te automatiseren. In dit artikel wordt dieper ingegaan op het gebruik van Dataflow Gen2 met CI/CD en Git-integratie in Fabric Data Factory.

Nieuwe functies

Met Dataflow Gen2 (CI/CD) kunt u nu:

  • Gebruik Git-integratieondersteuning voor Dataflow Gen2.
  • Gebruik de functie implementatiepijplijnen om de implementatie van gegevensstromen van uw werkruimte naar andere werkruimten te automatiseren.
  • Gebruik de Fabric-instellingen en planner om instellingen voor Dataflow Gen2 te vernieuwen en te bewerken.
  • Maak uw Dataflow Gen2 rechtstreeks in een map binnen de werkruimte.
  • Gebruik openbare API's (preview) om Dataflow Gen2 te maken en beheren met CI/CD- en Git-integratie.

Vereiste voorwaarden

Om aan de slag te gaan, moet u aan de volgende vereisten voldoen:

Een Dataflow Gen2 maken met CI/CD- en Git-ondersteuning

Volg deze stappen om een Dataflow Gen2 met CI/CD- en Git-ondersteuning te maken:

  1. Selecteer in de werkruimte Fabric de optie Nieuw item maken en selecteer vervolgens Dataflow Gen2.

    Schermopname van het venster Nieuw item met het item Dataflow Gen2 benadrukt.

  2. Geef uw gegevensstroom een naam en schakel de Git-integratie in. Selecteer vervolgens Maken.

    Schermopname van het venster New Dataflow Gen2 met de gegevensstroomnaamset en Git-integratie benadrukt en geselecteerd.

    De gegevensstroom wordt aangemaakt en u wordt omgeleid naar het canvas voor het ontwerpen van de gegevensstroom. U kunt nu beginnen met het maken van uw gegevensstroom.

  3. Wanneer u klaar bent met het ontwikkelen van uw gegevensstroom, selecteert u Opslaan en uitvoeren.

  4. Nadat u de gegevensstroom hebt gepubliceerd, heeft deze de status niet-gecommit.

    Schermopname van de opgeslagen Dataflow Gen2 met de status die wordt weergegeven als niet-verzonden.

  5. Als u de gegevensstroom wilt doorvoeren naar de Git-opslagplaats, selecteert u het bronbeheerpictogram in de rechterbovenhoek van de werkruimteweergave.

    Schermopname van de knop Broncodebeheer.

  6. Selecteer alle wijzigingen die u wilt doorvoeren en selecteer Doorvoeren.

    Schermopname van het bronbeheer-venster met de geselecteerde gegevensstroom en de Commit-knop benadrukt.

U hebt nu een Dataflow Gen2 met CI/CD- en Git-ondersteuning. We raden u aan de beste praktijken te volgen voor het werken met CI/CD en Git-integratie in Fabric, zoals beschreven in de zelfstudie Scenario 2 - Ontwikkelen met behulp van een andere werkruimte.

Een Gegevensstroom Gen2 vernieuwen of een vernieuwing plannen

U kunt een Dataflow Gen2 op twee manieren vernieuwen met CI/CD en Git-ondersteuning, handmatig of door een vernieuwing te plannen. In de volgende secties wordt beschreven hoe u een Gegevensstroom Gen2 vernieuwt met CI/CD- en Git-ondersteuning.

Nu vernieuwen

  1. Selecteer in de werkruimte voor fabric de ellipsis-icoon voor meer opties naast de gegevensstroom die u wilt vernieuwen.

  2. Selecteer nu vernieuwen.

    Schermopname van het vervolgkeuzemenu 'Meer opties' met de optie 'Nu vernieuwen' benadrukt.

Een verversing plannen

Als uw gegevensstroom regelmatig moet worden vernieuwd, kunt u de vernieuwing plannen met behulp van de Fabric-planner.

  1. Selecteer in de werkruimte Fabric het beletselteken voor meer opties naast de gegevensstroom die u wilt vernieuwen.

  2. Selecteer Schema.

    Schermopname van het vervolgkeuzemenu 'Meer opties', waarbij de optie 'Schema' benadrukt is.

  3. Op de planningspagina kunt u de vernieuwingsfrequentie en de begin- en eindtijd instellen, waarna u wijzigingen kunt toepassen.

    Schermopname van het instellingenscherm van de gegevensstroom met het tabblad Planning geselecteerd en de knop Vernieuwen benadrukt.

  4. Als u de vernieuwing nu wilt starten, selecteert u de knop Vernieuwen .

Geschiedenis en instellingen vernieuwen

Als u de vernieuwingsgeschiedenis van de gegevensstroom wilt weergeven, kunt u het tabblad Recente uitvoeringen selecteren in de vervolgkeuzelijst of naar de monitorhub gaan en de gegevensstroom selecteren waarvan u de vernieuwingsgeschiedenis wilt bekijken.

Instellingen voor Gegevensstroom Gen2 met CI/CD

Toegang tot de instellingen van de nieuwe Dataflow Gen2 met CI/CD- en Git-ondersteuning is vergelijkbaar met elk ander Fabric-item. U kunt de instellingen openen door het beletselteken voor meer opties naast de gegevensstroom te selecteren en de instellingen te selecteren.

Opslaan vervangt de publicatiebewerking

Met Dataflow Gen2 met CI/CD- en Git-ondersteuning vervangt de opslagbewerking de publicatiebewerking. Deze wijziging betekent dat wanneer u uw gegevensstroom opslaat, de wijzigingen automatisch worden gepubliceerd in de gegevensstroom.

De opslagbewerking overschrijft rechtstreeks de gegevensstroom in de werkruimte. Als u de wijzigingen wilt negeren, kunt u dit doen door Wijzigingen negeren te selecteren wanneer u de editor sluit.

Validatie

Tijdens de opslagbewerking controleren we ook of de gegevensstroom een geldige status heeft. Als de gegevensstroom niet geldig is, wordt er een foutbericht weergegeven in de vervolgkeuzelijst in de werkruimteweergave. We bepalen de geldigheid van de gegevensstroom door een evaluatie van nul rijen uit te voeren voor alle query's in de gegevensstroom.

Deze evaluatie betekent dat we alle query's in de gegevensstroom uitvoeren op een manier die alleen het schema van het queryresultaat aanvraagt, zonder rijen te retourneren. Als een query-evaluatie mislukt of het schema van een query niet binnen tien minuten kan worden bepaald, mislukken de validatie en gebruiken we de eerder opgeslagen versie van de gegevensstroom voor vernieuwingen.

Beperkingen en bekende problemen

Hoewel Dataflow Gen2 met CI/CD- en Git-ondersteuning een krachtige set functies biedt voor samenwerking die gereed is voor ondernemingen, moesten we de back-end opnieuw bouwen naar de infrastructuurarchitectuur. Dit betekent dat sommige functies nog niet beschikbaar zijn of beperkingen hebben. We werken actief aan het verbeteren van de ervaring en werken dit artikel bij naarmate er nieuwe functies worden toegevoegd.

  • Wanneer u de laatste dataflow Gen2 verwijdert met CI/CD- en Git-ondersteuning, worden de faseringsartefacten zichtbaar in de werkruimte en kunnen ze veilig door de gebruiker worden verwijderd.
  • De werkruimteweergave laat niet zien of er een vernieuwing gaande is voor de gegevensstroom.
  • Wanneer u overschakelt naar een andere werkruimte, kan een Dataflow Gen2-vernieuwing mislukken met het bericht dat de staging-lakehouse niet kan worden gevonden. Als dit gebeurt, maakt u een nieuwe Dataflow Gen2 met CI/CD- en Git-ondersteuning in de werkruimte om de creatie van de staging lakehouse te starten. Daarna moeten alle andere gegevensstromen in de werkruimte weer functioneren.
  • Wanneer u wijzigingen vanuit GIT synchroniseert in de werkruimte of implementatiepijplijnen gebruikt, moet u de nieuwe of bijgewerkte gegevensstroom openen en wijzigingen handmatig opslaan met de editor. Hiermee wordt een publicatieactie op de achtergrond geactiveerd, zodat de wijzigingen kunnen worden gebruikt tijdens het vernieuwen van uw gegevensstroom. U kunt ook de on-demand publicatie-API-aanroep van Dataflow gebruiken om de publicatiebewerking te automatiseren.
  • Power Automate-connector voor gegevensstromen werkt niet met de nieuwe Dataflow Gen2 met CI/CD- en Git-ondersteuning.