Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Dataflow Gen2 biedt nu ondersteuning voor continue integratie/continue implementatie (CI/CD) en Git-integratie. Met deze functie kunt u gegevensstromen maken, bewerken en beheren in een Git-opslagplaats die is verbonden met uw infrastructuurwerkruimte. Daarnaast kunt u de functie implementatiepijplijnen gebruiken om de implementatie van gegevensstromen vanuit uw werkruimte naar andere werkruimten te automatiseren. In dit artikel wordt dieper ingegaan op het gebruik van Dataflow Gen2 met CI/CD en Git-integratie in Fabric Data Factory.
Nieuwe functies
Met Dataflow Gen2 (CI/CD) kunt u nu:
- Gebruik Git-integratieondersteuning voor Dataflow Gen2.
- Gebruik de functie implementatiepijplijnen om de implementatie van gegevensstromen van uw werkruimte naar andere werkruimten te automatiseren.
- Gebruik de Fabric-instellingen en planner om instellingen voor Dataflow Gen2 te vernieuwen en te bewerken.
- Maak uw Dataflow Gen2 rechtstreeks in een map binnen de werkruimte.
- Gebruik openbare API's (preview) om Dataflow Gen2 te maken en beheren met CI/CD- en Git-integratie.
Vereiste voorwaarden
Om aan de slag te gaan, moet u aan de volgende vereisten voldoen:
- Een Microsoft Fabric-tenantaccount met een actief abonnement hebben. Maak gratis een account.
- Zorg ervoor dat u een werkruimte met Microsoft Fabric hebt ingeschakeld.
- Als u wilt profiteren van Git-integratie, moet u ervoor zorgen dat deze is ingeschakeld voor uw werkruimte. Ga naar Aan de slag met Git-integratie voor meer informatie over het inschakelen van Git-integratie.
Een Dataflow Gen2 maken met CI/CD- en Git-ondersteuning
Volg deze stappen om een Dataflow Gen2 met CI/CD- en Git-ondersteuning te maken:
Selecteer in de werkruimte Fabric de optie Nieuw item maken en selecteer vervolgens Dataflow Gen2.
Geef uw gegevensstroom een naam en schakel de Git-integratie in. Selecteer vervolgens Maken.
De gegevensstroom wordt aangemaakt en u wordt omgeleid naar het canvas voor het ontwerpen van de gegevensstroom. U kunt nu beginnen met het maken van uw gegevensstroom.
Wanneer u klaar bent met het ontwikkelen van uw gegevensstroom, selecteert u Opslaan en uitvoeren.
Nadat u de gegevensstroom hebt gepubliceerd, heeft deze de status niet-gecommit.
Als u de gegevensstroom wilt doorvoeren naar de Git-opslagplaats, selecteert u het bronbeheerpictogram in de rechterbovenhoek van de werkruimteweergave.
Selecteer alle wijzigingen die u wilt doorvoeren en selecteer Doorvoeren.
U hebt nu een Dataflow Gen2 met CI/CD- en Git-ondersteuning. We raden u aan de beste praktijken te volgen voor het werken met CI/CD en Git-integratie in Fabric, zoals beschreven in de zelfstudie Scenario 2 - Ontwikkelen met behulp van een andere werkruimte.
Een Gegevensstroom Gen2 vernieuwen of een vernieuwing plannen
U kunt een Dataflow Gen2 op twee manieren vernieuwen met CI/CD en Git-ondersteuning, handmatig of door een vernieuwing te plannen. In de volgende secties wordt beschreven hoe u een Gegevensstroom Gen2 vernieuwt met CI/CD- en Git-ondersteuning.
Nu vernieuwen
Selecteer in de werkruimte voor fabric de ellipsis-icoon voor meer opties naast de gegevensstroom die u wilt vernieuwen.
Selecteer nu vernieuwen.
Een verversing plannen
Als uw gegevensstroom regelmatig moet worden vernieuwd, kunt u de vernieuwing plannen met behulp van de Fabric-planner.
Selecteer in de werkruimte Fabric het beletselteken voor meer opties naast de gegevensstroom die u wilt vernieuwen.
Selecteer Schema.
Op de planningspagina kunt u de vernieuwingsfrequentie en de begin- en eindtijd instellen, waarna u wijzigingen kunt toepassen.
Als u de vernieuwing nu wilt starten, selecteert u de knop Vernieuwen .
Geschiedenis en instellingen vernieuwen
Als u de vernieuwingsgeschiedenis van de gegevensstroom wilt weergeven, kunt u het tabblad Recente uitvoeringen selecteren in de vervolgkeuzelijst of naar de monitorhub gaan en de gegevensstroom selecteren waarvan u de vernieuwingsgeschiedenis wilt bekijken.
Instellingen voor Gegevensstroom Gen2 met CI/CD
Toegang tot de instellingen van de nieuwe Dataflow Gen2 met CI/CD- en Git-ondersteuning is vergelijkbaar met elk ander Fabric-item. U kunt de instellingen openen door het beletselteken voor meer opties naast de gegevensstroom te selecteren en de instellingen te selecteren.
Opslaan vervangt de publicatiebewerking
Met Dataflow Gen2 met CI/CD- en Git-ondersteuning vervangt de opslagbewerking de publicatiebewerking. Deze wijziging betekent dat wanneer u uw gegevensstroom opslaat, de wijzigingen automatisch worden gepubliceerd in de gegevensstroom.
De opslagbewerking overschrijft rechtstreeks de gegevensstroom in de werkruimte. Als u de wijzigingen wilt negeren, kunt u dit doen door Wijzigingen negeren te selecteren wanneer u de editor sluit.
Validatie
Tijdens de opslagbewerking controleren we ook of de gegevensstroom een geldige status heeft. Als de gegevensstroom niet geldig is, wordt er een foutbericht weergegeven in de vervolgkeuzelijst in de werkruimteweergave. We bepalen de geldigheid van de gegevensstroom door een evaluatie van nul rijen uit te voeren voor alle query's in de gegevensstroom.
Deze evaluatie betekent dat we alle query's in de gegevensstroom uitvoeren op een manier die alleen het schema van het queryresultaat aanvraagt, zonder rijen te retourneren. Als een query-evaluatie mislukt of het schema van een query niet binnen tien minuten kan worden bepaald, mislukken de validatie en gebruiken we de eerder opgeslagen versie van de gegevensstroom voor vernieuwingen.
Beperkingen en bekende problemen
Hoewel Dataflow Gen2 met CI/CD- en Git-ondersteuning een krachtige set functies biedt voor samenwerking die gereed is voor ondernemingen, moesten we de back-end opnieuw bouwen naar de infrastructuurarchitectuur. Dit betekent dat sommige functies nog niet beschikbaar zijn of beperkingen hebben. We werken actief aan het verbeteren van de ervaring en werken dit artikel bij naarmate er nieuwe functies worden toegevoegd.
- Wanneer u de laatste dataflow Gen2 verwijdert met CI/CD- en Git-ondersteuning, worden de faseringsartefacten zichtbaar in de werkruimte en kunnen ze veilig door de gebruiker worden verwijderd.
- De werkruimteweergave laat niet zien of er een vernieuwing gaande is voor de gegevensstroom.
- Wanneer u overschakelt naar een andere werkruimte, kan een Dataflow Gen2-vernieuwing mislukken met het bericht dat de staging-lakehouse niet kan worden gevonden. Als dit gebeurt, maakt u een nieuwe Dataflow Gen2 met CI/CD- en Git-ondersteuning in de werkruimte om de creatie van de staging lakehouse te starten. Daarna moeten alle andere gegevensstromen in de werkruimte weer functioneren.
- Wanneer u wijzigingen vanuit GIT synchroniseert in de werkruimte of implementatiepijplijnen gebruikt, moet u de nieuwe of bijgewerkte gegevensstroom openen en wijzigingen handmatig opslaan met de editor. Hiermee wordt een publicatieactie op de achtergrond geactiveerd, zodat de wijzigingen kunnen worden gebruikt tijdens het vernieuwen van uw gegevensstroom. U kunt ook de on-demand publicatie-API-aanroep van Dataflow gebruiken om de publicatiebewerking te automatiseren.
- Power Automate-connector voor gegevensstromen werkt niet met de nieuwe Dataflow Gen2 met CI/CD- en Git-ondersteuning.