Gegevensstromen Gen2 en pijplijnen integreren in Microsoft Fabric

Voltooid

Gegevensstromen Gen2 bieden een uitstekende optie voor gegevenstransformaties in Microsoft Fabric. De combinatie van gegevensstromen en pijplijnen is handig wanneer u extra bewerkingen moet uitvoeren op de getransformeerde gegevens.

Gegevenspijplijnen worden eenvoudig gemaakt in de Data Factory en Data-engineer het uitvoeren van workloads. Pijplijnen zijn een gemeenschappelijk concept in data engineering en bieden een breed scala aan activiteiten die u kunt organiseren. Enkele veelvoorkomende activiteiten zijn:

  • Gegevens kopiĆ«ren
  • Gegevensstroom opnemen
  • Notitieblok toevoegen
  • Metagegevens ophalen
  • Een script of opgeslagen procedure uitvoeren

Screenshot of the data pipelines activities ribbon

Pijplijnen bieden een visuele manier om activiteiten in een specifieke volgorde te voltooien. U kunt een gegevensstroom gebruiken voor gegevensopname en -transformatie en landing naar een Lakehouse met behulp van gegevensstromen. Neem vervolgens de gegevensstroom op in een pijplijn om extra activiteiten te organiseren, zoals scripts of opgeslagen procedures uitvoeren nadat de gegevensstroom is voltooid.

Screenshot of the pipeline editor with how to add a Dataflow Gen2 activity with an existing dataflow.