Freigeben über


Migrieren von Dataflow Gen1 zu Dataflow Gen2

Dieser Artikel richtet sich an Power BI-Datenflussersteller. Es bietet ihnen Anleitungen und Gründe für die Migration ihre Datenflüsse in Dataflow Gen2 innerhalb von Data Factory für Microsoft Fabric.

Hinweis

Dataflow Gen2 ist eine neue Generation von Dataflows, die neue Features und bessere Erfahrungen bietet. Gen2-Dataflows bestehen neben Power BI-Dataflows, die jetzt als Dataflow Gen1 bezeichnet werden.

Informationen zu den Unterschieden zwischen Dataflow Gen1 und Dataflow Gen2 finden Sie unter Von Dataflow Generation 1 zu Dataflow Generation 2.

Hintergrund

Microsoft Fabric hat sich zu einer integrierten Plattform für Self-Service- und IT-verwaltete Unternehmensdaten entwickelt. Angesichts des exponentiellen Wachstums bei Datenvolumen und Komplexität fordern Fabric-Kunden, dass ihre Unternehmenslösungen zu skalieren, sicher, einfach zu verwalten und für alle Benutzer in den größten Organisationen zugänglich sind.

In den letzten Jahren hat Microsoft große Schritte unternommen, um skalierbare Cloudfunktionen für Fabric-Kapazität bereitzustellen. Zu diesem Zweck ermöglicht Data Factory in Fabric sofort ein großes Ökosystem von Datenintegrationsentwicklern und Datenintegrationslösungen, die über Jahrzehnte aufgebaut wurden. Der Dienst nutzt die umfassenden Features und Funktionen, die weit über die vergleichbare Funktionalität früherer Generationen hinausgehen.

Natürlich fragen Kunden nun, ob es die Möglichkeit gibt, ihre Datenintegrationslösungen zu konsolidieren, indem sie sie in Fabric hosten. Sie stellen häufig Fragen wie:

  • Funktionieren alle Datenfluss-Funktionalitäten, von denen wir abhängig sind, in Dataflow Gen2?
  • Welche Funktionen sind nur in Dataflow Gen2 verfügbar?
  • Wie migrieren wir vorhandene Dataflows zu Dataflow Gen2?
  • Was ist die Roadmap von Microsoft für die Erfassung von Unternehmensdaten?

Antworten auf viele dieser Fragen werden in diesem Artikel gegeben.

Hinweis

Die Entscheidung für die Migration zur Fabric-Kapazität hängt von den Anforderungen der einzelnen Kunden ab. Die Kunden sollten die Vorteile sorgfältig auswerten, um eine fundierte Entscheidung zu treffen. Wir erwarten, dass die organische Migration zu Dataflow Gen2 im Laufe der Zeit erfolgt, und unsere Absicht ist, dass es zu Bedingungen geschieht, mit denen der Kunde vertraut ist.

Derzeit gibt es keine Pläne, Power BI-Datenflüsse oder Power Platform-Datenflüsse einzustellen. Allerdings wird vorrangig in Dataflow Gen2 für die Erfassung von Unternehmensdaten investiert, so dass der Wert der Fabric-Kapazität mit der Zeit steigen wird. Kunden, die sich für Fabric-Kapazität entscheiden, können von der Ausrichtung an die Microsoft Fabric-Produktroadmap profitieren.

Konvergenz der Self-Service- und Unternehmensdatenintegration

Die Konsolidierung von Elementen in Fabric vereinfacht die Ermittlung, Zusammenarbeit und Verwaltung durch das Zusammenführen von Ressourcen. Sie ermöglicht zentralen IT-Teams, beliebte Self-Service-Elemente einfacher zu übernehmen und zu integrieren. Gleichzeitig ermöglicht sie die Operationalisierung von unternehmenskritischen Datenbewegungen und Transformationsdiensten, die mit Unternehmensstandards übereinstimmen, einschließlich der Überwachung und Nachverfolgbarkeit von Daten.

Zur Unterstützung der Anforderungen von Erstellern an Zusammenarbeit und Skalierung führt Dataflow Gen2 in Fabric schnelles Kopieren ein, wodurch die effiziente Erfassung großer Datenvolumes mithilfe der Back-End-Infrastruktur von Fabric zum Speichern und Verarbeiten von Zwischendaten während der Transformation ermöglicht wird. Es kann Terabytes von Daten nahtlos verarbeiten. Dataflow-Ersteller können Datenziele für ihre transformierten Daten angeben, z. B. ein Fabric Lakehouse, ein Data Warehouse, ein Eventhouse oder eine Azure SQL-Datenbank, die eine bessere Datenverwaltung und Zugänglichkeit ermöglichen. Zudem verbessert die jüngste Integration von generativer KI durch Copilot die Datenaufbereitung, indem intelligente Codegenerierung und Automatisierung sich wiederholender Aufgaben bereitgestellt werden. Sie bietet einen einfacheren und schnelleren Weg zur Erstellung komplexer Lösungen.

Durch die Nutzung einer gemeinsamen Plattform wird der Workflow optimiert, was zu einer verbesserten Zusammenarbeit zwischen dem Unternehmen und der IT führt. Organisationen sind daher in der Lage, ihre Datenlösungen auf Unternehmensebenen zu skalieren, um hohe Leistung, Flexibilität und Effizienz bei der Verwaltung großer Datenmengen sicherzustellen.

Gewebekapazität

Dank der verteilten Architektur reagiert die Fabric-Kapazität weniger empfindlich für die Gesamtlast, zeitliche Belastungsspitzen und hohe Parallelität. Durch die Konsolidierung der Kapazitäten auf größere Fabric-Kapazitäts-SKUs können Kunden eine höhere Leistung und einen höheren Durchsatz erzielen.

Funktionsvergleiche

Die folgende Tabelle enthält Features, die in Power BI-Dataflow und/oder Fabric Dataflow Gen2 unterstützt werden.

Merkmal Power BI-Dataflow Gen1 Fabric Dataflow Gen2
Konnektivität
Unterstützung für alle Power Query-Datenquellen Ja Ja
Herstellen einer Verbindung mit und Laden von Daten aus Datenflüssen in Power BI Desktop, Excel oder Power Apps Ja Ja
DirectQuery über Datenflüsse, um eine direkte Verbindung mit einem Datenfluss herzustellen und den Datenimport in ein semantisches Modell zu umgehen Ja Nein 1
Skalierbarkeit
Schnelles Kopieren, das die Erfassung großer Datenmengen unterstützt, wobei die Copy-Aktivität der Datenpipeline in Dataflows verwendet wird Nein Ja
Geplante Aktualisierung, wodurch Daten aktuell bleiben Ja Ja
Inkrementelle Aktualisierung, die Richtlinien verwendet, um das inkrementelle Laden von Daten zu automatisieren. Sie kann dazu beitragen, in Quasi-Echtzeit Berichte zu liefern Ja Ja
Datenpipeline-Orchestrierung, mit der Sie einer Datenpipeline eine Dataflow-Aktivität hinzufügen und koordinierte bedingte Ereignisse erstellen können Nein Ja
Künstliche Intelligenz
Copilot für Data Factory, der intelligente Codegenerierung zum einfacheren Transformieren von Daten bietet und Codeerklärungen generiert, um komplexe Aufgaben verständlicher zu machen Nein Ja
Cognitive Services, die künstliche Intelligenz (AI) verwenden, um verschiedene Algorithmen von Azure Cognitive Services anzuwenden und so die Self-Service-Datenvorbereitung zu erweitern Ja Nein 2
Automatisiertes Maschinelles Lernen (AutoML), das es Geschäftsanalysten ermöglicht, Modelle direkt in Fabric zu trainieren, zu validieren und aufzurufen. Veraltet 3
Azure Machine Learning-Integration, die benutzerdefinierte Modelle als dynamische Power Query-Funktionen verfügbar macht, die Benutzer im Power Query-Editor aufrufen können Ja Nein 2
Content Management
Datenherkunftsansicht, die Benutzern hilft, Abhängigkeiten von Dataflowelementen zu verstehen und zu bewerten Ja Ja
Bereitstellungspipelines, die den Lebenszyklus von Fabric-Inhalten verwalten Ja Ja
Plattformskalierbarkeit und Resilienz
Premium-Kapazität-Architektur, die erhöhte Skalierung und Leistung unterstützt Ja Ja
Multi-Geo--Unterstützung, die multinationalen Kunden dabei hilft, regionale, branchenspezifische oder organisatorische Datenresidenzanforderungen zu erfüllen Ja 4 Ja
Sicherheit
VNet-Datengateway-Konnektivität, wodurch Fabric nahtlos im virtuellen Netzwerk einer Organisation arbeiten kann Nein Ja
Lokale Datengateway-Konnektivität, die den sicheren Zugriff auf Daten zwischen den lokalen Datenquellen einer Organisation und Fabric ermöglicht Ja Ja
Azure-Diensttags-Unterstützung, bei der es sich um eine definierte Gruppe von IP-Adressen handelt, die automatisch verwaltet wird, um die Komplexität von Updates oder Änderungen an Netzwerksicherheitsregeln zu minimieren Ja Ja
Governance
Endorsement von Inhalten, um wertvolle, hochwertige Fabric-Elemente zu fördern oder zu zertifizieren Ja Ja
Microsoft Purview-Integration, mit der Kunden Fabric-Elemente verwalten und steuern können Ja Ja
Vertraulichkeitsbezeichnungen von Microsoft Information Protection (MIP) und Integration in Microsoft Defender for Cloud Apps zur Verhinderung von Datenverlust Ja Ja
Überwachungs- und Diagnoseprotokollierung
Erweiterterer Aktualisierungsverlauf, mit dem Sie detailliert auswerten können, was während der Aktualisierung Ihres Dataflows passiert ist. Nein Ja
Überwachungs-Hub, der Überwachungsfunktionen für Fabric-Elemente bereitstellt Nein Ja
Microsoft Fabric-Kapazitätsmetriken-App, die Überwachungsfunktionen für die Fabric-Kapazität bereitstellt Ja Ja
Überwachungsprotokoll, das Benutzeraktivitäten in Fabric und Microsoft 365 nachverfolgt Ja Ja

1 Es wird empfohlen, Datenziele zu nutzen und eine direkte Verbindung mit den Ausgabetabellen herzustellen, siehe hier.

2 Informationen zum Erstellen von benutzerdefinierten Funktionen, die Azure AI-API-Endpunkte aufrufen, finden Sie unter Lernprogramm: Extrahieren von Schlüsselausdrücken aus Text, der in Power BIgespeichert ist.

3 Automated Machine Learning (AutoML) ist veraltet. Weitere Informationen finden Sie in dieser offiziellen Ankündigung.

4 Informationen zum Konfigurieren des Power BI-Datenspeichers für die Verwendung von Azure Data Lake Storage (ADLS) Gen2 finden Sie in diesem Artikel.

Überlegungen

Es gibt weitere Überlegungen, die Sie in Ihrer Planung berücksichtigen müssen, bevor Sie zu Dataflow Gen2 migrieren.

Lizenzierung

Sie benötigen eine Pro- oder Premium-Einzelbenutzerlizenz (PPU) zum Veröffentlichen oder Verwalten von Power BI-Datenflüssen (Dataflow Gen1). Im Gegensatz dazu benötigen Sie nur eine (Free)-Lizenz für Microsoft Fabric, um einen Dataflow Gen2 in einem Premium-Kapazitätsarbeitsbereich zu erstellen.

Migrationsszenarien

Wenn Sie Ihre Datenflüsse migrieren, ist es wichtig, über das einfache Kopieren vorhandener Lösungen hinaus zu denken. Stattdessen empfehlen wir, Ihre Lösungen zu modernisieren, indem die neuesten Innovationen und Funktionen von Dataflow Gen2 genutzt werden. Mit diesem Ansatz wird sichergestellt, dass Ihre Lösungen die wachsenden Anforderungen des Unternehmens unterstützen können.

Im Beitrag Migrationsszenarioswerden verschiedene Methoden zum Aktualisieren, Erfassen und Verwenden von Beschleunigern wie Power Query-Vorlagen beschrieben. Diese Methoden können helfen, ein nahtloses Upgrade für Ihre Projekte sicherzustellen.

Fahrplan

Der Microsoft Fabric-Releaseplan verkündet die neuesten Updates und Zeiten, während Funktionen für künftige Veröffentlichungen vorbereitet werden, einschließlich der Neuerungen für Data Factory in Microsoft Fabric.

Weitere Informationen zu diesem Beitrag finden Sie in den folgenden Ressourcen: