Freigeben über


Synchronisieren Sie Ihre Excel-Datenquelle mit Dataverse unter Verwendung eines Dataflows

Eines der häufigsten Szenarien, die bei der Integration von Daten in Dataverse auftreten, ist die Synchronisierung der Daten mit der Quelle. Mit Hilfe des Standard-Dataflows können Sie Daten in Dataverse laden. Dieser Artikel erklärt, wie Sie die Daten mit dem Quellsystem synchronisieren können.

Die Bedeutung der Schlüsselspalte

Wenn Sie ein relationales Datenbanksystem als Quelle verwenden, haben Sie normalerweise Schlüsselspalten in den Tabellen, und die Daten haben ein geeignetes Format, um in Dataverse geladen zu werden. Allerdings sind die Daten aus den Excel-Dateien nicht immer so sauber. Sie haben oft eine Excel-Datei mit Datenblättern, die keine Schlüsselspalte enthalten. Unter Field Mapping Considerations for Standard Dataflows können Sie sehen, dass eine Schlüsselspalte in der Quelle leicht als alternativer Schlüssel in der Feldzuordnung des Dataflows verwendet werden kann.

Alternative Schlüsselkonfigurationen.

Eine Schlüsselspalte ist wichtig für die Tabelle in Dataverse. Die Schlüsselspalte ist der Zeilenbezeichner; diese Spalte enthält eindeutige Werte in jeder Zeile. Eine Schlüsselspalte hilft, doppelte Zeilen zu vermeiden, und sie hilft auch bei der Synchronisierung der Daten mit dem Quellsystem. Wenn eine Zeile aus dem Quellsystem entfernt wird, ist es hilfreich, eine Schlüsselspalte zu haben, um sie zu finden und sie auch aus Dataverse zu entfernen.

Erstellen einer Schlüsselspalte

Wenn Sie keine Schlüsselspalte in Ihrer Datenquelle (Excel, Textdatei oder andere Quellen) haben, können Sie eine mit der folgenden Methode erzeugen:

  1. Bereinigen Sie Ihre Daten.

    Der erste Schritt zur Erstellung der Schlüsselspalte besteht darin, alle überflüssigen Zeilen zu entfernen, die Daten zu bereinigen, leere Zeilen zu entfernen und alle möglichen Duplikate zu entfernen.

    Daten zu bereinigen.

  2. Fügen Sie eine Indexspalte hinzu.

    Nachdem die Daten bereinigt wurden, wird ihnen im nächsten Schritt eine Schlüsselspalte zugewiesen. Zu diesem Zweck können Sie Add Index Column von der Registerkarte Add Column verwenden.

    Indexspalte hinzufügen.

Wenn Sie die Indexspalte hinzufügen, haben Sie einige Optionen, um sie anzupassen, z. B. Anpassungen an der Startnummer oder der Anzahl der Werte, die jedes Mal gesprungen werden. Der Standard-Startwert ist Null, und er erhöht sich jedes Mal um einen Wert.

Verwenden Sie die Schlüsselspalte als alternativen Schlüssel

Da Sie nun die Schlüsselspalte(n) haben, können Sie die Feldzuordnung des Dataflows dem alternativen Schlüssel zuweisen.

Festlegen der Felder für alternative Schlüssel.

Die Einstellung ist einfach, Sie müssen nur den alternativen Schlüssel einstellen. Wenn Sie jedoch mehrere Dateien oder Tabellen haben, ist ein weiterer Schritt zu beachten.

Wenn Sie mehrere Dateien haben

Wenn Sie nur eine Excel-Datei (oder ein Blatt oder eine Tabelle) haben, reichen die Schritte des vorherigen Verfahrens aus, um den alternativen Schlüssel festzulegen. Wenn Sie jedoch mehrere Dateien (oder Blätter oder Tabellen) mit der gleichen Struktur (aber mit unterschiedlichen Daten) haben, können Sie diese aneinander anhängen.

Wenn Sie Daten aus mehreren Excel-Dateien abrufen, fügt die Option Combine Files von Power Query automatisch alle Daten zusammen, und Ihre Ausgabe sieht wie die folgende Abbildung aus.

Abbildung mit mehreren Dateien, die zusammen angefügt wurden.

Wie in der vorhergehenden Abbildung zu sehen ist, zeigt Power Query neben dem Anfügeergebnis auch die Spalte Source.Name an, die den Dateinamen enthält. Der Indexwert in jeder Datei mag eindeutig sein, aber er ist nicht über mehrere Dateien hinweg eindeutig. Die Kombination aus der Spalte „Index“ und der Spalte „Source.Name“ ist jedoch eine eindeutige Kombination. Wählen Sie einen zusammengesetzten alternativen Schlüssel für dieses Szenario.

Zusammengesetzter Schlüssel.

Zeilen löschen, die in der Abfrageausgabe nicht mehr vorhanden sind

Der letzte Schritt ist die Auswahl der Zeilen löschen, die nicht mehr in der Abfrageausgabe vorhanden sind. Diese Option vergleicht die Daten in der Dataverse-Tabelle mit den aus der Quelle stammenden Daten auf der Grundlage des Alternativschlüssels (der ein zusammengesetzter Schlüssel sein kann) und entfernt die Zeilen, die nicht mehr existieren. Dadurch werden Ihre Daten in Dataverse immer mit Ihrer Datenquelle synchronisiert.

Zeilen löschen gibt es nicht mehr.