Freigeben über


Extrahieren von Änderungsdaten mithilfe der CDC-Quelle

Gilt für: SQL Server SSIS Integration Runtime in Azure Data Factory

Wichtig

CDC Flow-Komponenten, einschließlich CDC Control Task, CDC Source und CDC Splitter, sind veraltet. Weitere Details finden Sie in der Ankündigung.

Das Paket muss bereits mindestens einen Datenflusstask und einen CDC-Steuerungstask enthalten, damit Sie eine CDC-Quelle hinzufügen und konfigurieren können.

Weitere Informationen zum CDC-Steuerungstask finden Sie unter CDC Control Task.

Weitere Informationen zur CDC-Quelle finden Sie unter CDC Source.

So extrahieren Sie Änderungsdaten mithilfe einer CDC-Quelle

  1. Öffnen Sie in SQL Server Data Tools das SQL Server 2019 Integration Services (SSIS)-Projekt mit dem gewünschten Paket.

  2. Doppelklicken Sie im Projektmappen-Explorer auf das Paket, um es zu öffnen.

  3. Klicken Sie auf die Registerkarte Datenfluss , und ziehen Sie die CDC-Quelle dann aus der Toolboxauf die Entwurfsoberfläche.

  4. Doppelklicken Sie auf die CDC-Quelle.

  5. Wählen Sie im Dialogfeld Quellen-Editor für CDC auf der Seite Verbindungs-Manager in der Liste einen vorhandenen ADO.NET-Verbindungs-Manager aus, oder klicken Sie auf Neu , um eine neue Verbindung zu erstellen. Die Verbindung sollte zu einer SQL Server-Datenbank hergestellt werden, die die zu lesenden Änderungstabellen enthält.

  6. Wählen Sie die CDC-Tabelle aus, in der Sie Änderungen verarbeiten möchten.

  7. Wählen Sie den Namen der CDC-Aufzeichnungsinstanz mit der zu lesenden CDC-Tabelle aus, oder geben Sie ihn ein.

    Eine aufgezeichnete Quelltabelle kann über eine oder zwei aufgezeichnete Instanzen zum Behandeln des nahtlosen Übergangs der Tabellendefinition mithilfe von Schemaänderungen verfügen. Wenn mehr als eine Aufzeichnungsinstanz für die aufzuzeichnende Quelltabelle definiert wird, müssen Sie hier die gewünschte Aufzeichnungsinstanz auswählen. Der Standardname einer Aufzeichnungsinstanz für eine Tabelle [Schema].[Tabelle] lautet <Schema>_<Tabelle>. Die tatsächlich verwendeten Namen der Aufzeichnungsinstanzen können jedoch abweichen. Die tatsächliche Tabelle, aus der gelesen wird, ist die CDC-Tabelle cdc.<Aufzeichnungsinstanz>_CT.

  8. Wählen Sie den Verarbeitungsmodus aus, der sich für die Behandlung Ihrer Verarbeitungsanforderungen am besten eignet. Folgende Optionen sind möglich:

    • All: Gibt die Änderungen im aktuellen CDC-Bereich ohne Vor Update -Werte zurück.

    • All with old values: Gibt die Änderungen im aktuellen CDC-Verarbeitungsbereich unter Einbeziehung der alten Werte (Vor Update) zurück. Für jeden Updatevorgang gibt es zwei Zeilen, eine mit den Werten vor dem Update und eine mit den Werten nach dem Update.

    • Net: Gibt nur eine Änderungszeile pro Quellzeile zurück, die im aktuellen CDC-Verarbeitungsbereich geändert wurde. Wenn eine Quellzeile mehrmals aktualisiert wurde, wird die kombinierte Änderung erzeugt (Beispiel: Einfügen+Update wird als einzelner Updatevorgang und Update+Löschen als einzelner Löschvorgang erzeugt). Beim Arbeiten im Änderungsverarbeitungsmodus Net ist es möglich, die Änderungen auf Lösch-, Einfüge- und Updatevorgänge aufzuteilen und parallel zu behandeln, da die einzelne Quellzeile in mehr als einer Ausgabe vorhanden ist.

    • Net with update mask: Dieser Modus ähnelt dem normalen Net-Modus, aber es werden außerdem boolesche Spalten mit dem Namensmuster __$<Spaltenname>__Changed hinzugefügt, die auf geänderte Spalten in der aktuellen Änderungszeile hinweisen.

    • Net with merge: Dieser Modus ähnelt dem normalen Net-Modus, aber hierbei sind Einfüge- und Updatevorgänge zu einem einzelnen Mergevorgang (UPSERT) zusammengeführt.

  9. Wählen Sie die SSIS-Zeichenfolgenpaketvariable aus, in der der CDC-Status für den aktuellen CDC-Kontext verwaltet wird. Weitere Informationen zur CDC-Statusvariablen finden Sie unter Definieren einer Statusvariablen.

  10. Aktivieren Sie das Kontrollkästchen reprocessing-Indikatorspalte einschließen , um eine spezielle Ausgabespalte mit dem Namen __$reprocessingzu erstellen. Diese Spalte hat den Wert TRUE , wenn sich der CDC-Verarbeitungsbereich mit dem ursprünglichen Verarbeitungsbereich überschneidet (der LSN-Bereich, der dem Zeitraum des erstmaligen Ladens entspricht) oder wenn ein CDC-Verarbeitungsbereich nach einem Fehler bei einer vorherigen Ausführung erneut verarbeitet wird. In dieser Indikatorspalte können SSIS-Entwickler Fehler unterschiedlich behandeln, wenn sie Änderungen erneut verarbeiten (z. B. können Aktionen, wie das Löschen einer nicht vorhandenen Zeile und ein fehlgeschlagener Einfügevorgang aufgrund eines doppelten Schlüssels, ignoriert werden).

    Weitere Informationen finden Sie unter CDC Source Custom Properties.

  11. Um die Zuordnung zwischen externen Spalten und Ausgabespalten zu aktualisieren, klicken Sie auf Spalten und wählen in der Liste Externe Spalte verschiedene Spalten aus.

  12. Aktualisieren Sie optional die Werte der Ausgabespalten, indem Sie Werte in der Liste Ausgabespalte löschen.

  13. Klicken Sie auf Fehlerausgabe, um die Fehlerausgabe zu konfigurieren.

  14. Sie können auf Vorschau klicken, um bis zu 200 Datenzeilen anzuzeigen, die von der CDC-Quelle extrahiert werden.

  15. Klicken Sie auf OK.

Weitere Informationen

Quellen-Editor für CDC (Seite Verbindungs-Manager)
Quellen-Editor für CDC (Seite Spalten)
Quellen-Editor für CDC (Seite Fehlerausgabe)