Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Diese Seite hilft Ihnen, den SQL Server-Erfassungsworkflow zu verstehen, einschließlich der Faktoren, die Ihren Einrichtungsansatz und die Schritte für verschiedene Benutzerpersonas bestimmen.
Standard CDC im Vergleich zum integrierten CDC
SQL Server unterstützt zwei Aufnahmearchitekturen. Die folgende Tabelle vergleicht sie:
| Funktion | Standard-CDC (gatewaybasiert) | Integriertes CDC (Beta) |
|---|---|---|
| Anzahl der Pipelines | Zwei (Erfassungsgateway und Erfassungspipeline) | Eine (einheitliche Pipeline) |
| Konfiguration | Erstellen Sie ein Gateway, und erstellen Sie dann eine Aufnahmepipeline, die auf die Gateway-ID verweist. | Erstellen einer einzelnen Pipeline, die auf eine Unity-Katalogverbindung verweist |
| Gateway-Modus | Das Gateway läuft kontinuierlich. | Die Pipeline bettet die Extraktion in jedes Update ein. |
| Verbindungsreferenz | ingestion_gateway_id |
connection_name (eine Unity-Katalogverbindung) |
| Konnektortyp | Implicit (Implizit) | Explizit: connector_type: CDC |
| Bereitstellungsvolume | Das Gateway verwaltet das Staging-Volume intern. | Sie konfigurieren das Stagingvolume über data_staging_options. Die Pipeline erstellt automatisch eines, wenn keines angegeben ist. |
Die gleiche Quelldatenbankkonfiguration gilt für beide Architekturen. Siehe Microsoft SQL Server für die Aufnahme in Azure Databricks konfigurieren. Weitere Informationen finden Sie unter Erstellen einer integrierten CDC-Pipeline für SQL Server.
Verfügbarkeit von Funktionen
| Funktion | Availability |
|---|---|
| Benutzeroberflächenbasierte Pipelineerstellung |
|
| API-basierte Pipeline-Erstellung |
|
| Deklarative Automatisierungspakete |
|
| Inkrementelle Erfassung |
|
| Unity Catalog Governance |
|
| Orchestrierung mit Lakeflow Jobs |
|
| SCD Typ 2 |
|
| API-basierte Spaltenauswahl und -abwahl |
|
| API-basierte Zeilenfilterung |
|
| Automatisierte Schemaentwicklung: Neue und gelöschte Spalten |
|
| Automatisierte Schemaentwicklung: Datentypänderungen |
|
| Automatische Schemaentwicklung: Spaltenumbenennungen |
Erfordert eine vollständige Aktualisierung. |
| Automatisierte Schemaentwicklung: Neue Tabellen |
Wenn Sie das gesamte Schema aufnehmen. Sehen Sie sich die Einschränkungen für die Anzahl der Tabellen pro Pipeline an. |
| Maximale Anzahl von Tabellen pro Pipeline | 250 |
Authentifizierungsmethoden
| Authentifizierungsmethode | Availability |
|---|---|
| OAuth U2M |
|
| OAuth M2M |
|
| OAuth (manuelles Aktualisierungstoken) |
|
| Standardauthentifizierung (Benutzername/Kennwort) |
|
| Standardauthentifizierung (API-Schlüssel) |
|
| Standardauthentifizierung (JSON-Schlüssel des Dienstkontos) |
|
Was Sie wissen müssen, bevor Sie beginnen
| Thema | Warum das wichtig ist |
|---|---|
| Azure Databricks-Benutzerpersona | Der Workflow hängt von Ihrer Azure Databricks-Benutzerpersona ab:
|
| Datenbankvariation | Die Quelldatenbankkonfiguration hängt von der SQL Server-Bereitstellungsumgebung ab. |
| Änderungsnachverfolgungsmethode | Die Quelldatenbankkonfiguration hängt davon ab, wie Sie Änderungen in der Quelle nachverfolgen möchten. |
| Authentifizierungsmethode | Die Schritte zum Erstellen einer Verbindung hängen von der gewählten Authentifizierungsmethode ab. |
| Interface | Die Schritte zum Erstellen einer Verbindung, eines Gateways und einer Pipeline hängen von der Schnittstelle ab. |
| Aufnahmehäufigkeit | Der Pipelinezeitplan hängt von Ihren Latenz- und Kostenanforderungen ab. |
| Allgemeine Muster | Abhängig von Ihren Anforderungen für die Datenaufnahme könnte die Pipeline Konfigurationseinstellungen wie Verlaufsverfolgung, Spaltenauswahl und Zeilenfilterung nutzen. Unterstützte Konfigurationen variieren je nach Connector. Weitere Informationen finden Sie unter Featureverfügbarkeit. |
Datenaufnahme aus SQL Server starten
Die folgende Tabelle enthält eine Übersicht über den End-to-End SQL Server-Erfassungsworkflow basierend auf dem Benutzertyp:
| Benutzer | Steps |
|---|---|
| Administrator |
|
| Nicht-Administrator | Verwenden Sie jede unterstützte Schnittstelle, um ein Gateway und eine Pipeline zu erstellen. Siehe "Aufnehmen von Daten aus SQL Server". |