GitHub-Konnektor

Important

Dieses Feature befindet sich in der Betaversion. Arbeitsbereichsadministratoren können den Zugriff auf dieses Feature über die Vorschauseite steuern. Siehe Manage Azure Databricks Previews.

Mit dem verwalteten GitHub Connector in Lakeflow Connect können Sie Daten von GitHub in Azure Databricks aufnehmen.

Verfügbarkeit von Funktionen

Funktion Availability
Benutzeroberflächenbasierte Pipelineerstellung Unterstützt
API-basierte Pipeline-Erstellung Unterstützt
Deklarative Automatisierungspakete Unterstützt
Inkrementelle Erfassung Teilweise unterstützt
Einige Tabellen unterstützen die inkrementelle Aufnahme. Für andere Tabellen ist eine vollständige Aktualisierung erforderlich. Siehe unterstützte Daten.
Unity Catalog Governance Unterstützt
Lakeflow-Aufträge Unterstützt
SCD Typ 2 Unterstützt
Spaltenauswahl und -abwahl Unterstützt
API-basierte Zeilenfilterung x mark no Nicht unterstützt
Automatisierte Schemaentwicklung: Neue und gelöschte Spalten x mark no Nicht unterstützt
Automatisierte Schemaentwicklung: Datentypänderungen x mark no Nicht unterstützt
Automatische Schemaentwicklung: Spaltenumbenennungen x mark no Nicht unterstützt
Automatisierte Schemaentwicklung: Neue Tabellen x mark no Nicht unterstützt

Authentifizierungsmethoden

Authentifizierungsmethode Availability
OAuth U2M Unterstützt
OAuth M2M x mark no Nicht unterstützt
OAuth (manuelles Aktualisierungstoken) x mark no Nicht unterstützt
Standardauthentifizierung (Benutzername/Kennwort) x mark no Nicht unterstützt
Standardauthentifizierung (API-Schlüssel) x mark no Nicht unterstützt
Standardauthentifizierung (JSON-Schlüssel des Dienstkontos) x mark no Nicht unterstützt

Was Sie wissen müssen, bevor Sie beginnen

Thema Warum dies wichtig ist
Azure Databricks-Benutzerpersona Der Workflow hängt von Ihrer Azure Databricks-Benutzerpersona ab:
  • Einzelbenutzer: Ein Administrator-Benutzer erstellt eine Unity-Katalogverbindung und eine Datenaufnahme-Pipeline.
  • Mehrere Benutzer: Ein Administratorbenutzer erstellt eine Verbindung für Nicht-Administratorbenutzer zum Erstellen von Pipelines mit.
Authentifizierungsmethode Die Schritte zum Erstellen einer Verbindung hängen von der gewählten Authentifizierungsmethode ab.
Interface Die Schritte zum Erstellen einer Pipeline hängen von der Schnittstelle ab.
Aufnahmehäufigkeit Der Pipelinezeitplan hängt von Ihren Latenz- und Kostenanforderungen ab.
Allgemeine Muster Je nach Ihren Datenaufnahmeanforderungen verwendet die Pipeline möglicherweise Konfigurationen wie Historienverfolgung, Spaltenauswahl und Zeilenfilterung. Unterstützte Konfigurationen variieren je nach Connector. Weitere Informationen finden Sie unter Featureverfügbarkeit.

Import aus GitHub starten

In der folgenden Tabelle wird der End-to-End-GitHub Erfassungsfluss basierend auf dem Benutzertyp zusammengefasst:

Benutzer Steps
Administrator
Nicht-Administrator Verwenden Sie jede unterstützte Schnittstelle, um eine Pipeline aus einer vorhandenen Verbindung zu erstellen. Siehe Ingest-Daten aus GitHub.