Eine Verbindung mit externen Systemen herstellen

Azure Databricks bietet integrierte Integrationen in viele cloudnative Datensysteme sowie erweiterbare JDBC-Unterstützung zur Verbindungsherstellung mit anderen Datensystemen.

Die in diesem Abschnitt dokumentierten Connectors konzentrieren sich hauptsächlich auf die Konfiguration einer Verbindung mit einer einzelnen Tabelle im externen Datensystem. Sie können einige dieser Treiber verwenden, um Daten auch in externe Systeme zurückzuschreiben.

Für schreibgeschützte Datenverbindungen empfiehlt Databricks die Verwendung von Lakehouse Federation. Dadurch wird die Synchronisierung ganzer Datenbanken mit Azure Databricks von externen Systemen ermöglicht, und die Steuerung erfolgt über Unity Catalog. Weitere Informationen finden Sie unter Was ist der Lakehouse-Verbund?.

Partner Connect bietet außerdem Integrationen in viele beliebte Unternehmensdatensysteme. Viele Partner Connect-Lösungen stellen nicht nur eine Verbindung mit Datenquellen her, sondern erleichtern auch eine einfache ETL-Vorgänge, um Daten in Ihrem Lakehouse auf dem neuesten Stand zu halten. Siehe Was ist Databricks Partner Connect?.

Welche Datenquellen stellen mit JDBC eine Verbindung zu Azure Databricks her?

Mithilfe von JDBC können Sie eine Verbindung zu vielen Datenquellen herstellen. Databricks Runtime enthält Treiber für eine Reihe von JDBC-Datenbanken, aber möglicherweise müssen Sie einen Treiber oder eine andere Treiberversion installieren, um eine Verbindung zu Ihrer bevorzugten Datenbank herzustellen. Die unterstützten Datenbanken beinhalten Folgendes:

In welche Datendienste wird Azure Databricks integriert?

Die folgenden Datendienste erfordern, dass Sie Verbindungseinstellungen, Sicherheitsanmeldeinformationen und Netzwerkeinstellungen konfigurieren. Möglicherweise benötigen Sie Administrator- oder Poweruser-Berechtigungen in Ihrem Azure-Konto oder Azure Databricks-Arbeitsbereich. Für einige muss außerdem eine Azure Databricks-Bibliothek erstellt und in einem Cluster installiert werden: