Freigeben über


Clusterkonfiguration für Databricks Connect

Hinweis

Dieser Artikel behandelt Databricks Connect für Databricks Runtime Version 13.3 LTS und höher.

In diesem Artikel werden Konfigurationseinstellungen für Azure Databricks Compute aufgeführt, die erforderlich sind, dass Databricks Connect eine Verbindung mit ihnen herstellen kann. Diese Informationen gelten für die Python- und Scala-Version von Databricks Connect, sofern nicht anders angegeben.

Mit Databricks Connect können Sie beliebte IDEs wie Visual Studio Code, PyCharm, RStudio Desktop, IntelliJ IDEA, Notebookserver und andere benutzerdefinierte Anwendungen mit Azure Databricks-Clustern verbinden. Weitere Informationen finden Sie unter Was ist Databricks Connect?.

Anforderungen

  • Ein Azure Databricks-Konto und -Arbeitsbereich mit aktiviertem Unity Catalog. Weitere Informationen finden Sie unter Einrichten und Verwalten von Unity Catalog und Aktivieren eines Arbeitsbereichs für Unity Catalog.
  • Ein Azure Databricks-Cluster auf dem Databricks Runtime 13.3 LTS oder höher installiert ist.
  • Die Databricks-Runtime-Version Ihres Clusters muss gleich oder höher sein als die Databricks Connect-Paketversion. Databricks empfiehlt, dass Sie das neueste Paket von Databricks Connect verwenden, die mit der Databricks Runtime-Version übereinstimmt. Wenn Sie Features verwenden möchten, die in späteren Versionen der Databricks Runtime verfügbar sind, müssen Sie das Databricks Connect-Paket aktualisieren. Eine Liste mit verfügbaren Databricks Connect-Releases finden Sie in den Versionshinweisen zu Databricks Connect. Versionshinweise zu bestimmten Databricks Runtime-Versionen finden Sie unter Versionshinweise zu Databricks Runtime-Versionen und -Kompatibilität.
  • Der Cluster muss einen Clusterzugriffsmodus vom Typ Zugewiesen oder Freigegeben nutzen. Weitere Informationen finden Sie unter Zugriffsmodi.

Programmgesteuerte Überprüfung

In Databricks Connect 14.3 und höher führt DatabricksSession.builder validateSession ein, das eine Reihe von Überprüfungen ausführt, um sicherzustellen, dass die vorherigen Anforderungen erfüllt sind.

In Databricks Connect für Python verfügt die databricks-connect-Binärdatei über einen test-Unterbefehl, der dieselben Überprüfungen ausführt.

Dieser Befehl sollte auf dem Terminal mit einer aktiven Python-Umgebung, die Databricks Connect und den Satz der konfigurierten Standardanmeldeinformationen enthält, ausgeführt werden. Informationen zum Konfigurieren dieser Anmeldeinformationen finden Sie unter Konfigurieren von Verbindungseigenschaften.

databricks-connect test

Der Befehl schlägt mit einem Exitcode ungleich 0 und einer entsprechenden Meldung fehl, wenn eine der Anforderungen nicht erfüllt ist.

Deaktivieren von Databricks Connect

Databricks Connect-Dienste (und die zugrunde liegenden Spark Connect-Dienste) können für jeden Cluster deaktiviert werden.

Um den Databricks Connect-Dienst zu deaktivieren, legen Sie die folgende Spark-Konfiguration für das Cluster fest.

spark.databricks.service.server.enabled false

Nächste Schritte