Share via


Clusterkonfiguration für Databricks Connect

Hinweis

In diesem Artikel wird Databricks Connect für Databricks Runtime 13.0 und höher behandelt.

In diesem Artikel werden Konfigurationsanforderungen und -einstellungen für Azure Databricks-Cluster aufgeführt, bevor Databricks Connect eine Verbindung mit ihnen herstellen kann. Diese Informationen gelten für die Python- und Scala-Version von Databricks Connect, sofern nicht anders angegeben.

Mit Databricks Connect können Sie beliebte IDEs wie Visual Studio Code, PyCharm, RStudio Desktop, IntelliJ IDEA, Notebookserver und andere benutzerdefinierte Anwendungen mit Azure Databricks-Clustern verbinden. Weitere Informationen finden Sie unter Was ist Databricks Connect?.

Anforderungen

  • Sie verfügen über einen Azure Databricks-Arbeitsbereich und über ein entsprechendes Konto, und diese sind für Unity Catalog aktiviert. Weitere Informationen finden Sie unter Einrichten und Verwalten von Unity Catalog und Aktivieren eines Arbeitsbereichs für Unity Catalog.
  • Ein Azure Databricks-Cluster mit Databricks Runtime 13.3 LTS oder höher installiert.
  • Der Cluster muss einen Clusterzugriffsmodus vom Typ Zugewiesen oder Freigegeben nutzen. Weitere Informationen finden Sie unter Zugriffsmodi.
  • Die verwendete Version von Databricks Connect muss höchstens der Databricks Runtime-Version entsprechen, die auf dem Cluster ausgeführt wird.

Programmgesteuerte Überprüfung

In Databricks Connect 14.3 und höher führt DatabricksSession.buildervalidateSession ein, das eine Reihe von Überprüfungen ausführt, um sicherzustellen, dass die vorherigen Anforderungen erfüllt sind.

In Databricks Connect für Python verfügt die databricks-connect-Binärdatei über einen test-Unterbefehl, der dieselben Überprüfungen ausführt.

Dieser Befehl sollte auf dem Terminal mit einer aktiven Python-Umgebung, die Databricks Connect und den Satz der konfigurierten Standardanmeldeinformationen enthält, ausgeführt werden. Informationen zum Konfigurieren dieser Anmeldeinformationen finden Sie unter Konfigurieren von Verbindungseigenschaften.

databricks-connect test

Der Befehl schlägt mit einem Exitcode ungleich 0 und einer entsprechenden Meldung fehl, wenn eine der Anforderungen nicht erfüllt ist.

Deaktivieren von Databricks Connect

Databricks Connect-Dienste (und die zugrunde liegenden Spark Connect-Dienste) können für jeden Cluster deaktiviert werden.

Um den Databricks Connect-Dienst zu deaktivieren, legen Sie die folgende Spark-Konfiguration für das Cluster fest.

spark.databricks.service.server.enabled false

Nächste Schritte