Delen via


Clusterconfiguratie voor Databricks Connect

Notitie

Dit artikel bevat informatie over Databricks Connect voor Databricks Runtime 13.3 LTS en hoger.

In dit artikel vindt u een lijst met configuratie-instellingen voor Azure Databricks-rekenkracht die vereist zijn voor Databricks Connect om er verbinding mee te maken. Deze informatie is van toepassing op de Python- en Scala-versie van Databricks Connect, tenzij anders vermeld.

Met Databricks Connect kunt u populaire IDE's, zoals Visual Studio Code, PyCharm, RStudio Desktop, IntelliJ IDEA, notebookservers en andere aangepaste toepassingen, verbinden met Azure Databricks-clusters. Zie Wat is Databricks Connect?

Vereisten

  • Een Azure Databricks-account en -werkruimte waarvoor Unity Catalog is ingeschakeld. Zie Unity Catalog instellen en beheren en een werkruimte inschakelen voor Unity Catalog.
  • Een Azure Databricks-cluster waarop Databricks Runtime 13.3 LTS of hoger is geïnstalleerd.
  • De Databricks Runtime-versie van uw cluster moet gelijk zijn aan of hoger zijn dan de Databricks Connect-pakketversie. Databricks raadt u aan het meest recente pakket van Databricks Connect te gebruiken dat overeenkomt met de Databricks Runtime-versie. Als u functies wilt gebruiken die beschikbaar zijn in latere versies van Databricks Runtime, moet u het Databricks Connect-pakket upgraden. Zie de releaseopmerkingen van Databricks Connect voor een lijst met beschikbare Databricks Connect-releases. Zie voor releaseopmerkingen bij de Release-versie van Databricks Runtime versies en compatibiliteit van Databricks Runtime.
  • Het cluster moet een clustertoegangsmodus van Toegewezen of Gedeeld gebruiken. Zie Access-modi.

Programmatische validatie

In Databricks Connect 14.3 en hoger introduceert validateSessionu een DatabricksSession.builder reeks validaties om ervoor te zorgen dat aan de voorgaande vereisten wordt voldaan.

In Databricks Connect voor Python heeft het databricks-connect binaire bestand een test subopdracht die dezelfde set validaties uitvoert.

Deze opdracht moet worden uitgevoerd op de terminal met een actieve Python-omgeving die Databricks Connect bevat en met de set standaardreferenties die zijn geconfigureerd. Zie Verbindingseigenschappen configureren om deze referenties te configureren.

databricks-connect test

De opdracht mislukt met een afsluitcode die niet nul is en een geschikt bericht wanneer aan een van de vereisten niet wordt voldaan.

Databricks Connect uitschakelen

Databricks Connect (en de onderliggende Spark Connect)-services kunnen worden uitgeschakeld op elk cluster.

Als u de Databricks Connect-service wilt uitschakelen, stelt u de volgende Spark-configuratie in het cluster in.

spark.databricks.service.server.enabled false

Volgende stappen