Compartilhar via


Usar o Visual Studio Code com o Databricks Connect para Python

Observação

Esse artigo aborda o Databricks Connect para Databricks Runtime 13.3 LTS e superior.

Este artigo aborda como usar o Databricks Connect para Python com o Visual Studio Code. O Databricks Connect permite que você conecte IDEs populares, servidores de notebook e outros aplicativos personalizados aos clusters do Azure Databricks. Consulte O que é o Databricks Connect?. Para obter a versão do Scala deste artigo, consulte Usar o Visual Studio Code com o Databricks Connect para Scala.

Observação

Antes de começar a utilizar o Databricks Connect, você deve configurar o cliente Databricks Connect.

Dica

A extensão do Databricks para Visual Studio Code já tem suporte interno para o Databricks Connect para Databricks Runtime 13.3 LTS superior. Confira Depurar código usando o Databricks Connect para a extensão do Databricks para Visual Studio Code.

Para usar o Databricks Connect com o Visual Studio Code e Python, siga estas instruções.

  1. Inicie o Visual Studio Code.

  2. Abra a pasta que contém o ambiente virtual do Python (Arquivo > Abrir Pasta).

  3. No Terminal do Visual Studio Code (Exibir > Terminal), ative o ambiente virtual.

  4. Defina o interpretador atual do Python para ser referenciado no ambiente virtual:

    1. Na Paleta de Comandos (Exibir > Paleta de Comandos), digite Python: Select Interpreter e pressione Enter.
    2. Selecione o caminho para o interpretador do Python referenciado no ambiente virtual.
  5. Adicione à pasta um arquivo de código Python (.py) que contém o código de exemplo ou seu próprio código. Se você usar seu próprio código, deverá inicializar DatabricksSession no mínimo conforme mostrado no código de exemplo.

  6. Para executar o código, clique em Executar > Sem Depuração no menu main. Todo o código Python é executado localmente, enquanto todo o código PySpark que envolve operações do DataFrame é executado no cluster no workspace remoto do Azure Databricks e as respostas de execução são enviadas de volta para o chamador local.

  7. Para depurar o código:

    1. Com o arquivo de código Python aberto, defina os pontos de interrupção em que você deseja que seu código pause durante a execução.
    2. Clique no ícone Executar e Depurar na barra lateral ou em Exibir > Execução no menu principal.
    3. Na exibição Executar e Depurar, clique no botão Executar e Depurar.
    4. Siga as instruções na tela para começar a executar e depurar o código.

    Todo o código Python é depurado localmente, enquanto todo o código PySpark continua a ser executado no cluster no workspace remoto do Azure Databricks. O código principal do mecanismo Spark não pode ser depurado diretamente do cliente.

Para obter instruções de execução e depuração mais específicas, confira Configurar e executar o depurador e Depuração do Python no VS Code.