Partilhar via


Usar o Visual Studio Code com o Databricks Connect for Python

Nota

Este artigo aborda o Databricks Connect for Databricks Runtime 13.3 LTS e superior.

Este artigo aborda como usar o Databricks Connect for Python com o Visual Studio Code. O Databricks Connect permite conectar IDEs populares, servidores de notebook e outros aplicativos personalizados a clusters do Azure Databricks. Consulte O que é Databricks Connect?. Para a versão Scala deste artigo, consulte Usar o Visual Studio Code with Databricks Connect for Scala.

Nota

Antes de começar a usar o Databricks Connect, você deve configurar o cliente Databricks Connect.

Gorjeta

A extensão Databricks para Visual Studio Code já tem suporte interno para Databricks Connect for Databricks Runtime 13.3 LTS e superior. Consulte Depurar código usando Databricks Connect para a extensão Databricks para Visual Studio Code.

Para usar o Databricks Connect com Visual Studio Code e Python, siga estas instruções.

  1. Inicie o Visual Studio Code.

  2. Abra a pasta que contém seu ambiente virtual Python (File > Open Folder).

  3. No Terminal de código do Visual Studio (View > Terminal), ative o ambiente virtual.

  4. Defina o interpretador Python atual como aquele que é referenciado a partir do ambiente virtual:

    1. Na Paleta de Comandos (Ver Paleta de Comandos), escreva Python: Select Interpretere, em seguida, prima Enter>.
    2. Selecione o caminho para o interpretador Python que é referenciado a partir do ambiente virtual.
  5. Adicione à pasta um arquivo de código Python (.py) que contenha o código de exemplo ou seu próprio código. Se você usar seu próprio código, no mínimo você deve inicializar DatabricksSession como mostrado no código de exemplo.

  6. Para executar o código, clique em Executar > sem depuração no menu principal. Todo o código Python é executado localmente, enquanto todo o código PySpark envolvendo operações DataFrame é executado no cluster no espaço de trabalho remoto do Azure Databricks e as respostas de execução são enviadas de volta ao chamador local.

  7. Para depurar o código:

    1. Com o arquivo de código Python aberto, defina quaisquer pontos de interrupção onde você deseja que seu código pause durante a execução.
    2. Clique no ícone Executar e Depurar na barra lateral ou clique em Exibir > Execução no menu principal.
    3. Na visualização Executar e Depurar, clique no botão Executar e Depurar.
    4. Siga as instruções na tela para começar a executar e depurar o código.

    Todo o código Python é depurado localmente, enquanto todo o código PySpark continua a ser executado no cluster no espaço de trabalho remoto do Azure Databricks. O código principal do mecanismo Spark não pode ser depurado diretamente do cliente.

Para obter instruções mais específicas de execução e depuração, consulte Configurar e executar o depurador e a depuração Python no VS Code.