Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Este artigo descreve como utilizar a integração Databricks Connect na extensão Databricks para Visual Studio Code para executar e depurar ficheiros individuais de Python (.py). Para informações sobre a extensão, veja Databricks extensão para Visual Studio Code.
A integração do Databricks Connect também permite executar e depurar células de cadernos. Veja como executar e depurar células de notebook com o Databricks Connect utilizando a extensão Databricks para o Visual Studio Code.
Requisitos
Antes de poder usar o Databricks Connect a partir da extensão Databricks para Visual Studio Code, deve primeiro cumprir os requisitos Databricks Connect. Estes requisitos incluem coisas como um espaço de trabalho com Unity Catalog, requisitos de computação e requisitos de versão para a instalação local de Python.
Ativar um ambiente virtual em Python
Ativa um Python virtual environment para o teu projeto Python. Os ambientes virtuais em Python ajudam a garantir que o seu projeto utiliza versões compatíveis dos pacotes Python e Python (neste caso, o pacote Databricks Connect).
No painel Configuração:
- Clique no item vermelho Ativar Ambiente Virtual sob Python Ambiente.
- Na Paleta de Comandos, selecione Venv ou Conda.
- Selecione as dependências que deseja instalar, se houver.
Instalar o Databricks Connect
Na vista Configuration sob Ambiente Python:
- Clique no botão vermelho Install databricks-connect play.
- Anexe um cluster.
- Se a seção Cluster ainda não estiver configurada na extensão, a seguinte mensagem será exibida: "Anexe um cluster para usar o Databricks Connect". Clique em Anexar Cluster e selecione um cluster que atenda aos requisitos do Databricks Connect.
- Se a secção Cluster estiver configurada, mas o cluster não for compatível com o Databricks Connect, clique no botão vermelho Databricks Connect desativado, clique em Ligar Clustere selecione um cluster compatível.
- Se o pacote Databricks Connect (e suas dependências) ainda não estiver instalado, a seguinte mensagem será exibida: "Para depuração interativa e preenchimento automático, você precisa do Databricks Connect. Gostaria de instalá-lo no ambiente
<environment-name>." Clique em Install (Instalar). - Na barra de estado Visual Studio Code, se aparecer o botão vermelho Databricks Connect desativado, clique nele e complete as instruções no ecrã para o ativar.
- Depois de aparecer o botão "Databricks Connect ativado", estará pronto para usar o Databricks Connect.
Nota
Se você usar o Poetry, poderá sincronizar seus pyproject.toml arquivos e poetry.lock com o pacote Databricks Connect instalado (e suas dependências) executando o seguinte comando. Certifique-se de substituir o 16.4.1 pela versão do pacote Databricks Connect que corresponde à que foi instalada pela extensão Databricks para Visual Studio Code para o seu projeto.
poetry add databricks-connect==16.4.1
Executa ou depura o teu código Python
Depois de ativar o Databricks Connect, execute ou depure o seu ficheiro de Python (.py):
No teu projeto, abre o ficheiro Python que quiseres executar ou depurar.
Defina quaisquer pontos de interrupção de depuração dentro do ficheiro Python.
Clique no ícone Executar no Databricks ao lado da lista de guias do editor e, em seguida, clique em Depurar arquivo atual comDatabricks Connect.
A saída aparece no painel Debug Console .
Você também pode clicar com o botão direito do mouse no arquivo
.pye, em seguida, clicar em Executar Databricks>Depurar arquivo atual com o Databricks Connect.