O que é a extensão Databricks para Visual Studio Code?
A extensão Databricks para Visual Studio Code permite que você se conecte aos espaços de trabalho remotos do Azure Databricks a partir do ambiente de desenvolvimento integrado (IDE) do Visual Studio Code em execução em sua máquina de desenvolvimento local. Em seguida, pode:
- Defina, implante e execute Databricks Asset Bundles para aplicar padrões de CI/CD e práticas recomendadas aos seus trabalhos do Azure Databricks, pipelines Delta Live Tables e MLOps Stacks usando a interface do usuário do Visual Studio Code. Consulte O que são os recursos de extensão Databricks Asset Bundles? e Databricks Asset Bundles.
- Execute arquivos de código Python locais do Visual Studio Code em clusters do Azure Databricks em seus espaços de trabalho remotos. Consulte Executar um arquivo Python em um cluster
- Execute arquivos de código Python locais (
.py
) e blocos de anotações Python, R, Scala e SQL (.py
,.ipynb
,.r
,.scala
e.sql
) do Visual Studio Code como trabalhos do Azure Databricks em seus espaços de trabalho remotos. Consulte Executar um arquivo Python como um trabalho. - Configure seu ambiente de depuração e o Databricks Connect usando uma lista de verificação simples que aciona caixas de diálogo de seleção. Consulte Depurar código usando Databricks Connect para a extensão Databricks para Visual Studio Code.
- Depurar blocos de anotações célula a célula dentro do Visual Studio Code com Databricks Connect. Consulte Executar e depurar células do bloco de anotações com o Databricks Connect usando a extensão Databricks para Visual Studio Code.
- Sincronize o código local que você desenvolve no Visual Studio Code com o código em seus espaços de trabalho remotos. Consulte Sincronizar sua pasta de espaço de trabalho com o Databricks
Nota
A extensão Databricks para Visual Studio Code oferece suporte à execução de blocos de anotações R, Scala e SQL como trabalhos automatizados, mas não fornece suporte mais profundo para essas linguagens no Visual Studio Code.
Começar
Para começar a usar a extensão Databricks para Visual Studio Code:
- Instale a extensão.
- Criar um novo projeto Databricks ou converter um projeto existente do Visual Studio Code.
- Configure seu projeto facilmente usando a interface do usuário da extensão Databricks.
- Execute algum código Python como parte do tutorial de extensão.
- Depure seu código usando a integração do Databricks Connect.
- Teste seu código usando
pytest
o . Consulte Executar testes com pytest usando a extensão Databricks para Visual Studio Code.
Criar um novo projeto Databricks
Depois que a extensão for instalada, você poderá criar um novo projeto Databricks usando a extensão Databricks para Visual Studio Code:
- Abra o Visual Studio Code.
- Clique no ícone Databricks na barra lateral do Visual Studio Code para abrir a extensão.
- Clique em Criar um projeto novo.
- Na Paleta de Comandos, selecione um anfitrião e um método de autenticação para o projeto. Consulte Configurar a autorização para a extensão Databricks para Visual Studio Code.
- Em Forneça um caminho para uma pasta onde gostaria de ter o seu novo projeto, insira o caminho para uma pasta no seu computador de desenvolvimento local onde deseja criar o projeto ou clique em Abrir diálogo de seleção de pasta e selecione o caminho para a pasta do projeto.
- Para Modelo a ser usado no modo de exibição de inicialização do projeto Databricks, use as setas para cima e para baixo para selecionar um modelo de projeto e pressione Enter. Para obter informações sobre modelos de projeto de pacote, consulte Modelos de projeto do Databricks Asset Bundle.
- Digite um nome exclusivo para este projeto para o projeto ou deixe o nome do projeto padrão de
my_project
e, em seguida, pressione Enter. - Escolha se deseja adicionar um bloco de notas de exemplo, um pipeline de exemplo do Delta Live Tables, ou um pacote de Python de exemplo ao projeto, ou qualquer combinação destes exemplos.
- Pressione qualquer tecla para fechar a guia Databricks Project Init editor.
- Para Selecione o projeto que deseja abrir, escolha o projeto que você acabou de criar.
Abrir um projeto existente do Databricks Asset Bundles
Um projeto Databricks Asset Bundles tem um databricks.yml
arquivo na pasta raiz do projeto. Consulte Configuração do Databricks Asset Bundle. Se você quiser usar a extensão com um projeto existente do Databricks Asset Bundles:
Abra o Visual Studio Code. No menu principal, clique em >e navegue até o diretório que contém seu projeto de pacote.
Clique no ícone Databricks na barra lateral do Visual Studio Code para abrir e começar a usar os recursos da extensão.
Se a extensão Databricks para Visual Studio Code descobrir mais de um projeto Databricks Asset Bundles na pasta atual, ele permitirá que você escolha abrir um projeto ou criar um arquivo de configuração de projeto na pasta raiz.
- Se escolheu um projeto, na Paleta de Comandos, selecione o seu projeto existente do Databricks Asset Bundles.
- Se você criar uma configuração na pasta raiz, essa pasta se tornará um projeto de pacote.
Selecione um host e um método de autenticação para o projeto. Consulte Configurar a autorização para a extensão Databricks para Visual Studio Code.
Nota
Se você abrir um projeto criado usando a extensão Databricks para Visual Studio Code v1, a migração será tentada automaticamente usando a autenticação existente do projeto e a configuração do espaço de trabalho. O botão de migração só estará disponível se a migração automática falhar.
Alternar entre os projetos do Databricks
A extensão Databricks para Visual Studio Code permite que você tenha vários projetos Databricks em seu espaço de trabalho Visual Studio Code e alterne facilmente entre eles. Com o seu projeto multipacote aberto no espaço de trabalho do Visual Studio Code:
Clique no ícone Databricks na barra lateral do Visual Studio Code para abrir a extensão.
Clique em Pasta Local para selecionar o projeto que a extensão deve usar.
Nota
As ações de execução só estão disponíveis para arquivos no pacote ativo.
Converter um projeto em um projeto Databricks
Se você tiver um projeto existente que deseja converter em um projeto Databricks:
- Abra o Visual Studio Code. No menu principal, clique em Arquivo>Abrir Pasta e navegue até o seu projeto para abri-lo.
- Clique no ícone Databricks na barra lateral do Visual Studio Code para abrir a extensão.
- Clique em Criar configuração.
- Na Paleta de Comandos, selecione um anfitrião e um método de autenticação para o projeto. Consulte Configurar a autorização para a extensão Databricks para Visual Studio Code.