O que é a extensão Databricks para Visual Studio Code?
A extensão Databricks para Visual Studio Code permite que você se conecte aos espaços de trabalho remotos do Azure Databricks a partir do ambiente de desenvolvimento integrado (IDE) do Visual Studio Code em execução em sua máquina de desenvolvimento local. Em seguida, pode:
- Defina, implante e execute Databricks Asset Bundles para aplicar padrões de CI/CD e práticas recomendadas aos seus trabalhos do Azure Databricks, pipelines Delta Live Tables e MLOps Stacks usando a interface do usuário do Visual Studio Code. Consulte O que são os recursos de extensão Databricks Asset Bundles? e Databricks Asset Bundles.
- Execute arquivos de código Python locais do Visual Studio Code em clusters do Azure Databricks em seus espaços de trabalho remotos. Consulte Executar um arquivo Python em um cluster
- Execute arquivos de código Python locais (
.py
) e blocos de anotações Python, R, Scala e SQL (.py
,.ipynb
,.r
,.scala
e.sql
) do Visual Studio Code como trabalhos do Azure Databricks em seus espaços de trabalho remotos. Consulte Executar um arquivo Python como um trabalho. - Configure seu ambiente de depuração e o Databricks Connect usando uma lista de verificação simples que aciona caixas de diálogo de seleção. Consulte Depurar código usando Databricks Connect para a extensão Databricks para Visual Studio Code.
- Depurar blocos de anotações célula a célula dentro do Visual Studio Code com Databricks Connect. Consulte Executar e depurar células do bloco de anotações com o Databricks Connect usando a extensão Databricks para Visual Studio Code.
- Sincronize o código local que você desenvolve no Visual Studio Code com o código em seus espaços de trabalho remotos.
Nota
A extensão Databricks para Visual Studio Code oferece suporte à execução de blocos de anotações R, Scala e SQL como trabalhos automatizados, mas não fornece suporte mais profundo para essas linguagens no Visual Studio Code.
Começar agora
Para começar a usar a extensão Databricks para Visual Studio Code:
- Instale a extensão.
- Crie um novo projeto Databricks ou migre um projeto existente do Visual Studio Code.
- Configure seu projeto facilmente usando a interface do usuário da extensão Databricks.
- Execute algum código Python como parte do tutorial de extensão.
- Depure seu código usando a integração do Databricks Connect.
- Teste seu código usando
pytest
o . Consulte Executar testes com pytest usando a extensão Databricks para Visual Studio Code.
Criar um novo projeto Databricks
Depois que a extensão for instalada, você poderá criar um novo projeto Databricks usando a extensão Databricks para Visual Studio Code:
- Abra o Visual Studio Code.
- Clique no ícone Databricks na barra lateral do Visual Studio Code para abrir a extensão.
- Clique em Criar um novo projeto Databricks.
- Na Paleta de comandos, selecione um host e um método de autenticação para o projeto. Consulte Configuração de autenticação para a extensão Databricks para Visual Studio Code.
- Em Fornecer um caminho para uma pasta onde você gostaria que seu novo projeto estivesse, digite o caminho para uma pasta no computador de desenvolvimento local onde deseja criar o projeto ou clique em Abrir caixa de diálogo de seleção de pasta e selecione o caminho para a pasta do projeto.
- Para Modelo a ser usado no modo de exibição de inicialização do projeto Databricks, use as setas para cima e para baixo para selecionar um modelo de projeto e pressione Enter. Para obter informações sobre modelos de projeto de pacote, consulte Modelos de projeto do Databricks Asset Bundle.
- Digite um nome exclusivo para este projeto para o projeto ou deixe o nome do projeto padrão de
my_project
e, em seguida, pressione Enter. - Escolha se deseja adicionar um bloco de anotações de stub (exemplo), um pipeline de stub (amostra) Delta Live Tables ou um pacote Python de stub (amostra) ao projeto, ou qualquer combinação desses stubs (amostras).
- Pressione qualquer tecla para fechar a guia Databricks Project Init editor.
- Em Selecione o projeto que deseja abrir, escolha o projeto que você acabou de criar.
Migrar um projeto para um projeto Databricks
Se você tiver um projeto existente que deseja migrar para um projeto Databricks, abra-o com a extensão Databricks para Visual Studio Code para iniciar a migração:
- Abra o Visual Studio Code. No menu principal, clique em Arquivo>Abrir Pasta e navegue até o seu projeto para abri-lo.
- Clique no ícone Databricks na barra lateral do Visual Studio Code para abrir a extensão.
- Clique em Migrar para um projeto Databricks.
- Na Paleta de comandos, selecione um host e um método de autenticação para o projeto. Consulte Configuração de autenticação para a extensão Databricks para Visual Studio Code.
Nota
Se você abrir um projeto criado usando a extensão Databricks para Visual Studio Code v1, a migração será tentada automaticamente usando a autenticação existente do projeto e a configuração do espaço de trabalho. O botão de migração só estará disponível se a migração automática falhar.
Abrir um projeto existente do Databricks Asset Bundles
Se a extensão Databricks para Visual Studio Code descobrir mais de um projeto Databricks Asset Bundles na pasta atual, a extensão Databricks para Visual Studio Code permitirá que você escolha qual projeto abrir.
Nota
Um projeto Databricks Asset Bundles tem um databricks.yml
arquivo na pasta raiz do projeto. Consulte Configuração do Databricks Asset Bundle.
Abra o Visual Studio Code. No menu principal, clique em Pasta de abertura de arquivo>e navegue até o diretório que contém seu projeto de pacote.
Clique no ícone Databricks na barra lateral do Visual Studio Code para abrir a extensão.
Clique em Abrir projeto Databricks existente.
Na Paleta de comandos, selecione seu projeto Databricks Asset Bundles existente.
Na Paleta de comandos, selecione um host e um método de autenticação para o projeto. Consulte Configuração de autenticação para a extensão Databricks para Visual Studio Code.
Adicionar outro projeto Databricks ao espaço de trabalho
A extensão Databricks para Visual Studio Code permite que você tenha vários projetos Databricks em seu espaço de trabalho Visual Studio Code e alterne facilmente entre eles. Para adicionar outro projeto:
Abra o Visual Studio Code. No menu principal, clique em Arquivo>Adicionar Pasta ao Espaço de Trabalho e navegue até o diretório que contém seu outro projeto de pacote.
Clique no ícone Databricks na barra lateral do Visual Studio Code para abrir a extensão.
Clique em Ative Workspace Folder para selecionar o projeto a ser usado pela extensão.