Usar o Jupyter Notebooks no Azure Data Studio

Artigo
07/04/2024

Aplica-se a: SQL Server 2019 (15.x)

Jupyter Notebook é uma aplicação web de código aberto que permite criar e compartilhar documentos contendo código ao vivo, equações, visualizações e texto narrativo. O uso inclui limpeza e transformação de dados, simulação numérica, modelagem estatística, visualização de dados e aprendizado de máquina.

Este artigo descreve como criar um novo bloco de anotações na versão mais recente do Azure Data Studio e como começar a criar seus próprios blocos de anotações usando kernels diferentes.

Assista a este pequeno vídeo de 5 minutos para uma introdução aos blocos de anotações no Azure Data Studio:

Criar um bloco de notas

Há várias maneiras de criar um novo bloco de anotações. Em cada caso, um novo arquivo chamado Notebook-1.ipynb é aberto.

Vá para o Menu Arquivo no Azure Data Studio e selecione Novo Bloco de Anotações.
Clique com o botão direito do mouse em uma conexão do SQL Server e selecione Novo Bloco de Anotações.
Abra a paleta de comandos (Ctrl+Shift+P), digite "novo bloco de anotações" e selecione o comando Novo bloco de anotações .

Conectar-se a um kernel

Os blocos de anotações do Azure Data Studio dão suporte a vários kernels diferentes, incluindo SQL Server, Python, PySpark e outros. Cada kernel suporta um idioma diferente nas células de código do seu bloco de anotações. Por exemplo, quando conectado ao kernel do SQL Server, você pode inserir e executar instruções T-SQL em uma célula de código do bloco de anotações.

Anexar a fornece o contexto para o kernel. Por exemplo, se você estiver usando o SQL Kernel, poderá anexar a qualquer uma das suas instâncias do SQL Server. Se você estiver usando o kernel Python3, você anexa ao localhost e pode usar esse kernel para seu desenvolvimento Python local.

O SQL Kernel também pode ser usado para se conectar a instâncias de servidor PostgreSQL. Se você for um desenvolvedor PostgreSQL e quiser conectar os blocos de anotações ao seu Servidor PostgreSQL, baixe a extensão PostgreSQL no Azure Data Studio extension Marketplace e conecte-se ao servidor PostgreSQL.

Se você estiver conectado ao cluster de big data do SQL Server 2019, o padrão Anexar a é o ponto final do cluster. Você pode enviar código Python, Scala e R usando a computação Spark do cluster.

Kernel	Description
SQL Kernel	Escreva código SQL direcionado ao seu banco de dados relacional.
Kernel PySpark3 e PySpark	Escreva código Python usando a computação do Spark a partir do cluster.
Spark Kernel	Escreva o código Scala e R usando a computação do Spark a partir do cluster.
Python Kernel	Escreva código Python para desenvolvimento local.

Para obter mais informações sobre kernels específicos, consulte:

Criar e executar um bloco de anotações do SQL Server
Criar e executar um bloco de anotações Python
Extensão Kqlmagic no Azure Data Studio - isso estende os recursos do kernel Python

Adicionar uma célula de código

As células de código permitem que você execute o código interativamente dentro do bloco de anotações.

Adicione uma nova célula de código clicando no comando +Célula na barra de ferramentas e selecionando Célula de código. Uma nova célula de código é adicionada após a célula selecionada no momento.

Insira o código na célula para o kernel selecionado. Por exemplo, se você estiver usando o kernel SQL, poderá inserir comandos T-SQL na célula de código.

Inserir código com o kernel SQL é semelhante a um editor de consultas SQL. A célula de código oferece suporte a uma experiência moderna de codificação SQL com recursos internos, como um editor SQL avançado, IntelliSense e trechos de código internos. Trechos de código permitem gerar a sintaxe SQL adequada para criar bancos de dados, tabelas, exibições, procedimentos armazenados e atualizar objetos de banco de dados existentes. Use trechos de código para criar rapidamente cópias do seu banco de dados para fins de desenvolvimento ou teste e para gerar e executar scripts.

SQL Kernel

Adicionar uma célula de texto

As células de texto permitem que você documente seu código adicionando blocos de texto Markdown entre as células de código.

Adicione uma nova célula de texto clicando no comando +Célula na barra de ferramentas e selecionando Célula de texto.

A célula começa no modo de edição no qual você pode digitar texto Markdown. À medida que você digita, uma visualização é mostrada abaixo.

Célula de Markdown

A seleção fora da célula de texto mostra o texto Markdown.

Texto de marcação

Se você clicar na célula de texto novamente, ele mudará para o modo de edição.

Executar uma célula

Para executar uma única célula, clique em Executar célula (a seta preta redonda) à esquerda da célula ou selecione a célula e pressione F5. Pode executar todas as células do bloco de notas clicando em Executar tudo na barra de ferramentas - as células são executadas uma de cada vez e a execução para se for encontrado um erro numa célula.

Os resultados da célula são mostrados abaixo da célula. Você pode limpar os resultados de todas as células executadas no bloco de anotações selecionando o botão Limpar resultados na barra de ferramentas.

Guardar um bloco de notas

Para salvar um bloco de anotações, siga um destes procedimentos.

Digite Ctrl+S
Selecione Salvar no menu Arquivo
Selecione Salvar como... no menu Arquivo
Selecione Salvar tudo no menu Arquivo - isso salva todos os blocos de anotações abertos
Na paleta de comandos, digite Arquivo: Salvar

Os blocos de notas são guardados como .ipynb ficheiros.

Confiável e não confiável

Os blocos de anotações abertos no Azure Data Studio têm como padrão Confiável.

Se você abrir um bloco de anotações de alguma outra fonte, ele será aberto no modo Não Confiável e, em seguida, você poderá torná-lo Confiável.

Exemplos

Os exemplos a seguir demonstram o uso de kernels diferentes para executar um comando simples "Hello World". Selecione o kernel, insira o código de exemplo em uma célula e clique em Executar célula.

Pyspark

Aplicação Spark

Faísca | Língua Scala

Faísca Scala

Faísca | Linguagem R

Faísca R

Python 3

Python local

Próximos passos

Crie e execute um bloco de anotações do SQL Server.
Criar e executar um bloco de anotações Python
Execute scripts Python e R em blocos de anotações do Azure Data Studio com os Serviços de Aprendizado de Máquina do SQL Server.
Implante o cluster de big data do SQL Server com o notebook do Azure Data Studio.
Gerencie clusters de Big Data do SQL Server com blocos de anotações do Azure Data Studio.
Execute um bloco de anotações de exemplo usando o Spark.

Partilhar via