Analisar dados com um pool de SQL sem servidor

Neste tutorial, você aprenderá a analisar dados com o pool de SQL sem servidor.

O pool de SQL sem servidor interno

Os pools de SQL sem servidor permitem que você use o SQL sem precisar reservar a capacidade. A cobrança de um pool de SQL sem servidor se baseia no volume de dados processados para executar a consulta, não no número de nós usados para executá-la.

Cada espaço de trabalho vem com um pool SQL sem servidor pré-configurado chamado Built-in.

Analisar dados de Táxi de NYC com um pool de SQL sem servidor

Observação

Verifique se você colocou os dados de exemplo na conta de armazenamento primária

No Synapse Studio, vá para o hub Desenvolver
Crie um novo script SQL.

Cole o código a seguir no script. (Atualize contosolake com o nome da sua conta de armazenamento e users com o nome do seu contêiner.)

SELECT
    TOP 100 *
FROM
    OPENROWSET(
        BULK 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet',
        FORMAT='PARQUET'
    ) AS [result]

Selecione Executar.

A exploração de dados é apenas um cenário simplificado no qual você pode entender as características básicas dos seus dados. Saiba mais sobre a exploração e a análise de dados neste tutorial.

Criar um banco de dados de exploração

Procure o conteúdo dos arquivos diretamente por meio do banco de dados master. Para alguns cenários de exploração de dados simples, não é preciso criar um banco de dados separado. No entanto, à medida que você continua a exploração de dados, o ideal é criar alguns objetos de utilitário, como:

Fontes de dados externas que representam referências nomeadas para contas de armazenamento.
Credenciais no escopo do banco de dados que permitem especificar como se autenticar na fonte de dados externa.
Usuários de banco de dados com as permissões para acessar algumas fontes de dados ou objetos de banco de dados.
Visões, procedimentos e funções utilitárias que você pode usar nas consultas.

Dica

No Synapse Studio, ao abrir um novo script SQL, você pode selecionar mestre no menu suspenso do banco de dados na barra de ferramentas superior. Esse é o banco de dados do sistema padrão que aparece para pools de SQL sem servidor.

Use o banco de dados master para criar um banco de dados separado para objetos de banco de dados personalizados. Objetos de banco de dados personalizados não podem ser criados no master banco de dados.
```
CREATE DATABASE DataExplorationDB 
                COLLATE Latin1_General_100_BIN2_UTF8
```
Importante

Use uma ordenação com o sufixo _UTF8 para garantir que o texto UTF-8 seja convertido corretamente em colunas VARCHAR. Latin1_General_100_BIN2_UTF8 fornece o melhor desempenho nas consultas que leem dados de arquivos Parquet e contêineres do Azure Cosmos DB. Para obter mais informações sobre como alterar as ordenações, veja Tipos de ordenação com suporte para SQL do Synapse.
Alterne o contexto do banco de dados de master para DataExplorationDB usando o comando a seguir. Você também pode usar o controle da UI usar banco de dados para alternar o banco de dados atual.
```
USE DataExplorationDB
```
De DataExplorationDB crie objetos utilitários, como credenciais e fontes de dados.
```
CREATE EXTERNAL DATA SOURCE ContosoLake
WITH ( LOCATION = 'https://contosolake.dfs.core.windows.net')
```
Observação

Uma fonte de dados externa pode ser criada sem uma credencial. Se uma credencial não existir, a identidade do chamador será usada para acessar a fonte de dados externa.
Opcionalmente, use o banco de dados recém-criado DataExplorationDB para criar um logon para um usuário no DataExplorationDB que acessará dados externos:
```
CREATE LOGIN data_explorer WITH PASSWORD = 'My Very Strong Password 1234!';
```
Em seguida, crie um usuário de banco de dados em DataExplorationDB para o logon acima e conceda a permissão ADMINISTER DATABASE BULK OPERATIONS.
```
CREATE USER data_explorer FOR LOGIN data_explorer;
GO
GRANT ADMINISTER DATABASE BULK OPERATIONS TO data_explorer;
GO
```

Explore o conteúdo do arquivo usando o caminho relativo e a fonte de dados:

SELECT
    TOP 100 *
FROM
    OPENROWSET(
            BULK '/users/NYCTripSmall.parquet',
            DATA_SOURCE = 'ContosoLake',
            FORMAT='PARQUET'
    ) AS [result]

Publique suas alterações na área de trabalho.

O banco de dados de exploração de dados é apenas um simples espaço de armazenamento no qual você poderá armazenar os objetos utilitários. O pool de SQL do Synapse permite que você faça muito mais e crie um data warehouse lógico, uma camada relacional criada com base nas fontes de dados do Azure. Saiba mais sobre como criar um data warehouse lógico neste tutorial.

Próximas etapas

Analisar dados com um Pool do Spark sem servidor

Comentários

Esta página foi útil?

Last updated on 2026-02-13