Analisar dados com um conjunto de SQL sem servidor
Neste tutorial, irá aprender a analisar dados com o conjunto de SQL sem servidor.
O conjunto de SQL sem servidor incorporado
Os conjuntos de SQL sem servidor permitem-lhe utilizar o SQL sem ter de reservar capacidade. A faturação de um conjunto de SQL sem servidor baseia-se na quantidade de dados processados para executar a consulta e não no número de nós utilizados para executar a consulta.
Todas as áreas de trabalho são fornecidas com um conjunto de SQL sem servidor pré-configurado denominado Incorporado.
Analisar os dados do Táxi de NYC com um conjunto de SQL sem servidor
Nota
Certifique-se de que colocou os dados de exemplo na conta de armazenamento primária
No Synapse Studio, aceda ao Hub de Desenvolvimento
Crie um novo script SQL.
Cole o seguinte código no script.
SELECT TOP 100 * FROM OPENROWSET( BULK 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet', FORMAT='PARQUET' ) AS [result]
Selecione Executar.
A exploração de dados é apenas um cenário simplificado onde pode compreender as características básicas dos seus dados. Saiba mais sobre a exploração e análise de dados neste tutorial.
Criar base de dados de exploração de dados
Pode procurar o conteúdo dos ficheiros diretamente através master
da base de dados. Para alguns cenários de exploração de dados simples, não precisa de criar uma base de dados separada.
No entanto, à medida que continua a exploração de dados, poderá querer criar alguns objetos utilitários, tais como:
- Origens de dados externas que representam as referências nomeadas para contas de armazenamento.
- Credenciais no âmbito da base de dados que lhe permitem especificar como autenticar na origem de dados externa.
- Utilizadores de bases de dados com permissões para aceder a algumas origens de dados ou objetos de base de dados.
- Vistas, procedimentos e funções de utilidade que pode utilizar nas consultas.
Utilize a
master
base de dados para criar uma base de dados separada para objetos de base de dados personalizados. Não é possível criar objetos de base de dados personalizados namaster
base de dados.CREATE DATABASE DataExplorationDB COLLATE Latin1_General_100_BIN2_UTF8
Importante
Utilize um agrupamento com
_UTF8
sufixo para garantir que o texto UTF-8 é corretamente convertido emVARCHAR
colunas.Latin1_General_100_BIN2_UTF8
fornece o melhor desempenho nas consultas que leem dados de ficheiros Parquet e contentores do Azure Cosmos DB. Para obter mais informações sobre como alterar os agrupamentos, veja Tipos de agrupamento suportados para o Synapse SQL.Mude o contexto da base de dados de
master
paraDataExplorationDB
utilizar o seguinte comando. Também pode utilizar o controlo de IU para utilizar a base de dados para mudar a base de dados atual:USE DataExplorationDB
A partir do , crie objetos utilitários, como credenciais e origens de
DataExplorationDB
dados.CREATE EXTERNAL DATA SOURCE ContosoLake WITH ( LOCATION = 'https://contosolake.dfs.core.windows.net')
Nota
Uma origem de dados externa pode ser criada sem uma credencial. Se não existir uma credencial, a identidade do autor da chamada será utilizada para aceder à origem de dados externa.
Opcionalmente, utilize a base de dados recentemente criada
DataExplorationDB
para criar um início de sessão para um utilizador queDataExplorationDB
aceda a dados externos:CREATE LOGIN data_explorer WITH PASSWORD = 'My Very Strong Password 1234!';
Em seguida, crie um utilizador de base de dados no
DataExplorationDB
para o início de sessão acima e conceda aADMINISTER DATABASE BULK OPERATIONS
permissão.CREATE USER data_explorer FOR LOGIN data_explorer; GO GRANT ADMINISTER DATABASE BULK OPERATIONS TO data_explorer; GO
Explore o conteúdo do ficheiro com o caminho relativo e a origem de dados:
SELECT TOP 100 * FROM OPENROWSET( BULK '/users/NYCTripSmall.parquet', DATA_SOURCE = 'ContosoLake', FORMAT='PARQUET' ) AS [result]
Publique as suas alterações na área de trabalho.
A base de dados de exploração de dados é apenas um marcador de posição simples onde pode armazenar os seus objetos utilitários. O conjunto de SQL do Synapse permite-lhe fazer muito mais e criar um Data Warehouse Lógico – uma camada relacional criada sobre origens de dados do Azure. Saiba mais sobre a criação de um armazém de dados lógico neste tutorial.