Analisar dados com um conjunto de SQL sem servidor

Neste tutorial, irá aprender a analisar dados com o conjunto de SQL sem servidor.

O conjunto de SQL sem servidor incorporado

Os conjuntos de SQL sem servidor permitem-lhe utilizar o SQL sem ter de reservar capacidade. A faturação de um conjunto de SQL sem servidor baseia-se na quantidade de dados processados para executar a consulta e não no número de nós utilizados para executar a consulta.

Todas as áreas de trabalho são fornecidas com um conjunto de SQL sem servidor pré-configurado denominado Incorporado.

Analisar os dados do Táxi de NYC com um conjunto de SQL sem servidor

  1. No Synapse Studio, aceda ao Hub de Desenvolvimento

  2. Crie um novo script SQL.

  3. Cole o seguinte código no script.

    SELECT
        TOP 100 *
    FROM
        OPENROWSET(
            BULK 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet',
            FORMAT='PARQUET'
        ) AS [result]
    
  4. Selecione Executar.

A exploração de dados é apenas um cenário simplificado onde pode compreender as características básicas dos seus dados. Saiba mais sobre a exploração e análise de dados neste tutorial.

Criar base de dados de exploração de dados

Pode procurar o conteúdo dos ficheiros diretamente através master da base de dados. Para alguns cenários de exploração de dados simples, não precisa de criar uma base de dados separada. No entanto, à medida que continua a exploração de dados, poderá querer criar alguns objetos utilitários, tais como:

  • Origens de dados externas que representam as referências nomeadas para contas de armazenamento.
  • Credenciais no âmbito da base de dados que lhe permitem especificar como autenticar na origem de dados externa.
  • Utilizadores de bases de dados com permissões para aceder a algumas origens de dados ou objetos de base de dados.
  • Vistas, procedimentos e funções de utilidade que pode utilizar nas consultas.
  1. Utilize a master base de dados para criar uma base de dados separada para objetos de base de dados personalizados. Não é possível criar objetos de base de dados personalizados na master base de dados.

    CREATE DATABASE DataExplorationDB 
                    COLLATE Latin1_General_100_BIN2_UTF8
    

    Importante

    Utilize um agrupamento com _UTF8 sufixo para garantir que o texto UTF-8 é corretamente convertido em VARCHAR colunas. Latin1_General_100_BIN2_UTF8 fornece o melhor desempenho nas consultas que leem dados de ficheiros Parquet e contentores do Azure Cosmos DB. Para obter mais informações sobre como alterar os agrupamentos, veja Tipos de agrupamento suportados para o Synapse SQL.

  2. Mude o contexto da base de dados de master para DataExplorationDB utilizar o seguinte comando. Também pode utilizar o controlo de IU para utilizar a base de dados para mudar a base de dados atual:

    USE DataExplorationDB
    
  3. A partir do , crie objetos utilitários, como credenciais e origens de DataExplorationDBdados.

    CREATE EXTERNAL DATA SOURCE ContosoLake
    WITH ( LOCATION = 'https://contosolake.dfs.core.windows.net')
    

    Nota

    Uma origem de dados externa pode ser criada sem uma credencial. Se não existir uma credencial, a identidade do autor da chamada será utilizada para aceder à origem de dados externa.

  4. Opcionalmente, utilize a base de dados recentemente criada DataExplorationDB para criar um início de sessão para um utilizador que DataExplorationDB aceda a dados externos:

    CREATE LOGIN data_explorer WITH PASSWORD = 'My Very Strong Password 1234!';
    

    Em seguida, crie um utilizador de base de dados no DataExplorationDB para o início de sessão acima e conceda a ADMINISTER DATABASE BULK OPERATIONS permissão.

    CREATE USER data_explorer FOR LOGIN data_explorer;
    GO
    GRANT ADMINISTER DATABASE BULK OPERATIONS TO data_explorer;
    GO
    
  5. Explore o conteúdo do ficheiro com o caminho relativo e a origem de dados:

    SELECT
        TOP 100 *
    FROM
        OPENROWSET(
                BULK '/users/NYCTripSmall.parquet',
                DATA_SOURCE = 'ContosoLake',
                FORMAT='PARQUET'
        ) AS [result]
    
  6. Publique as suas alterações na área de trabalho.

A base de dados de exploração de dados é apenas um marcador de posição simples onde pode armazenar os seus objetos utilitários. O conjunto de SQL do Synapse permite-lhe fazer muito mais e criar um Data Warehouse Lógico – uma camada relacional criada sobre origens de dados do Azure. Saiba mais sobre a criação de um armazém de dados lógico neste tutorial.

Passos seguintes