Condividi tramite


Analizzare i dati con un pool SQL serverless

In questa esercitazione si apprenderà come analizzare i dati con un pool SQL serverless.

Pool SQL serverless predefinito

I pool SQL serverless consentono di usare SQL senza dover riservare capacità. La fatturazione per un pool SQL serverless è basata sulla quantità di dati elaborati per eseguire la query e non sul numero di nodi usati per eseguirla.

Ogni area di lavoro include un pool SQL serverless preconfigurato denominato Predefinito.

Analizzare i dati dei taxi di New York con un pool SQL serverless

  1. In Synapse Studio passare all'hub Sviluppo.

  2. Creare un nuovo script SQL.

  3. Incollare il codice seguente nello script. Aggiornare contosolake con il nome dell'account di archiviazione e users con il nome del contenitore.

    SELECT
        TOP 100 *
    FROM
        OPENROWSET(
            BULK 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet',
            FORMAT='PARQUET'
        ) AS [result]
    
  4. Selezionare Esegui.

L'esplorazione dei dati è solo uno scenario semplificato in cui è possibile analizzare le caratteristiche di base dei dati. Altre informazioni sull'esplorazione e l'analisi dei dati sono disponibili in questa esercitazione.

Creare un database di esplorazione dei dati

È possibile esplorare il contenuto dei file direttamente tramite il database master. Per alcuni semplici scenari di esplorazione dei dati, non è necessario creare un database separato. Tuttavia, mentre si continua l'esplorazione dei dati, è possibile creare alcuni oggetti utilità, ad esempio:

  • Origini dati esterne che rappresentano i riferimenti denominati per gli account di archiviazione.
  • Credenziali con ambito database che consentono di specificare come eseguire l'autenticazione con l'origine dati esterna.
  • Utenti del database con le autorizzazioni per accedere ad alcune origini dati o oggetti di database.
  • Viste, procedure e funzioni dell'utilità che è possibile usare nelle query.
  1. Utilizzare il database master per creare un database separato per oggetti di database personalizzati. Non è possibile creare oggetti di database personalizzati nel database master.

    CREATE DATABASE DataExplorationDB 
                    COLLATE Latin1_General_100_BIN2_UTF8
    

    Importante

    Usare regole di confronto con il suffisso _UTF8 per assicurarsi che il testo UTF-8 venga convertito correttamente in colonne VARCHAR. Latin1_General_100_BIN2_UTF8 offre prestazioni ottimali nelle query che leggono i dati dai file Parquet e dai contenitori di Azure Cosmos DB. Per altre informazioni sulla modifica delle regole di confronto, vedere Tipi di regole di confronto supportati per Synapse SQL.

  2. Cambiare il contesto del database da master a DataExplorationDB usando il comando seguente. È anche possibile usare il controllo use database dell'interfaccia utente per cambiare il database corrente:

    USE DataExplorationDB
    
  3. In DataExplorationDB creare oggetti utilità come credenziali e origini dati.

    CREATE EXTERNAL DATA SOURCE ContosoLake
    WITH ( LOCATION = 'https://contosolake.dfs.core.windows.net')
    

    Nota

    È possibile creare un'origine dati esterna senza credenziali. Se non esiste una credenziale, verrà usata l'identità del chiamante per accedere all'origine dati esterna.

  4. Facoltativamente, usare il database DataExplorationDB appena creato per creare un account di accesso per un utente in DataExplorationDB per l'accesso ai dati esterni:

    CREATE LOGIN data_explorer WITH PASSWORD = 'My Very Strong Password 1234!';
    

    Creare quindi un utente del database in DataExplorationDB per l'account di accesso precedente e concedere l'autorizzazione ADMINISTER DATABASE BULK OPERATIONS.

    CREATE USER data_explorer FOR LOGIN data_explorer;
    GO
    GRANT ADMINISTER DATABASE BULK OPERATIONS TO data_explorer;
    GO
    
  5. Esplorare il contenuto del file usando il percorso relativo e l'origine dati:

    SELECT
        TOP 100 *
    FROM
        OPENROWSET(
                BULK '/users/NYCTripSmall.parquet',
                DATA_SOURCE = 'ContosoLake',
                FORMAT='PARQUET'
        ) AS [result]
    
  6. Pubblicare le modifiche nell'area di lavoro.

Il database di esplorazione dei dati è solo un semplice segnaposto in cui è possibile archiviare gli oggetti utilità. Il pool di Synapse SQL consente di eseguire molte altre operazioni e creare un data warehouse logico, ovvero un livello relazionale basato sulle origini dati di Azure. Altre informazioni sulla creazione di un data warehouse logico in questa esercitazione.

Passaggi successivi