Inserire dati in un pool SQL dedicato

Articolo
05/20/2024

Questo articolo spiega come inserire dati da un account di archiviazione di Azure Data Lake Gen 2 in un pool SQL dedicato in Azure Synapse Analytics.

Prerequisiti

Sottoscrizione di Azure: se non si dispone di una sottoscrizione di Azure, prima di iniziare, creare un account Azure gratuito.
Account di archiviazione di Azure: usare Azure Data Lake Storage Gen 2 come archivio dati di origine. Se non si ha un account di archiviazione, vedere Creare un account di archiviazione di Azure per informazioni su come crearne uno.
Azure Synapse Analytics: usare un pool SQL dedicato come archivio dati sink.
- Se non si dispone di un'area di lavoro Synapse esistente, vedere Creazione di un'area di lavoro Synapse
- Se non si dispone di un pool SQL dedicato esistente, vedere Creare un pool SQL dedicato.

Creare servizi collegati

In Azure Synapse Analytics si usano i servizi collegati per definire le informazioni di connessione ad altri servizi. In questa sezione si aggiungerà un servizio collegato Azure Synapse Analytics e Azure Data Lake Storage Gen2.

Aprire l'interfaccia utente di Azure Synapse Analytics e passare alla scheda Gestisci.
In Connessioni esterne selezionare Servizi collegati.
Per aggiungere un servizio collegato, selezionare Nuovo.
Selezionare il riquadro Azure Data Lake Storage Gen2 nell'elenco e scegliere Continua.
Immettere le credenziali di autenticazione. I tipi di autenticazione attualmente supportati sono la chiave dell'account, l'entità servizio e l'identità gestita. Selezionare Test connessione per verificare che le credenziali siano corrette. Selezionare Create (Crea) al termine.
Ripetere i passaggi da 3 a 5, ma invece di Azure Data Lake Storage Gen2 selezionare il riquadro Azure Synapse Analytics e immettere le credenziali di connessione corrispondenti. Per Azure Synapse Analytics, sono attualmente supportate l'autenticazione SQL, l'identità gestita e l'entità servizio.

Creare una pipeline

Una pipeline contiene il flusso logico per un'esecuzione di un set di attività. In questa sezione verrà creata una pipeline contenente un'attività di copia che inserisce i dati da ADLS Gen2 in un pool SQL dedicato.

Passare alla scheda Integrazione. Selezionare l'icona con il segno più accanto all'intestazione della pipeline e quindi selezionare Pipeline.
In Move and Transform (Sposta e trasforma) nel riquadro delle attività trascinare Copia dati sul canvas della pipeline.
Selezionare l'attività di copia e passare alla scheda Origine. Selezionare Nuovo per creare un nuovo set di dati di origine.
Selezionare Azure Data Lake Storage Gen2 come archivio dati e scegliere Continua.
Selezionare DelimitedText come formato e scegliere Continua.
Nel riquadro di impostazione delle proprietà selezionare il servizio collegato Azure Data Lake Storage creato. Specificare il percorso del file dei dati di origine e indicare se la prima riga contiene un'intestazione. È possibile importare lo schema dall'archivio file o da un file di esempio. Al termine, selezionare OK.
Passare alla scheda Sink. Selezionare Nuovo per creare un nuovo set di dati sink.
Selezionare Azure Synapse Analytics come archivio dati e scegliere Continua.
Nel riquadro di impostazione delle proprietà selezionare il servizio collegato Azure Synapse Analytics creato. Se si sta scrivendo su una tabella esistente, selezionarla dall'elenco a discesa. Altrimenti selezionare Modifica e immettere il nome della nuova tabella. Al termine, selezionare OK.
Se si sta creando una tabella, abilitare Creazione automatica tabella nel campo dell'opzione tabella.

Eseguire il debug della pipeline e pubblicarla

Dopo aver completato la configurazione della pipeline, è possibile eseguire il debug prima di pubblicare gli artefatti per verificare che tutto sia corretto.

Per eseguire il debug della pipeline, selezionare Debug sulla barra degli strumenti. Lo stato dell'esecuzione della pipeline verrà visualizzato nella scheda Output nella parte inferiore della finestra.
Quando è possibile eseguire correttamente la pipeline, nella barra degli strumenti superiore selezionare Pubblica tutto. Questa azione pubblica le entità create (set di dati e pipeline) create nel servizio Synapse Analytics.
Attendere fino alla visualizzazione del messaggio Pubblicazione riuscita. Per visualizzare i messaggi di notifica, selezionare il pulsante a forma di campana in alto a destra.

Attivare e monitorare la pipeline

In questo passaggio si attiverà manualmente la pipeline pubblicata nel passaggio precedente.

Selezionare Aggiungi trigger nella barra degli strumenti, quindi selezionare Attiva adesso. Nella pagina Pipeline Run (Esecuzione di pipeline) selezionare Fine.
Passare alla scheda Monitora nella barra laterale sinistra. Viene visualizzata un'esecuzione della pipeline attivata da un trigger manuale. È possibile usare i collegamenti nella colonna Azioni per visualizzare i dettagli delle attività ed eseguire di nuovo la pipeline.
Per visualizzare le esecuzioni di attività associate all'esecuzione della pipeline, selezionare il collegamento View Activity Runs (Visualizza le esecuzioni di attività) nella colonna Azioni. In questo esempio è presente una sola attività, quindi nell'elenco viene visualizzata una sola voce. Per informazioni dettagliate sull'operazione di copia, selezionare il collegamento Dettagli (icona a forma di occhiali) nella colonna Azioni. Selezionare Pipeline Runs (Esecuzioni di pipeline) in alto per tornare alla visualizzazione delle esecuzioni. Per aggiornare la visualizzazione, selezionare Aggiorna.
Verificare che i dati siano scritti correttamente nel pool SQL dedicato.

Passaggi successivi

Per altre informazioni sull'integrazione dei dati per Azure Synapse Analytics, vedere l'articolo Inserimento di dati in Azure Data Lake Storage Gen2.

Condividi tramite