Avvio rapido: inserire dati con Azure Synapse Pipelines (Anteprima)

Articolo
05/16/2024

Questo avvio rapido illustra come caricare dati da un'origine dati nel pool Esplora dati di Azure Synapse.

Prerequisiti

Una sottoscrizione di Azure. Creare un account Azure gratuito.
Creare un pool Esplora dati usando Synapse Studio o il portale di Azure

Creare un database di Esplora dati.

Nel riquadro sinistro di Synapse Studio selezionare Dati.

Selezionare + (Aggiungi nuova risorsa) >Pool Esplora dati e usare le informazioni seguenti:

Impostazione	Valore suggerito	Descrizione
Nome pool	contosodataexplorer	Nome del pool Esplora dati da usare
Nome	TestDatabase	Il nome del database deve essere univoco all'interno del cluster.
Periodo di conservazione predefinito	365	Intervallo di tempo (in giorni) per cui è garantito che i dati rimangano disponibili per le query. L'intervallo di tempo viene misurato dal momento in cui i dati vengono inseriti.
Periodo cache predefinito	31	L'intervallo di tempo (in giorni) per cui mantenere i dati sottoposti frequentemente a query disponibili nell'archiviazione su unità SSD o nella RAM, invece che nell'archiviazione a lungo termine.

Selezionare Crea per creare il database. Per la creazione è in genere necessario meno di un minuto.

Crea una tabella
1. Nel riquadro sinistro di Synapse Studio selezionare Sviluppo.
2. In Script KQL selezionare + (Aggiungi nuova risorsa) >Script KQL. Nel riquadro a destra è possibile assegnare un nome allo script.
3. Nel menu Connetti a selezionare contosodataexplorer.
4. Nel menu Usa database selezionare TestDatabase.
5. Incollare il comando seguente e selezionare Esegui per creare una tabella.
```
.create table StormEvents (StartTime: datetime, EndTime: datetime, EpisodeId: int, EventId: int, State: string, EventType: string, InjuriesDirect: int, InjuriesIndirect: int, DeathsDirect: int, DeathsIndirect: int, DamageProperty: int, DamageCrops: int, Source: string, BeginLocation: string, EndLocation: string, BeginLat: real, BeginLon: real, EndLat: real, EndLon: real, EpisodeNarrative: string, EventNarrative: string, StormSummary: dynamic)
```
Suggerimento

Verificare che la tabella è stata creata correttamente. Nel riquadro a sinistra selezionare Dati, selezionare il contosodataexplorer nel menu Altro e quindi selezionare Aggiorna. In contosodataexplorer espandere Tabelle e assicurarsi che la tabella StormEvents venga visualizzata nell'elenco.
Ottenere gli endpoint di query e inserimento dati. Per configurare il servizio collegato, è necessario l'endpoint Query.
1. Nel riquadro sinistro di Synapse Studio selezionare Gestisci>Pool Esplora dati.
2. Selezionare il pool Esplora dati da usare per visualizzarne i dettagli.
3. Prendere nota degli endpoint di query e inserimento dati. Usare l'endpoint Query come cluster durante la configurazione delle connessioni al pool Esplora dati. Quando si configurano gli SDK per l'inserimento dati, usare l'endpoint di inserimento dati.

Creare un servizio collegato

In Azure Synapse Analytics si usano i servizi collegati per definire le informazioni di connessione ad altri servizi. In questa sezione si creerà un servizio collegato per Esplora dati di Azure.

Nel riquadro sinistro di Synapse Studio selezionare Gestisci>Servizi collegati.
Selezionare + Nuovo.
Selezionare il servizio Esplora dati di Azure dalla raccolta, quindi selezionare Continua.

Nella pagina Nuovi servizi collegati usare le informazioni seguenti:

Impostazione	Valore suggerito	Description
Name	contosodataexplorerlinkedservice	Nome del nuovo servizio collegato di Esplora dati di Azure.
Authentication method	Identità gestita	Metodo di autenticazione per il nuovo servizio.
Metodo di selezione dell'account	Immetti manualmente	Metodo per specificare l'endpoint Query.
Endpoint	https://contosodataexplorer.contosoanalytics.dev.kusto.windows.net	Endpoint Query annotato in precedenza.
Database	TestDatabase	Database in cui si desidera inserire i dati.

Screenshot of the new Linked services details pane, showing the fields that need to be completed for the new service.

Seleziona Verifica connessione per verificare le impostazioni, quindi selezionare Crea.

Creare una pipeline per inserire dati

Una pipeline contiene il flusso logico per un'esecuzione di un set di attività. In questa sezione verrà creata una pipeline contenente un'attività di copia che inserisce i dati dall’origine preferita in un pool Esplora dati.

Nel riquadro sinistro di Synapse Studio selezionare Integra.
Selezionare +>Pipeline. Nel riquadro a destra è possibile assegnare un nome alla pipeline.
In Attività>Sposta e trasforma, trascinare Copia dati nel canvas della pipeline.
Selezionare l'attività di copia e passare alla scheda Origine. Selezionare o creare un nuovo set di dati di origine come origine da cui copiare i dati.
Passare alla scheda Sink. Selezionare Nuovo per creare un nuovo set di dati sink.
Selezionare il set di dati Esplora dati di Azure dalla raccolta, quindi selezionare Continua.

Nel riquadro Imposta proprietà usare le informazioni seguenti, quindi selezionare OK.

Impostazione	Valore suggerito	Description
Name	AzureDataExplorerTable	Nome della nuova pipeline.
Servizio collegato	contosodataexplorerlinkedservice	Servizio collegato creato in precedenza.
Tabella	StormEvents	Tabella creata in precedenza.

Screenshot of the pipeline copy activity set properties pane, showing the fields that need to be completed for the new sink.

Per convalidare la pipeline, selezionare Convalida sulla barra degli strumenti. Il risultato dell'output di convalida della pipeline viene visualizzato sul lato destro della pagina.

Eseguire il debug della pipeline e pubblicarla

Dopo aver completato la configurazione della pipeline, è possibile eseguire il debug prima di pubblicare gli artefatti per verificare che tutto sia corretto.

Selezionare Debug nella barra degli strumenti. Lo stato dell'esecuzione della pipeline verrà visualizzato nella scheda Output nella parte inferiore della finestra.
Una volta che la pipeline viene eseguita correttamente, sulla barra degli strumenti superiore selezionare Pubblica tutto. Questa azione pubblica le entità create (set di dati e pipeline) create nel servizio Synapse Analytics.
Attendere fino alla visualizzazione del messaggio Pubblicazione riuscita. Per visualizzare i messaggi di notifica, selezionare il pulsante a forma di campana in alto a destra.

Attivare e monitorare la pipeline

In questa sezione si attiverà manualmente la pipeline pubblicata nel passaggio precedente.

Selezionare Aggiungi trigger nella barra degli strumenti, quindi selezionare Attiva adesso. Nella pagina Esecuzione della pipeline selezionare OK.
Passare alla scheda Monitora nella barra laterale sinistra. Viene visualizzata un'esecuzione della pipeline attivata da un trigger manuale.
Al termine dell'esecuzione della pipeline, selezionare il collegamento nella colonna Nome pipeline per visualizzare i dettagli dell'esecuzione attività o per eseguire di nuovo la pipeline. In questo esempio è presente una sola attività, quindi nell'elenco viene visualizzata una sola voce.
Per informazioni dettagliate sull'operazione di copia, selezionare il collegamento Dettagli (icona a forma di occhiali) nella colonna Nome attività. È possibile monitorare dettagli come il volume dei dati copiati dall'origine al sink, la velocità effettiva dei dati, i passaggi di esecuzione con la durata corrispondente e le configurazioni usate.
Per tornare alla visualizzazione delle esecuzioni di pipeline, selezionare il collegamento Tutte le esecuzioni della pipeline in alto. Selezionare Aggiorna per aggiornare l'elenco.
Verificare che i dati siano scritti correttamente nel pool Esplora dati.

Condividi tramite

Avvio rapido: inserire dati con Azure Synapse Pipelines (Anteprima)

Prerequisiti

Creare un servizio collegato

Creare una pipeline per inserire dati

Eseguire il debug della pipeline e pubblicarla

Attivare e monitorare la pipeline

Passaggi successivi

Commenti e suggerimenti

Risorse aggiuntive