Condividi tramite


Come copiare dati usando l'attività di copia

Nella pipeline di dati è possibile usare il attività Copy per copiare i dati tra gli archivi dati che si trovano nel cloud.

Dopo aver copiato i dati, è possibile usare altre attività per trasformarli e analizzarli ulteriormente. L'attività Copy può essere usata anche per pubblicare risultati di trasformazione e analisi a scopi di business intelligence (BI) e per l'utilizzo da parte delle applicazioni.

Per copiare dati da un'origine a una destinazione, il servizio che esegue il attività Copy esegue questi passaggi:

  1. Legge i dati dall'archivio dati di origine.
  2. Esegue la serializzazione/deserializzazione, compressione/decompressione, il mapping di colonne e così via. Esegue queste operazioni in base alla configurazione.
  3. Scrive i dati nell'archivio dati di destinazione.

Prerequisiti

Per iniziare, è necessario completare i prerequisiti seguenti:

  • Un account tenant di Microsoft Fabric con una sottoscrizione attiva. Creare un account gratuitamente.

  • Assicurarsi di disporre di un'area di lavoro abilitata per Microsoft Fabric.

Aggiungere un'attività di copia usando l'assistente copia

Seguire questa procedura per configurare l'attività di copia usando l'assistente copia.

Iniziare con l'assistente copia

  1. Aprire una pipeline di dati esistente o creare una nuova pipeline di dati.

  2. Selezionare Copia dati nell'area di disegno per aprire lo strumento Copia assistente per iniziare. In alternativa, selezionare Usa assistente copia dall'elenco a discesa Copia dati nella scheda Attività della barra multifunzione.

    Screenshot che mostra le opzioni per l'apertura dell'Assistente copia.

Configurare l'origine

  1. Selezionare un tipo di origine dati dalla categoria. Si useranno Archiviazione BLOB di Azure come esempio. Selezionare Archiviazione BLOB di Azure e quindi avanti.

    Screenshot della schermata Scegli origine dati.

    Screenshot che mostra dove selezionare l'origine dati corretta.

  2. Creare una connessione all'origine dati selezionando Crea nuova connessione.

    Screenshot che mostra dove selezionare Nuova connessione.

    Dopo aver selezionato Crea nuova connessione, immettere le informazioni di connessione necessarie e quindi selezionare Avanti. Per informazioni dettagliate sulla creazione della connessione per ogni tipo di origine dati, è possibile fare riferimento a ogni articolo del connettore.

    Se si dispone di connessioni esistenti, è possibile selezionare Connessione esistente e selezionare la connessione dall'elenco a discesa.

    Screenshot che mostra la connessione esistente.

  3. Scegliere il file o la cartella da copiare in questo passaggio di configurazione di origine e quindi selezionare Avanti.

    Screenshot che mostra dove selezionare i dati da copiare.

Configurare la destinazione

  1. Selezionare un tipo di origine dati dalla categoria. Si useranno Archiviazione BLOB di Azure come esempio. Selezionare Archiviazione BLOB di Azure e quindi selezionare Avanti.

    Screenshot che mostra come selezionare Archiviazione BLOB di Azure.

  2. È possibile creare una nuova connessione che collega a un nuovo account Archiviazione BLOB di Azure seguendo i passaggi della sezione precedente o usando una connessione esistente dall'elenco a discesa della connessione. Le funzionalità di Test connessione e Modifica sono disponibili per ogni connessione selezionata.

    Screenshot che mostra le opzioni di connessione dati.

  3. Configurare ed eseguire il mapping dei dati di origine alla destinazione. Selezionare quindi Avanti per completare le configurazioni di destinazione.

    Screenshot della schermata Mappa a destinazione.

    Screenshot di Connetti alla destinazione dati.

    Nota

    È possibile usare un singolo gateway dati locale solo all'interno dello stesso attività Copy. Se sia l'origine che il sink sono origini dati locali, devono usare lo stesso gateway. Per spostare i dati tra origini dati locali con gateway diversi, è necessario copiare il primo gateway in un'origine cloud intermedia in un'unica attività Copy. È quindi possibile usare un altro attività Copy per copiarlo dall'origine cloud intermedia usando il secondo gateway.

Esaminare e creare l'attività di copia

  1. Esaminare le impostazioni dell'attività di copia nei passaggi precedenti e selezionare OK per completare. In alternativa, è possibile tornare ai passaggi precedenti per modificare le impostazioni, se necessario nello strumento.

    Screenshot che mostra la schermata Rivedi e crea.

Al termine, l'attività di copia verrà quindi aggiunta all'area di disegno della pipeline di dati. Tutte le impostazioni, incluse le impostazioni avanzate per questa attività di copia, sono disponibili nelle schede quando è selezionata.

Screenshot che mostra un'attività di copia nell'area di disegno della pipeline di dati.

È ora possibile salvare la pipeline di dati con questa singola attività di copia o continuare a progettare la pipeline di dati.

Aggiungere direttamente un'attività di copia

Seguire questa procedura per aggiungere direttamente un'attività di copia.

Aggiungere un'attività di copia

  1. Aprire una pipeline di dati esistente o creare una nuova pipeline di dati.

  2. Aggiungere un'attività di copia selezionando Aggiungi attività> pipeline attività Copy oppure selezionando Copia dati>Aggiungi all'area di disegno nella scheda Attività.

    Screenshot che mostra due modi per aggiungere un'attività di copia.

Configurare le impostazioni generali nella scheda Generale

Per informazioni su come configurare le impostazioni generali, vedere Generale.

Configurare l'origine nella scheda origine

  1. Selezionare + Nuovo accanto a Connessione per creare una connessione all'origine dati.

    Screenshot che mostra dove selezionare Nuovo.

    1. Scegliere il tipo di origine dati dalla finestra popup. Si userà database SQL di Azure come esempio. Selezionare Database SQL di Azure e quindi selezionare Continua.

      Screenshot che mostra come selezionare l'origine dati.

    2. Passa alla pagina di creazione della connessione. Immettere le informazioni di connessione necessarie nel pannello e quindi selezionare Crea. Per informazioni dettagliate sulla creazione della connessione per ogni tipo di origine dati, è possibile fare riferimento a ogni articolo del connettore.

      Screenshot che mostra la pagina Nuova connessione.

    3. Dopo aver creato correttamente la connessione, viene visualizzata nuovamente la pagina della pipeline di dati. Selezionare quindi Aggiorna per recuperare la connessione creata dall'elenco a discesa. È anche possibile scegliere una connessione database SQL di Azure esistente direttamente dall'elenco a discesa se è già stata creata in precedenza. Le funzionalità di Test connessione e Modifica sono disponibili per ogni connessione selezionata. Selezionare quindi database SQL di Azure in Tipo di connessione.

      Screenshot che mostra dove aggiornare la connessione.

  2. Specificare una tabella da copiare. Selezionare Anteprima dei dati per visualizzare in anteprima la tabella di origine. È anche possibile usare query e stored procedure per leggere i dati dall'origine.

    Screenshot che mostra le opzioni delle impostazioni della tabella di origine.

  3. Espandere Avanzate per impostazioni più avanzate.

    Screenshot delle impostazioni avanzate.

Configurare la destinazione nella scheda destinazione

  1. Scegliere il tipo di destinazione. Potrebbe trattarsi dell'archivio dati interno di prima classe dall'area di lavoro, ad esempio Lakehouse o dagli archivi dati esterni. Si userà Lakehouse come esempio.

    Screenshot che mostra dove selezionare il tipo di destinazione.

  2. Scegliere di usare Lakehouse nel tipo di archivio dati dell'area di lavoro. Selezionare + Nuovo e passare alla pagina di creazione lakehouse. Specificare il nome di Lakehouse e quindi selezionare Crea.

    Screenshot che mostra la creazione di Lakehouse.

  3. Dopo aver creato correttamente la connessione, viene visualizzata nuovamente la pagina della pipeline di dati. Selezionare quindi Aggiorna per recuperare la connessione creata dall'elenco a discesa. È anche possibile scegliere una connessione Lakehouse esistente dall'elenco a discesa direttamente se è già stata creata in precedenza.

    Screenshot che mostra la selezione della connessione.

  4. Specificare una tabella o impostare il percorso del file per definire il file o la cartella come destinazione. In questo caso selezionare Tabelle e specificare una tabella per scrivere dati.

    Screenshot che mostra dove trovare le impostazioni della tabella.

  5. Espandere Avanzate per impostazioni più avanzate.

    Screenshot delle opzioni avanzate.

È ora possibile salvare la pipeline di dati con questa singola attività di copia o continuare a progettare la pipeline di dati.

Configurare i mapping nella scheda Mapping

Se il connettore applicato supporta il mapping, è possibile passare alla scheda Mapping per configurare il mapping.

  1. Selezionare Importa schemi per importare lo schema dei dati.

    Screenshot delle impostazioni di mapping 1.

  2. È possibile visualizzare il mapping automatico. Specificare la colonna Origine e la colonna Destinazione . Se si crea una nuova tabella nella destinazione, è possibile personalizzare il nome della colonna di destinazione qui. Se si desidera scrivere dati nella tabella di destinazione esistente, non è possibile modificare il nome della colonna di destinazione esistente. È anche possibile visualizzare il tipo di colonne di origine e di destinazione.

    Screenshot delle impostazioni di mapping 2.

Inoltre, è possibile selezionare + Nuovo mapping per aggiungere nuovo mapping, selezionare Cancella per cancellare tutte le impostazioni di mapping e selezionare Reimposta per reimpostare tutta la colonna origine mapping.

Configurare la conversione del tipo

Espandere Impostazioni di conversione dei tipi per configurare la conversione del tipo, se necessario.

Screenshot della conversione del tipo di mapping.

Per informazioni dettagliate sull'impostazione, vedere la tabella seguente.

Impostazione Descrizione
Consenti troncamento dei dati Consente il troncamento dei dati durante la conversione dei dati di origine in destinazione con un tipo diverso durante la copia. Ad esempio, da decimale a integer, da DatetimeOffset a Datetime.
Considerare booleano come numero Considerare booleano come numero. Ad esempio, considerare true come 1.
Formato data Stringa di formato durante la conversione tra date e stringhe, ad esempio "aaaa-MM-gg". Per altre informazioni, vedere Stringhe di formato di data e ora personalizzato.

La colonna date può essere letta come tipo di data per:
 • Amazon RDS per SQL Server
 • database SQL di Azure
 • database SQL di Azure Istanza gestita
 • Azure Synapse Analytics
 • Formato testo delimitato
 • Tabella lakehouse
 • Formato Parquet
 • SQL Server
Formato DateTime Stringa di formato durante la conversione tra date senza differenza di fuso orario e stringhe. Ad esempio, "aa-MM-gg HH:mm:ss.fff".
Formato DateTimeOffset Stringa di formato durante la conversione tra date con offset del fuso orario e stringhe. Ad esempio, "aaaa-MM-gg HH:mm:ss.fff zzz".
Formato TimeSpan Stringa di formato durante la conversione tra periodi di tempo e stringhe. Ad esempio, "dd.hh:mm:ss".
Impostazioni cultura Informazioni sulle impostazioni cultura da utilizzare durante la conversione dei tipi. Ad esempio, "en-us", "fr-fr".

Configurare le altre impostazioni nella scheda Impostazioni

La scheda Impostazioni contiene le impostazioni delle prestazioni, della gestione temporanea e così via.

Screenshot della scheda Impostazioni.

Per la descrizione di ogni impostazione, vedere la tabella seguente.

Impostazione Descrizione
Ottimizzazione della velocità effettiva intelligente Specificare per ottimizzare la velocità effettiva. È possibile scegliere tra:
• Auto
Standard
Bilanciato
Massimo
Quando si sceglie Auto, l'impostazione ottimale viene applicata dinamicamente in base alla coppia di destinazione di origine e al modello di dati. È anche possibile personalizzare la velocità effettiva e il valore personalizzato può essere pari a 2-256, mentre un valore più alto implica ulteriori guadagni.
Grado di parallelismo di copia Specificare il grado di parallelismo usato dal caricamento dei dati.
Tolleranza di errore Quando si seleziona questa opzione, è possibile ignorare alcuni errori che si sono verificati durante il processo di copia. Ad esempio, righe incompatibili tra l'archivio di origine e di destinazione, il file eliminato durante lo spostamento dei dati e così via.
Abilitazione della registrazione Quando si seleziona questa opzione, è possibile registrare file copiati, file ignorati e righe
Abilitare la gestione temporanea Specificare se copiare i dati tramite un archivio di staging provvisorio. Abilitare la gestione temporanea solo per gli scenari vantaggiosi.
Connessione dell'account di gestione temporanea Quando si seleziona Abilita gestione temporanea, specificare la connessione di un'origine dati di archiviazione di Azure come archivio di staging provvisorio. Selezionare + Nuovo per creare una connessione di staging se non è disponibile.

Configurare i parametri in un'attività di copia

I parametri possono essere usati per controllare il comportamento di una pipeline e le relative attività. È possibile usare Aggiungi contenuto dinamico per specificare i parametri per le proprietà dell'attività di copia. Si userà ora Lakehouse/Data Warehouse/KQL Database come esempio per vedere come usarlo.

  1. Nell'origine o nella destinazione, dopo aver selezionato Area di lavoro come tipo di archivio dati e specificando Il database KQL del data warehouse/Lakehouse/come tipo di archivio dati dell'area di lavoro, selezionare Aggiungi contenuto dinamico nell'elenco a discesa di Lakehouse o Data Warehouse o KQL Database.

  2. Nel riquadro popup Aggiungi contenuto dinamico, nella scheda Parametri selezionare +.

    Screenshot che mostra la pagina Aggiungi contenuto dinamico.

  3. Specificare il nome per il parametro e assegnargli un valore predefinito, se necessario, oppure specificare il valore per il parametro dopo aver selezionato Esegui nella pipeline.

    Screenshot che mostra la creazione di un nuovo parametro.

    Si noti che il valore del parametro deve essere Lakehouse/Data Warehouse/KQL ID oggetto database. Per ottenere l'ID oggetto Database Lakehouse/Data Warehouse/KQL, aprire il database Lakehouse/Data Warehouse/KQL nell'area di lavoro e l'ID è successivo /lakehouses/o /datawarehouses/ /databases/ nell'URL.

    • ID oggetto Lakehouse:

      Screenshot che mostra l'ID oggetto Lakehouse.

    • ID oggetto data warehouse:

      Screenshot che mostra l'ID oggetto data warehouse.

    • ID oggetto database KQL:

      Screenshot che mostra l'ID oggetto database KQL.

  4. Selezionare Salva per tornare al riquadro Aggiungi contenuto dinamico. Selezionare quindi il parametro in modo che venga visualizzato nella casella dell'espressione. Quindi, seleziona OK. Si tornerà alla pagina della pipeline e si noterà che l'espressione del parametro è specificata dopo l'ID/oggetto data warehouse dell'OGGETTO Lakehouse ID/KQL Database ID.

    Screenshot che mostra la selezione del parametro.