Configurare database SQL di Azure in un'attività di copia

Questo articolo illustra come usare l'attività di copia nella pipeline di dati per copiare dati da e in database SQL di Azure.

Configurazione supportata

Per la configurazione di ogni scheda nell'attività di copia, passare rispettivamente alle sezioni seguenti.

Generali

Fare riferimento alle indicazioni generali sulle impostazioni per configurare la scheda Impostazioni generali .

Origine

Le proprietà seguenti sono supportate per database SQL di Azure nella scheda Origine di un'attività di copia.

Screenshot che mostra la scheda di origine e l'elenco delle proprietà.

Sono necessarie le proprietà seguenti:

  • Tipo di archivio dati: selezionare Esterno.
  • Connessione ion: selezionare una connessione database SQL di Azure dall'elenco delle connessioni. Se la connessione non esiste, creare una nuova connessione database SQL di Azure selezionando Nuovo.
  • tipo di Connessione: selezionare database SQL di Azure.
  • Tabella: selezionare la tabella nel database dall'elenco a discesa. In alternativa, selezionare Modifica per immettere manualmente il nome della tabella.
  • Anteprima dei dati: selezionare Anteprima dati per visualizzare in anteprima i dati nella tabella.

In Avanzate è possibile specificare i campi seguenti:

  • Usare la query: è possibile scegliere Tabella, Query o Stored procedure. L'elenco seguente descrive la configurazione di ogni impostazione:

    • Tabella: legge i dati dalla tabella specificata in Tabella se si seleziona questo pulsante.

    • Query: specificare la query SQL personalizzata per leggere i dati. Un esempio è select * from MyTable. In alternativa, selezionare l'icona a forma di matita da modificare nell'editor di codice.

      Screenshot che mostra la scelta della query.

    • Stored procedure: usare la stored procedure che legge i dati dalla tabella di origine. L'ultima istruzione SQL deve essere un'istruzione SELECT nella stored procedure.

      • Nome stored procedure: selezionare la stored procedure o specificare manualmente il nome della stored procedure quando si seleziona la casella Modifica per leggere i dati dalla tabella di origine.

      • Parametri della stored procedure: specificare i valori per i parametri della stored procedure. I valori consentiti sono coppie nome-valore. I nomi e le maiuscole/minuscole dei parametri devono corrispondere ai nomi e alla combinazione di maiuscole e minuscole dei parametri della stored procedure.

        Screenshot che mostra le impostazioni della stored procedure.

  • Timeout query (minuti): specificare il timeout per l'esecuzione del comando di query, il valore predefinito è 120 minuti. Se per questa proprietà è impostato un parametro, i valori consentiti sono timepan, ad esempio "02:00:00" (120 minuti).

    Screenshot che mostra le impostazioni di timeout della query.

  • Livello di isolamento: specifica il comportamento di blocco delle transazioni per l'origine SQL. I valori consentiti sono: None, ReadCommitted, ReadUncommitted, RepeatableRead, Serializable o Snapshot. Se non specificato, viene utilizzato il livello di isolamento Nessuno . Per altri dettagli, vedere IsolationLevel Enum .

    Screenshot che mostra le impostazioni del livello di isolamento.

  • Opzione di partizione: specificare le opzioni di partizionamento dei dati usate per caricare i dati da database SQL di Azure. I valori consentiti sono: Nessuno (impostazione predefinita), Partizioni fisiche della tabella e Intervallo dinamico. Quando un'opzione di partizione è abilitata (ovvero non Nessuno), il grado di parallelismo per caricare simultaneamente i dati da un database SQL di Azure è controllato dall'impostazione di copia parallela nell'attività di copia.

    Screenshot che mostra le impostazioni dell'opzione Partizione.

    • Nessuno: scegliere questa impostazione per non usare una partizione.

    • Partizioni fisiche della tabella: quando si usa una partizione fisica, la colonna di partizione e il meccanismo vengono determinati automaticamente in base alla definizione della tabella fisica.

    • Intervallo dinamico: quando si usa una query con abilitazione parallela, è necessario il parametro di partizione dell'intervallo(?AdfDynamicRangePartitionCondition). Query di esempio: SELECT * FROM <TableName> WHERE ?AdfDynamicRangePartitionCondition.

      • Nome colonna partizione: specificare il nome della colonna di origine nel tipo integer o date/datetime (int, smallint, datedatetimedatetime2bigintsmalldatetimeo datetimeoffset) usato dal partizionamento di intervalli per la copia parallela. Se non specificato, l'indice o la chiave primaria della tabella vengono rilevati automaticamente e usati come colonna di partizione.
      • Limite superiore della partizione: specificare il valore massimo della colonna di partizione per la suddivisione dell'intervallo di partizioni. Questo valore viene usato per decidere lo stride della partizione, non per filtrare le righe nella tabella. Tutte le righe nella tabella o nel risultato della query vengono partizionate e copiate.
      • Limite inferiore della partizione: specificare il valore minimo della colonna di partizione per la suddivisione dell'intervallo di partizioni. Questo valore viene usato per decidere lo stride della partizione, non per filtrare le righe nella tabella. Tutte le righe nella tabella o nel risultato della query vengono partizionate e copiate.
  • Colonne aggiuntive: aggiungere altre colonne di dati per archiviare il percorso relativo o il valore statico dei file di origine. L'espressione è supportata per quest'ultima. Per altre informazioni, vedere Aggiungere altre colonne durante la copia.

Destinazione

Le proprietà seguenti sono supportate per database SQL di Azure nella scheda Destinazione di un'attività di copia.

Screenshot che mostra la scheda Destinazione.

Sono necessarie le proprietà seguenti:

  • Tipo di archivio dati: selezionare Esterno.
  • Connessione ion: selezionare una connessione database SQL di Azure dall'elenco delle connessioni. Se la connessione non esiste, creare una nuova connessione database SQL di Azure selezionando Nuovo.
  • tipo di Connessione: selezionare database SQL di Azure.
  • Tabella: selezionare la tabella nel database dall'elenco a discesa. In alternativa, selezionare Modifica per immettere manualmente il nome della tabella.
  • Anteprima dei dati: selezionare Anteprima dati per visualizzare in anteprima i dati nella tabella.

In Avanzate è possibile specificare i campi seguenti:

  • Comportamento di scrittura: definisce il comportamento di scrittura quando l'origine è file da un archivio dati basato su file. È possibile scegliere Inserisci, Upsert o Stored procedure.

    Screenshot che mostra la scheda comportamento di scrittura.

    • Inserisci: scegliere questa opzione se i dati di origine hanno inserimenti.

    • Upsert: scegliere questa opzione se i dati di origine hanno sia inserimenti che aggiornamenti.

      • Usare TempDB: specificare se usare una tabella temporanea globale o una tabella fisica come tabella provvisoria per upsert. Per impostazione predefinita, il servizio usa la tabella temporanea globale come tabella provvisoria e questa casella di controllo è selezionata.

        Screenshot che mostra l'opzione Usa TempDB.

      • Selezionare lo schema del database utente: quando la casella di controllo Usa TempDB non è selezionata, specificare lo schema provvisorio per la creazione di una tabella provvisoria se viene usata una tabella fisica.

        Nota

        È necessario disporre dell'autorizzazione per la creazione e l'eliminazione di tabelle. Per impostazione predefinita, una tabella provvisoria condividerà lo stesso schema di una tabella di destinazione.

        Screenshot che mostra che non selezionare Usa TempDB.

      • Colonne chiave: specificare i nomi di colonna per l'identificazione di riga univoca. È possibile usare una singola chiave o una serie di chiavi. Se non specificato, viene usata la chiave primaria.

    • Stored procedure: usare la stored procedure che definisce come applicare i dati di origine in una tabella di destinazione. Questa stored procedure viene richiamata per batch.

      • Nome stored procedure: selezionare la stored procedure o specificare manualmente il nome della stored procedure quando si seleziona la casella Modifica per leggere i dati dalla tabella di origine.

      • Parametri della stored procedure: specificare i valori per i parametri della stored procedure. I valori consentiti sono coppie nome-valore. I nomi e le maiuscole/minuscole dei parametri devono corrispondere ai nomi e alla combinazione di maiuscole e minuscole dei parametri della stored procedure.

        Screenshot che mostra le impostazioni della stored procedure.

  • Blocco tabella inserimento bulk: scegliere o No. Utilizzare questa impostazione per migliorare le prestazioni di copia durante un'operazione di inserimento bulk in una tabella senza indici da più client. Per altre informazioni, vedere BULK IN edizione Standard RT (Transact-SQL)

  • Opzione Tabella: specifica se creare automaticamente la tabella di destinazione se la tabella non esiste in base allo schema di origine. Scegliere Nessuna o Crea automaticamente tabella. La creazione automatica della tabella non è supportata quando la destinazione specifica una stored procedure.

  • Script di pre-copia: specificare uno script per l'attività di copia da eseguire prima di scrivere dati in una tabella di destinazione in ogni esecuzione. È possibile usare questa proprietà per pulire i dati precaricati.

  • Timeout del batch di scrittura: specificare il tempo di attesa per il completamento dell'operazione di inserimento batch prima del timeout. Il valore consentito è timespan. Il valore predefinito è "00:30:00" (30 minuti).

  • Dimensioni batch di scrittura: specificare il numero di righe da inserire nella tabella SQL per batch. Il valore consentito è integer (numero di righe). Per impostazione predefinita, il servizio determina in modo dinamico le dimensioni del batch appropriate in base alle dimensioni della riga.

  • Numero massimo di connessioni simultanee: specificare il limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee.

  • Disabilitare l'analisi delle metriche delle prestazioni: questa impostazione viene usata per raccogliere metriche, ad esempio DTU, DWU, UR e così via, per l'ottimizzazione e le raccomandazioni sulle prestazioni di copia. Se si è interessati a questo comportamento, selezionare questa casella di controllo.

Mapping

Per la configurazione della scheda Mapping, se non si applica database SQL di Azure con la tabella di creazione automatica come destinazione, passare a Mapping.

Se si applicano database SQL di Azure con la tabella di creazione automatica come destinazione, ad eccezione della configurazione in Mapping, è possibile modificare il tipo per le colonne di destinazione. Dopo aver selezionato Importa schemi, è possibile specificare il tipo di colonna nella destinazione.

Ad esempio, il tipo per la colonna ID nell'origine è int ed è possibile modificarlo in tipo float quando si esegue il mapping alla colonna di destinazione.

Screenshot del mapping del tipo di colonna di destinazione.

Impostazione

Per Impostazioni configurazione della scheda, passare a Configurare le altre impostazioni nella scheda Impostazioni.

Riepilogo tabella

Le tabelle seguenti contengono altre informazioni sull'attività di copia in database SQL di Azure.

Origine

Nome Descrizione Valore Richiesto Proprietà script JSON
Tipo di archivio dati Tipo di archivio dati. Esterno /
Connessione Connessione all'archivio dati di origine. <connessione> connection
Tipo di connessione Tipo di connessione. Selezionare database SQL di Azure. Database SQL di Azure /
Tabella Tabella dati di origine. <nome della tabella di destinazione> Schema
table
Usare la query Query SQL personalizzata per leggere i dati. •Nessuno
•Query
• Stored procedure
No

• sqlReaderQuery
• sqlReaderStoredProcedureName, storedProcedureParameters
Timeout query Il timeout per l'esecuzione del comando di query, il valore predefinito è 120 minuti. timespan No queryTimeout
Livello di isolamento Specifica il comportamento di blocco della transazione per l'origine SQL. •Nessuno
•Readcommitted
• ReadUncommitted
• RepeatableRead
•Serializzabile
•Snapshot
No isolationLevel
Opzione di partizione Opzioni di partizionamento dei dati usate per caricare dati da database SQL di Azure. •Nessuno
• Partizioni fisiche della tabella
• Intervallo dinamico
No partitionOption:
• PhysicalPartitionsOfTable
• DynamicRange
Colonne aggiuntive Aggiungere altre colonne di dati per archiviare il percorso relativo o il valore statico dei file di origine. L'espressione è supportata per quest'ultima. • Name
•Valore
No additionalColumns:
•Nome
•Valore

Destinazione

Nome Descrizione Valore Richiesto Proprietà script JSON
Tipo di archivio dati Tipo di archivio dati. Esterno /
Connessione Connessione all'archivio dati di destinazione. <connessione > connection
Tipo di connessione Tipo di connessione. Selezionare database SQL di Azure. Database SQL di Azure /
Tabella Tabella dei dati di destinazione. <nome della tabella di destinazione> Schema
table
Comportamento di scrittura Definisce il comportamento di scrittura quando l'origine è file da un archivio dati basato su file. •Inserire
• Upsert
• Stored procedure
No writeBehavior:
•Inserire
• upsert
• sqlWriterStoredProcedureName, sqlWriterTableType, storedProcedureParameters
Blocco tabella inserimento bulk Utilizzare questa impostazione per migliorare le prestazioni di copia durante un'operazione di inserimento bulk in una tabella senza indici da più client. Sì o no No sqlWriterUseTableLock:
true o false
Opzione Tabella Specifica se creare automaticamente la tabella di destinazione se non esiste in base allo schema di origine. •Nessuno
• Creazione automatica tabella
No Tableoption:
• Creazione automatica
Script di pre-copia Script per l'esecuzione dell'attività di copia prima di scrivere dati in una tabella di destinazione in ogni esecuzione. È possibile usare questa proprietà per pulire i dati precaricati. <script di pre-copia>
(string)
No preCopyScript
Timeout del batch di scrittura Tempo di attesa per il completamento dell'operazione di inserimento batch prima del timeout. Il valore consentito è timespan. Il valore predefinito è "00:30:00" (30 minuti). timespan No writeBatchTimeout
Dimensioni batch di scrittura Numero di righe da inserire nella tabella SQL per batch. Per impostazione predefinita, il servizio determina in modo dinamico le dimensioni del batch appropriate in base alle dimensioni della riga. <numero di righe>
(intero)
No writeBatchSize
Numero massimo di connessioni simultanee Limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee. <limite massimo di connessioni simultanee>
(intero)
No maxConcurrentConnections
Disabilitare l'analisi delle metriche delle prestazioni Questa impostazione viene usata per raccogliere metriche, ad esempio DTU, DWU, UR e così via, per ottimizzare le prestazioni di copia e consigli. Se si è interessati a questo comportamento, selezionare questa casella di controllo. selezionare o deselezionare No disableMetricsCollection:
true o false