Configurare Azure Cosmos DB per NoSQL in un'attività di copia

Questo articolo illustra come usare l'attività di copia in una pipeline di dati per copiare dati da e in Azure Cosmos DB per NoSQL.

Configurazione supportata

Per la configurazione di ogni scheda nell'attività di copia, passare rispettivamente alle sezioni seguenti.

Generali

Fare riferimento alle indicazioni generali sulle impostazioni per configurare la scheda Impostazioni generali .

Origine

Le proprietà seguenti sono supportate per Azure Cosmos DB per NoSQL nella scheda Origine di un'attività di copia.

Screenshot showing source tab.

Sono necessarie le tre proprietà seguenti:

  • Tipo di archivio dati: selezionare Esterno.
  • Connessione ion: selezionare una connessione Azure Cosmos DB per NoSQL dall'elenco delle connessioni. Se non esiste alcuna connessione, creare una nuova connessione di Azure Cosmos DB per NoSQL selezionando Nuovo.
  • Contenitore: selezionare il contenitore da usare. Selezionare Modifica per immettere manualmente il nome del contenitore.

In Avanzate è possibile specificare i campi seguenti:

  • Usare la query: è possibile scegliere Tabella o Query come query di utilizzo. Nell'elenco seguente viene descritta la configurazione di ogni impostazione.

    • Tabella: legge i dati dalla tabella specificata in Table.

    • Query: specifica la query di Azure Cosmos DB per leggere i dati.

      Screenshot showing query.

  • Dimensioni pagina: numero di documenti per pagina del risultato della query. Il valore predefinito è "-1", ovvero usare le dimensioni della pagina dinamica lato servizio fino a 1000.

  • Rilevare datetime: indica se rilevare datetime dai valori stringa nei documenti. I valori consentiti sono: true (predefinito), false.

  • Aree preferite: elenco preferito di aree a cui connettersi durante il recupero dei dati da Azure Cosmos DB. Selezionare un'area preferita dall'elenco a discesa dopo aver selezionato Nuovo.

    Screenshot showing preferred regions.

  • Colonne aggiuntive: aggiungere altre colonne di dati per archiviare il percorso relativo o il valore statico dei file di origine. L'espressione è supportata per quest'ultima. Per altre informazioni, vedere Aggiungere altre colonne durante la copia.

    Screenshot showing additional columns.

Destinazione

Le proprietà seguenti sono supportate per Azure Cosmos DB per NoSQL nella scheda Destinazione di un'attività di copia.

Screenshot showing destination tab.

Sono necessarie le tre proprietà seguenti:

  • Tipo di archivio dati: selezionare Esterno.
  • Connessione ion: selezionare una connessione Azure Cosmos DB per NoSQL dall'elenco delle connessioni.
  • Contenitore: selezionare Sfoglia per scegliere il file da copiare o compilare manualmente il percorso.

In Avanzate è possibile specificare i campi seguenti:

  • Comportamento di scrittura: definisce il comportamento di scrittura quando la destinazione è file da un archivio dati basato su file. È possibile scegliere Aggiungi contenuto dinamico, Inserisci o Upsert dall'elenco a discesa.

    • Aggiungere contenuto dinamico: aprire il riquadro Aggiungi contenuto dinamico. Verrà aperto il generatore di espressioni in cui è possibile compilare espressioni da variabili di sistema supportate, output di attività, funzioni e variabili o parametri specificati dall'utente. Per informazioni sul linguaggio delle espressioni, vedere Espressioni e funzioni.

    • Inserisci: scegliere questa opzione se i dati di origine hanno inserimenti.

    • Upsert: il comportamento di upsert consiste nel sostituire il documento se esiste già un documento con lo stesso ID. In caso contrario, inserire il documento.

      Screenshot showing write behavior.

  • Timeout del batch di scrittura: tempo di attesa per il completamento dell'operazione di inserimento batch prima del timeout. I valori consentiti sono Timespan. Ad esempio "00:30:00" (30 minuti).

  • Dimensioni batch di scrittura: specificare il numero di righe da inserire nella tabella SQL per batch. Il valore consentito è un numero intero (numero di righe). Per impostazione predefinita, il servizio determina in modo dinamico le dimensioni del batch appropriate in base alle dimensioni della riga.

  • Numero massimo di connessioni simultanee: limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee.

  • Disabilitare l'analisi delle metriche delle prestazioni: questa impostazione controlla la raccolta di metriche, ad esempio DTU, DWU, UR e così via per l'ottimizzazione e le raccomandazioni sulle prestazioni di copia. Se si è interessati a questo comportamento, disattivare questa funzionalità.

Mapping

Per la configurazione della scheda Mapping , passare a Configurare i mapping nella scheda Mapping.

Impostazione

Per la configurazione della scheda Impostazioni, passare a Configurare le altre impostazioni nella scheda Impostazioni.

Riepilogo tabella

Le tabelle seguenti contengono altre informazioni sull'attività di copia in Azure Cosmos DB per NoSQL.

Tabella di origine

Nome Descrizione Valore Richiesto Proprietà script JSON
Tipo di archivio dati Tipo di archivio dati. Esterno /
Connessione Connessione all'archivio dati di origine. <connessione> connection
Contenitore Contenitore dei dati di origine. <contenitore dell'origine> Contenitore
fileName
Usare la query È possibile scegliere Tabella o Query come query di utilizzo. Tabella
Query
No type
Dimensioni pagina Numero di documenti per pagina del risultato della query. Il valore predefinito è "-1", ovvero usare le dimensioni della pagina dinamica lato servizio fino a 1000. <dimensioni della pagina> No Pagesize
Eliminare datetime I file nell'archivio dati di origine verranno eliminati subito dopo essere stati spostati nell'archivio di destinazione. L'eliminazione del file è per file, quindi quando l'attività di copia ha esito negativo, si noterà che alcuni file sono già stati copiati nella destinazione ed eliminati dall'origine, mentre altri sono ancora nell'archivio di origine. Selezionato o deselezionato No detectDatetime
Aree preferite Elenco preferito di aree a cui connettersi durante il recupero dei dati da Azure Cosmos DB. Selezionare un'area preferita dall'elenco a discesa dopo aver selezionato Nuovo. <aree preferite> No preferredRegions
Colonne aggiuntive Aggiungere altre colonne di dati per archiviare il percorso relativo o il valore statico dei file di origine. L'espressione è supportata per quest'ultima. Per altre informazioni, vedere Aggiungere altre colonne durante la copia. <numero massimo di connessioni simultanee> No additionalColumns

Tabella di destinazione

Nome Descrizione Valore Richiesto Proprietà script JSON
Tipo di archivio dati Tipo di archivio dati. Esterno /
Connessione Connessione all'archivio dati di destinazione. <connessione> connection
Contenitore Contenitore dei dati di destinazione. <contenitore di origine> Contenitore
fileName
Comportamento di scrittura Descrive come scrivere i dati in Azure Cosmos DB. Valori consentiti: insert e upsert. Il comportamento di upsert consiste nella sostituzione del documento se esiste già un documento con lo stesso ID. In caso contrario, il documento viene inserito. Aggiungere contenuto dinamico
Inserisci
Upsert
No writeBehavior
Timeout del batch di scrittura Tempo di attesa per il completamento dell'operazione di inserimento batch prima del timeout. I valori consentiti sono Timespan. Ad esempio "00:30:00" (30 minuti). timespan No writeBatchTimeout
Dimensioni batch di scrittura Numero di righe da inserire nella tabella SQL per batch. Il valore consentito è integer (numero di righe). Per impostazione predefinita, il servizio determina in modo dinamico le dimensioni del batch appropriate in base alle dimensioni della riga. <numero di righe >
(intero)
No writeBatchSize
Numero massimo di connessioni simultanee Limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee. <numero massimo di connessioni simultanee> No maxConcurrentConnections
Disabilitare l'analisi delle metriche delle prestazioni Questa impostazione controlla la raccolta di metriche, ad esempio DTU, DWU, UR e così via, per l'ottimizzazione e le raccomandazioni sulle prestazioni di copia. Se si è interessati a questo comportamento, disattivare questa funzionalità. Selezionato o deselezionato No disableMetricsCollection