Configurare Azure Cosmos DB per NoSQL in un'attività di copia
Questo articolo illustra come usare l'attività di copia in una pipeline di dati per copiare dati da e in Azure Cosmos DB per NoSQL.
Configurazione supportata
Per la configurazione di ogni scheda nell'attività di copia, passare rispettivamente alle sezioni seguenti.
Generali
Fare riferimento alle indicazioni generali sulle impostazioni per configurare la scheda Impostazioni generali .
Origine
Le proprietà seguenti sono supportate per Azure Cosmos DB per NoSQL nella scheda Origine di un'attività di copia.
Sono necessarie le tre proprietà seguenti:
- Tipo di archivio dati: selezionare Esterno.
- Connessione ion: selezionare una connessione Azure Cosmos DB per NoSQL dall'elenco delle connessioni. Se non esiste alcuna connessione, creare una nuova connessione di Azure Cosmos DB per NoSQL selezionando Nuovo.
- Contenitore: selezionare il contenitore da usare. Selezionare Modifica per immettere manualmente il nome del contenitore.
In Avanzate è possibile specificare i campi seguenti:
Usare la query: è possibile scegliere Tabella o Query come query di utilizzo. Nell'elenco seguente viene descritta la configurazione di ogni impostazione.
Tabella: legge i dati dalla tabella specificata in Table.
Query: specifica la query di Azure Cosmos DB per leggere i dati.
Dimensioni pagina: numero di documenti per pagina del risultato della query. Il valore predefinito è "-1", ovvero usare le dimensioni della pagina dinamica lato servizio fino a 1000.
Rilevare datetime: indica se rilevare datetime dai valori stringa nei documenti. I valori consentiti sono: true (predefinito), false.
Aree preferite: elenco preferito di aree a cui connettersi durante il recupero dei dati da Azure Cosmos DB. Selezionare un'area preferita dall'elenco a discesa dopo aver selezionato Nuovo.
Colonne aggiuntive: aggiungere altre colonne di dati per archiviare il percorso relativo o il valore statico dei file di origine. L'espressione è supportata per quest'ultima. Per altre informazioni, vedere Aggiungere altre colonne durante la copia.
Destinazione
Le proprietà seguenti sono supportate per Azure Cosmos DB per NoSQL nella scheda Destinazione di un'attività di copia.
Sono necessarie le tre proprietà seguenti:
- Tipo di archivio dati: selezionare Esterno.
- Connessione ion: selezionare una connessione Azure Cosmos DB per NoSQL dall'elenco delle connessioni.
- Contenitore: selezionare Sfoglia per scegliere il file da copiare o compilare manualmente il percorso.
In Avanzate è possibile specificare i campi seguenti:
Comportamento di scrittura: definisce il comportamento di scrittura quando la destinazione è file da un archivio dati basato su file. È possibile scegliere Aggiungi contenuto dinamico, Inserisci o Upsert dall'elenco a discesa.
Aggiungere contenuto dinamico: aprire il riquadro Aggiungi contenuto dinamico. Verrà aperto il generatore di espressioni in cui è possibile compilare espressioni da variabili di sistema supportate, output di attività, funzioni e variabili o parametri specificati dall'utente. Per informazioni sul linguaggio delle espressioni, vedere Espressioni e funzioni.
Inserisci: scegliere questa opzione se i dati di origine hanno inserimenti.
Upsert: il comportamento di upsert consiste nel sostituire il documento se esiste già un documento con lo stesso ID. In caso contrario, inserire il documento.
Timeout del batch di scrittura: tempo di attesa per il completamento dell'operazione di inserimento batch prima del timeout. I valori consentiti sono
Timespan
. Ad esempio "00:30:00" (30 minuti).Dimensioni batch di scrittura: specificare il numero di righe da inserire nella tabella SQL per batch. Il valore consentito è un numero intero (numero di righe). Per impostazione predefinita, il servizio determina in modo dinamico le dimensioni del batch appropriate in base alle dimensioni della riga.
Numero massimo di connessioni simultanee: limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee.
Disabilitare l'analisi delle metriche delle prestazioni: questa impostazione controlla la raccolta di metriche, ad esempio DTU, DWU, UR e così via per l'ottimizzazione e le raccomandazioni sulle prestazioni di copia. Se si è interessati a questo comportamento, disattivare questa funzionalità.
Mapping
Per la configurazione della scheda Mapping , passare a Configurare i mapping nella scheda Mapping.
Impostazione
Per la configurazione della scheda Impostazioni, passare a Configurare le altre impostazioni nella scheda Impostazioni.
Riepilogo tabella
Le tabelle seguenti contengono altre informazioni sull'attività di copia in Azure Cosmos DB per NoSQL.
Tabella di origine
Nome | Descrizione | Valore | Richiesto | Proprietà script JSON |
---|---|---|---|---|
Tipo di archivio dati | Tipo di archivio dati. | Esterno | Sì | / |
Connessione | Connessione all'archivio dati di origine. | <connessione> | Sì | connection |
Contenitore | Contenitore dei dati di origine. | <contenitore dell'origine> | Sì | Contenitore fileName |
Usare la query | È possibile scegliere Tabella o Query come query di utilizzo. | • Tabella • Query |
No | type |
Dimensioni pagina | Numero di documenti per pagina del risultato della query. Il valore predefinito è "-1", ovvero usare le dimensioni della pagina dinamica lato servizio fino a 1000. | <dimensioni della pagina> | No | Pagesize |
Eliminare datetime | I file nell'archivio dati di origine verranno eliminati subito dopo essere stati spostati nell'archivio di destinazione. L'eliminazione del file è per file, quindi quando l'attività di copia ha esito negativo, si noterà che alcuni file sono già stati copiati nella destinazione ed eliminati dall'origine, mentre altri sono ancora nell'archivio di origine. | Selezionato o deselezionato | No | detectDatetime |
Aree preferite | Elenco preferito di aree a cui connettersi durante il recupero dei dati da Azure Cosmos DB. Selezionare un'area preferita dall'elenco a discesa dopo aver selezionato Nuovo. | <aree preferite> | No | preferredRegions |
Colonne aggiuntive | Aggiungere altre colonne di dati per archiviare il percorso relativo o il valore statico dei file di origine. L'espressione è supportata per quest'ultima. Per altre informazioni, vedere Aggiungere altre colonne durante la copia. | <numero massimo di connessioni simultanee> | No | additionalColumns |
Tabella di destinazione
Nome | Descrizione | Valore | Richiesto | Proprietà script JSON |
---|---|---|---|---|
Tipo di archivio dati | Tipo di archivio dati. | Esterno | Sì | / |
Connessione | Connessione all'archivio dati di destinazione. | <connessione> | Sì | connection |
Contenitore | Contenitore dei dati di destinazione. | <contenitore di origine> | Sì | Contenitore fileName |
Comportamento di scrittura | Descrive come scrivere i dati in Azure Cosmos DB. Valori consentiti: insert e upsert. Il comportamento di upsert consiste nella sostituzione del documento se esiste già un documento con lo stesso ID. In caso contrario, il documento viene inserito. | • Aggiungere contenuto dinamico • Inserisci • Upsert |
No | writeBehavior |
Timeout del batch di scrittura | Tempo di attesa per il completamento dell'operazione di inserimento batch prima del timeout. I valori consentiti sono Timespan. Ad esempio "00:30:00" (30 minuti). | timespan | No | writeBatchTimeout |
Dimensioni batch di scrittura | Numero di righe da inserire nella tabella SQL per batch. Il valore consentito è integer (numero di righe). Per impostazione predefinita, il servizio determina in modo dinamico le dimensioni del batch appropriate in base alle dimensioni della riga. | <numero di righe > (intero) |
No | writeBatchSize |
Numero massimo di connessioni simultanee | Limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee. | <numero massimo di connessioni simultanee> | No | maxConcurrentConnections |
Disabilitare l'analisi delle metriche delle prestazioni | Questa impostazione controlla la raccolta di metriche, ad esempio DTU, DWU, UR e così via, per l'ottimizzazione e le raccomandazioni sulle prestazioni di copia. Se si è interessati a questo comportamento, disattivare questa funzionalità. | Selezionato o deselezionato | No | disableMetricsCollection |
Contenuto correlato
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per