Condividi tramite


Configurare MongoDB in un'attività di copia

Questo articolo illustra come usare l'attività di copia in una pipeline per copiare dati da e in MongoDB.

Configurazione supportata

Per la configurazione di ogni scheda nell'attività di copia, passare rispettivamente alle sezioni seguenti.

Generali

Fare riferimento alla guida alle impostazioni Generali per configurare la scheda impostazioni Generali.

Origine

Passare alla scheda Origine per configurare l'origine dell'attività di copia. Per la configurazione dettagliata, vedere il contenuto seguente.

Screenshot che mostra la scheda origine e l'elenco delle proprietà.

Per ogni oggetto sono necessarie le proprietà seguenti:

  • Connessione: selezionare una connessione MongoDB dall'elenco delle connessioni. Se non esiste alcuna connessione, creare una nuova connessione MongoDB selezionando Nuovo.
  • Database: selezionare quindi il database di destinazione dall'elenco a discesa.
  • Nome raccolta: specificare il nome della raccolta nel database MongoDB. È possibile selezionare la raccolta dall'elenco a discesa o selezionare Modifica per immetterla manualmente.
  • Versione: versione specificata dall'utente. È consigliabile eseguire l'aggiornamento alla versione più recente per sfruttare i miglioramenti più recenti. Per informazioni sulla differenza tra diverse versioni, vedere questa sezione.

Sotto Avanzate, è possibile specificare i campi seguenti:

  • Filtri: Specifica il filtro di selezione usando gli operatori di query. Per restituire tutti i documenti in una raccolta, omettere questo parametro o passare un documento vuoto ({}).
  • Metodi di cursore: selezionare + Nuovo per specificare la modalità di esecuzione della query sottostante. I modi per eseguire la query sono:
    • progetto: specifica i campi da restituire nei documenti per la proiezione. Per restituire tutti i campi nei documenti corrispondenti, omettere questo parametro.
    • ordinare: specifica l'ordine in cui la query restituisce i documenti corrispondenti. Per Ulteriori informazioni, passare a cursor.sort().
    • limite: specifica il numero massimo di documenti restituiti dal server. Per altre informazioni, passare a Custom roles (Ruoli personalizzati).
    • ignorare: Specifica il numero di documenti da ignorare e la posizione da cui MongoDB inizia a restituire i risultati. Per ulteriori informazioni, passare a cursor.sort().
  • Batch size: Specifica il numero di documenti da restituire in ogni batch di risposta dall'istanza di MongoDB. Nella maggior parte dei casi, la modifica della dimensione del batch non influisce sull'utente o sull'applicazione.
  • Colonne aggiuntive: aggiungere altre colonne di dati per archiviare il percorso relativo o il valore statico dei file di origine. L'espressione è supportata per quest'ultima.

Destinazione

Passare alla scheda Destinazione per configurare la destinazione dell'attività di copia. Per la configurazione dettagliata, vedere il contenuto seguente.

Per ogni oggetto sono necessarie le proprietà seguenti:

  • Connessione: selezionare una connessione MongoDB dall'elenco delle connessioni. Se non esiste alcuna connessione, creare una nuova connessione MongoDB selezionando Nuovo.
  • Database: selezionare quindi il database di destinazione dall'elenco a discesa.
  • Nome raccolta: specificare il nome della raccolta nel database MongoDB. È possibile selezionare la raccolta dall'elenco a discesa o selezionare Modifica per immetterla manualmente.

Sotto Avanzate, è possibile specificare i campi seguenti:

  • Comportamento di scrittura: Descrive come scrivere dati in MongoDB. Valori consentiti: insert e upsert.

    Il comportamento di Upsert il comportamento di upsert è quello di sostituire il documento se esiste già un documento con lo stesso _id; in caso contrario, inserisce il documento.

    Nota

    Il servizio genera automaticamente un _id per un documento se non è specificato un _id nel documento originale o tramite il mapping di colonna. È quindi necessario assicurarsi che il documento contenga un ID in modo che upsert funzioni come previsto.

  • Timeout batch di scrittura: specificare il tempo di attesa per il completamento dell'operazione di inserimento batch prima del timeout. I valori consentiti sono intervalli di tempo.

  • Dimensione batch di scrittura: questa proprietà controlla le dimensioni dei documenti da scrivere in ogni batch. È possibile provare ad aumentare il valore di writeBatchSize per migliorare le prestazioni e a ridurre il valore se le dimensioni dei documenti sono troppo grandi.

Mappatura

Per la configurazione della scheda Mapping, vedere Configurare i mapping nella scheda Mapping. Il mapping non è supportato quando sia l'origine che la destinazione sono dati gerarchici.

Mapping del tipo di dati per MongoDB

Quando si copiano dati da MongoDB, i mapping seguenti vengono usati dai tipi di dati MongoDB ai tipi di dati provvisori usati internamente dal servizio.

Tipo di dati di MongoDB Tipo di dati del servizio provvisorio (per la versione 1.1) Tipo di dati del servizio provvisorio (per la versione 1.0)
Dati Data e ora Int64
ObjectId Stringa Stringa
Decimal128 Stringa Stringa
Marcatempo I 32 bit più significativi -> DateTime
I 32 bit meno significativi -> Int64
I 32 bit più significativi -> Int64
I 32 bit meno significativi -> Int64
Stringa Stringa Stringa
Doppio Doppio Doppio
Int32 Int64 Int64
Int64 Int64 Int64
Booleano Booleano Booleano
Nullo Nullo Nullo
JavaScript Stringa Stringa
Espressione regolare Stringa Stringa
Tasto min Stringa Int64
Tasto max Stringa Int64
Binario GUID (quando SubType è "04" )
Stringa
Stringa

Impostazione

Per la configurazione della scheda Impostazioni, vedere Configurare le altre impostazioni nella scheda Impostazioni.

Differenze tra le versioni di MongoDB

La tabella seguente illustra le differenze di funzionalità tra diverse versioni.

Versione 1.1 Versione 1.0
I mapping seguenti vengono usati dai tipi di dati MongoDB ai tipi di dati provvisori del servizio.

Date -> DateTime
TimeStamp (i 32 bit più significativi) -> DateTime
Chiave minima -> Stringa
Chiave massima -> Stringa
Binary -> GUID (quando SubType è "04") / String
I mapping seguenti vengono usati dai tipi di dati MongoDB ai tipi di dati provvisori del servizio.

Data -> Int64
TimeStamp (i 32 bit più significativi) -> Int64
Chiave min -> Int64
Tasto massimo -> Int64
Binary -> String

Tabella di riepilogo

La tabella seguente contiene altre informazioni sull'attività di copia in MongoDB.

Informazioni sull'origine

Nome Descrizione valore Richiesto Proprietà script JSON
Connessione Connessione all'archivio dei dati di origine. < Connessione a MongoDB > connessione
Banca dati Il database usato come origine. < database > banca dati
Nome raccolta Nome della raccolta nel database MongoDB. < la raccolta > collezione
Versione Versione specificata. • 1.1
• 1.0
Versione:
• 1.1
• 1.0
Filtra Il filtro di selezione usando gli operatori di query. Per restituire tutti i documenti in una raccolta, omettere questo parametro o passare un documento vuoto ({}). < filtro di selezione > NO filtro
Metodi di cursore Modalità di esecuzione della query sottostante. progetto
ordinare
limite
ignorare
NO cursorMethods:
• progetto
• ordinare
• limite
• ignorare
Dimensioni del batch Specifica il numero di documenti da restituire in ogni batch di risposta dall'istanza di MongoDB. < dimensioni batch di scrittura >
(il valore predefinito è 100)
NO dimensione del batch
Colonne aggiuntive Aggiungere altre colonne di dati per archiviare il percorso relativo o il valore statico dei file di origine. L'espressione è supportata per quest'ultima. • Nome
• Valore
NO colonne aggiuntive:
• Nome
• Valore

Informazioni sulla destinazione

Nome Descrizione valore Richiesto Proprietà script JSON
Connessione Connessione all'archivio dati di destinazione. < Connessione a MongoDB > connessione
Banca dati Database usato come destinazione. < database > banca dati
Nome raccolta Nome della raccolta nel database MongoDB. < la raccolta > collezione
Comportamento di scrittura Descrive come scrivere dati in MongoDB. Valori consentiti: insert e upsert.

Il comportamento di Upsert il comportamento di upsert è quello di sostituire il documento se esiste già un documento con lo stesso _id; in caso contrario, inserisce il documento.

Nota: il servizio genera automaticamente un _id per un documento se non è specificato un _id nel documento originale o tramite il mapping di colonna. È quindi necessario assicurarsi che il documento contenga un ID in modo che upsert funzioni come previsto.
Inserisci (impostazione predefinita)
Upsert
NO writeBehavior:
• Inserisci
• aggiorna o inserisci
Timeout del batch di scrittura Tempo di attesa per il completamento dell'operazione di inserimento batch prima del timeout. intervallo di tempo
(il valore predefinito è 00:30:00 - 30 minuti)
NO writeBatchTimeout
Dimensioni batch di scrittura Controlla le dimensioni dei documenti da scrivere in ogni batch. È possibile provare ad aumentare il valore di writeBatchSize per migliorare le prestazioni e a ridurre il valore se le dimensioni dei documenti sono troppo grandi. < dimensioni batch di scrittura > NO dimensione batch di scrittura