Configurer MongoDB dans une activité de copie
Cet article explique comment utiliser l’activité de copie dans un pipeline de données pour copier des données depuis et vers MongoDB.
Configuration prise en charge
Pour la configuration de chaque onglet sous l’activité de copie, accédez respectivement aux sections suivantes.
Général
Reportez-vous aux instructions relatives aux paramètres Général pour configurer l’onglet Paramètres Général .
Source
Accédez à l’onglet Source pour configurer votre source d’activité de copie. Consultez le contenu suivant pour obtenir la configuration détaillée.
Les propriétés suivantes sont requises :
- Type de magasin de données : sélectionnez Externe.
- Connexion : sélectionnez une connexion MongoDB dans la liste des connexions. Si aucune connexion n’existe, créez une connexion MongoDB en sélectionnant Nouveau.
- Base de données : sélectionnez votre base de données dans la liste déroulante.
- Nom de la collection : spécifiez le nom de la collection dans la base de données MongoDB. Vous pouvez sélectionner la collection dans la liste déroulante, ou sélectionner Modifier pour l’entrer manuellement.
Sous Avancé, vous pouvez spécifier les champs suivants :
- Filtre : permet de spécifier le filtre de sélection en tirant parti d’opérateurs de requête. Pour retourner tous les documents dans une collection, omettez ce paramètre ou passez un document vide ({}).
- Méthodes de curseur : sélectionnez + Nouveau pour spécifier la façon dont la requête sous-jacente est exécutée. Les méthodes d’exécution de la requête sont les suivantes :
- projet : spécifie les champs à retourner dans les documents pour la projection. Pour retourner tous les champs dans les documents correspondants, omettez ce paramètre.
- sort : spécifie l’ordre dans lequel la requête retourne les documents correspondants. Pour plus d’informations, accédez à cursor.sort().
- limit : spécifie le nombre maximal de documents retournés par le serveur. Pour plus d’informations, accédez à cursor.limit().
- skip : spécifie le nombre de documents à ignorer, et à partir de quel endroit MongoDB commence à retourner des résultats. Pour plus d’informations, accédez à cursor.skip().
- Taille de lot : spécifie le nombre de documents à retourner dans chaque lot de la réponse renvoyée par l’instance MongoDB. Dans la plupart des cas, la modification de la taille de lot n’affectera pas l’utilisateur ou l’application.
- Colonnes supplémentaires : ajoutez des colonnes de données supplémentaires au chemin d’accès relatif ou à la valeur statique des fichiers sources du magasin. L'expression est prise en charge pour ce dernier.
Destination
Accédez à l’onglet Destination pour configurer la destination de votre activité de copie. Consultez le contenu suivant pour obtenir la configuration détaillée.
Les propriétés suivantes sont requises :
- Type de magasin de données : sélectionnez Externe.
- Connexion : sélectionnez une connexion MongoDB dans la liste des connexions. Si aucune connexion n’existe, créez une connexion MongoDB en sélectionnant Nouveau.
- Base de données : sélectionnez votre base de données dans la liste déroulante.
- Nom de la collection : spécifiez le nom de la collection dans la base de données MongoDB. Vous pouvez sélectionner la collection dans la liste déroulante, ou sélectionner Modifier pour l’entrer manuellement.
Sous Avancé, vous pouvez spécifier les champs suivants :
Comportement d’écriture : décrit comment écrire des données dans MongoDB. Les valeurs autorisées sont insert et Upsert.
Le comportement de la valeur Upsert consiste à remplacer le document si un document portant le même
_id
existe déjà ; sinon, le document est inséré.Remarque
Le service génère automatiquement un
_id
pour un document si aucun_id
n’est spécifié dans le document d’origine ou par le mappage de colonnes. Cela signifie que vous devez vérifier que votre document comporte un ID afin qu’Upsert fonctionne comme prévu.Délai d'attente du lot d'écriture : Temps d’attente pour que l’opération d’insertion par lot soit terminée avant d’expirer. La valeur autorisée est timespan.
Taille de lot d’écriture : cette propriété contrôle la taille des documents à écrire dans chaque lot. Vous pouvez essayer d’augmenter la valeur pour améliorer le niveau de performance et diminuer la valeur si la taille de votre document est volumineuse.
Mappage
Pour la configuration de l’onglet Mappage, consultez Configurer vos mappages sous l’onglet Mappage. Le mappage n’est pas pris en charge lorsque la source et la destination sont des données hiérarchiques.
Paramètres
Pour la configuration de l’onglet Paramètres, accédez à Configurer vos autres paramètres sous l’onglet Paramètres.
Résumé du tableau
Le tableau suivant contient plus d’informations sur l’activité de copie dans MongoDB.
Informations sur la source
Nom | Description | Valeur | Obligatoire | Propriété de script JSON |
---|---|---|---|---|
Type de banque de données | Votre type de magasin de données. | Externe | Oui | / |
Connection | Votre connexion au magasin de données source. | < votre connexion MongoDB > | Oui | connection |
Sauvegarde de la base de données | Votre base de données que vous utilisez comme source. | < votre base de données > | Oui | database |
Nom de la collection | Nom de la collection dans la base de données MongoDB. | < votre collection > | Oui | collection |
Filter | Filtre de sélection utilisant des opérateurs de requête. Pour retourner tous les documents dans une collection, omettez ce paramètre ou passez un document vide ({}). | < votre filtre de sélection > | Non | filter |
Méthodes de curseur | La façon dont la requête sous-jacente est exécutée. | • project • sort • limit • skip |
Non | cursorMethods : • project • sort • limit • skip |
Taille du lot | Le nombre de documents à retourner dans chaque lot de la réponse renvoyée par l’instance MongoDB. | < taille de votre lot d’écriture > (la valeur par défaut est 100) |
Non | batchSize |
Colonnes supplémentaires | Ajouter les colonnes de données supplémentaires pour stocker le chemin d’accès relatif ou la valeur statique des fichiers sources. L’expression est prise en charge pour ce dernier. | • Name • Valeur |
Non | additionalColumns : • nom • valeur |
Informations de destination
Nom | Description | Valeur | Obligatoire | Propriété de script JSON |
---|---|---|---|---|
Type de banque de données | Votre type de magasin de données. | Externe | Oui | / |
Connection | Votre connexion au magasin de données de destination. | < votre connexion MongoDB > | Oui | connection |
Sauvegarde de la base de données | Votre base de données que vous utilisez comme destination. | < votre base de données > | Oui | database |
Nom de la collection | Nom de la collection dans la base de données MongoDB. | < votre collection > | Oui | collection |
Comportement d’écriture | Décrit comment écrire des données dans MongoDB. Les valeurs autorisées sont insert et Upsert. Le comportement de la valeur Upsert consiste à remplacer le document si un document portant le même _id existe déjà ; sinon, le document est inséré.Remarque : le service génère automatiquement un _id pour un document si aucun _id n’est spécifié dans le document d’origine ou par le mappage de colonnes. Cela signifie que vous devez vérifier que votre document comporte un ID afin qu’Upsert fonctionne comme prévu. |
• Insert (par défaut) • Upsert |
Non | writeBehavior : • insert • upsert |
Délai d’expiration du lot d’écriture | Temps d’attente pour que l’opération d’insertion de lot soit terminée avant d’expirer. | intervalle de temps (la valeur par défaut est 00:30:00 – 30 minutes) |
Non | writeBatchTimeout |
Taille de lot d’écriture | Permet de contrôler la taille des documents à écrire dans chaque lot. Vous pouvez essayer d’augmenter cette valeur pour améliorer le niveau de performance et diminuer la valeur si la taille de votre document est volumineuse. | < taille de votre lot d’écriture > | Non | writeBatchSize |