Compartir a través de


Configuración de MongoDB en una actividad de copia

En este artículo se describe cómo usar la actividad de copia en canalizaciones de datos para copiar datos desde y hacia MongoDB.

Configuración admitida

Para la configuración de cada pestaña en la actividad de copia, vaya a las secciones siguientes respectivamente.

General

Consulte las instruccionesgenerales para configurar la pestaña de parámetros General.

Fuente

Vaya a la pestaña Origen para configurar el origen de la actividad de copia. Consulte el siguiente contenido para obtener la configuración detallada.

Captura de pantalla que muestra la pestaña origen y la lista de propiedades.

Las siguientes propiedades son obligatorias:

  • Conexión: seleccione una conexión de MongoDB en la lista de conexiones. Si no existe ninguna conexión, cree una nueva conexión de MongoDB seleccionando Nuevo.
  • Base de datos: seleccione la base de datos en la lista desplegable.
  • Nombre de la colección: especifique el nombre de la colección en la base de datos de MongoDB. Puede seleccionar la colección en la lista desplegable o seleccionar Editar para escribirla manualmente.
  • Versión: la versión que especifique. Se recomienda actualizar a la versión más reciente para aprovechar las mejoras más recientes. Para obtener información sobre la diferencia entre varias versiones, vaya a esta sección.

En Avanzado, puede especificar los campos siguientes:

  • Filtro: especifica el filtro de selección mediante operadores de consulta. Para devolver todos los documentos de una colección, omita este parámetro o pase un documento vacío ({}).
  • Métodos de cursor: seleccione + Nuevo para especificar la forma en que se ejecuta la consulta subyacente. Las formas de ejecutar la consulta son:
    • project: especifica los campos que se van a devolver en los documentos para la proyección. Para devolver todos los campos de los documentos coincidentes, omita este parámetro.
    • sort: especifica el orden en el que la consulta devuelve documentos coincidentes. Vaya a cursor.sort() para obtener más información.
    • limit: especifica el número máximo de documentos que devuelve el servidor. Vaya a cursor.limit() para obtener más información.
    • skip: especifica el número de documentos que se van a omitir y desde dónde comienza MongoDB a devolver resultados. Vaya a cursor.skip() para obtener más información.
  • Tamaño del lote: especifica el número de documentos que se van a devolver en cada lote de la respuesta de la instancia de MongoDB. En la mayoría de los casos, modificar el tamaño del lote no afectará al usuario ni a la aplicación.
  • Columnas adicionales: agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último.

Destino

Vaya a la pestaña Destino para configurar el destino de la actividad de copia. Consulte el siguiente contenido para obtener la configuración detallada.

Captura de pantalla que muestra la pestaña de destino y la lista de propiedades.

Las siguientes propiedades son obligatorias:

  • Tipo de almacén de datos: seleccione externo .
  • Conexión: seleccione una conexión de MongoDB en la lista de conexiones. Si no existe ninguna conexión, cree una nueva conexión de MongoDB seleccionando Nuevo.
  • Base de datos: seleccione la base de datos en la lista desplegable.
  • Nombre de la colección: especifique el nombre de la colección en la base de datos de MongoDB. Puede seleccionar la colección en la lista desplegable o seleccionar Editar para escribirla manualmente.

En Avanzado, puede especificar los campos siguientes:

  • Comportamiento de escritura: describe cómo escribir datos en MongoDB. Valores permitidos: Insert y Upsert.

    El comportamiento de Upsert es reemplazar el documento si ya existe un documento con el mismo _id ; de lo contrario, inserte el documento.

    Nota:

    El servicio genera automáticamente un _id para un documento si no se especifica _id en el documento original o tampoco mediante el mapeo de columnas. Esto significa que debe asegurarse de que, para que Upsert funcione según lo previsto, el documento tiene un identificador.

  • Tiempo de espera de escritura de lotes: especifique el tiempo de espera para que finalice la operación de inserción por lotes antes de que se agote el tiempo de espera. El valor permitido es timespan.

  • Escribir tamaño del lote: esta propiedad controla el tamaño de los documentos que se van a escribir en cada lote. Puede intentar aumentar el valor para mejorar el rendimiento y reducir el valor si el tamaño del documento es grande.

Cartografía

Para la configuración de la pestaña Asignación , consulte Configuración de las asignaciones en la pestaña Asignación. No se admite la asignación cuando tanto el origen como el destino son datos jerárquicos.

Asignación de tipos para MongoDB

Al copiar datos desde MongoDB, se utilizan los siguientes mapeos de tipos de datos de MongoDB a tipos de datos provisionales que el servicio usa internamente.

Tipo de datos de MongoDB Tipo de datos de servicio provisional (para la versión 1.1) Tipo de datos de servicio provisional (para la versión 1.0)
Fecha Fecha y hora Cuerda
ObjectId (identificador de objeto) Cuerda Cuerda
Decimal128 Cuerda Cuerda
Marca de tiempo Los 32 bits más significativos:> DateTime
Los 32 bits menos significativos:> Int32
Int32
Cuerda Cuerda Cuerda
Arreglo Arreglo Arreglo
Doble Doble Cuerda
Int32 Int32 Cuerda
Int64 Int64 Cuerda
Booleano Booleano Booleano
DatosNulos Nulo Nulo
Documento Diccionario Diccionario
javaScript Cuerda Cuerda
Regex Cuerda Cuerda
minKey Cuerda Int32
maxKey Cuerda Int32
Binario GUID (cuando SubType es "04" )
Cuerda
Cuerda

Configuración

Para la configuración de la pestaña Configuración, vaya a Configurar los otros parámetros en la pestaña configuración.

Diferencias entre las versiones de MongoDB

En la tabla siguiente se muestran las diferencias de características entre varias versiones.

Versión 1.1 Versión 1.0
Las siguientes asignaciones se usan de tipos de datos de MongoDB para los tipos de datos intermedios de servicio.

Fecha:> DateTime
TimeStamp:> los 32 bits más significativos -> DateTime; Los 32 bits menos significativos:> Int32
Doble -> Doble
Int32 -> Int32
Int64 -> Int64
minKey:> string
maxKey:> cadena
Binario:> GUID (cuando SubType es "04") / String
Las siguientes asignaciones se usan de tipos de datos de MongoDB para los tipos de datos intermedios de servicio.

Fecha -> cadena de texto
TimeStamp:> Int32
Double -> String
Int32-> String
Int64:> cadena
minKey:> Int32
maxKey:> Int32
Binario -> cadena de caracteres

Resumen de tabla

La tabla siguiente contiene más información sobre la actividad de copia en MongoDB.

Información de origen

Nombre Descripción Importancia Obligatorio Propiedad de script JSON
Tipo de almacén de datos El tipo de almacén de datos. Externo /
Conexión Tu conexión con el almacén de datos de origen. < tu conexión de MongoDB > conexión
Base de datos La base de datos que usa como origen. < su base de datos > base de datos
Nombre de colección Nombre de la colección en la base de datos de MongoDB. < tu colección > colección
Versión Versión que especifique. • 1.1
• 1.0
Versión:
• 1.1
• 1.0
Filtro Filtro de selección mediante operadores de consulta. Para devolver todos los documentos de una colección, omita este parámetro o pase un documento vacío ({}). < tu filtro de selección > No filtro
Métodos de cursor La forma en que se ejecuta la consulta subyacente. proyecto
ordenar
límite
omitir
No cursorMethods:
•proyecto
• ordenar
•límite
• omitir
Tamaño de lote Número de documentos que se van a devolver en cada lote de la respuesta de la instancia de MongoDB. < el tamaño del lote de escritura >
(el valor predeterminado es 100)
No batchSize
Columnas adicionales Agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último. • Nombre
• Valor
No columnas adicionales:
• nombre
•valor

Información de destino

Nombre Descripción Importancia Obligatorio Propiedad de script JSON
Tipo de almacén de datos El tipo de almacén de datos. Externo /
Conexión Su conexión al almacén de datos de destino. < tu conexión de MongoDB > conexión
Base de datos Tu base de datos que utilizas como destino. < su base de datos > base de datos
Nombre de colección Nombre de la colección en la base de datos de MongoDB. < tu colección > colección
Comportamiento de escritura Describe cómo escribir datos en MongoDB. Valores permitidos: Insert y Upsert.

El comportamiento de Upsert es reemplazar el documento si ya existe un documento con el mismo _id ; de lo contrario, inserte el documento.

Nota: El servicio genera automáticamente un _id para un documento si no se especifica un _id ya sea en el documento original o mediante la asignación de columnas. Esto significa que debe asegurarse de que, para que Upsert funcione según lo previsto, el documento tiene un identificador.
Insertar (valor predeterminado)
Upsert
No writeBehavior:
•insertar
• Actualizar o Insertar
Tiempo de espera de escritura por lotes Tiempo que se concede a la operación de inserción por lotes para que finalice antes de que se agote el tiempo de espera. lapso de tiempo
(El valor predeterminado es 00:30:00 [30 minutos]).
No writeBatchTimeout
Tamaño del lote de escritura Controla el tamaño de los documentos que se van a escribir en cada lote. Puede intentar aumentar este valor para mejorar el rendimiento y reducir el valor si el tamaño del documento es grande. < el tamaño del lote de escritura > No writeBatchSize