Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este artículo se describe cómo usar la actividad de copia en canalizaciones de datos para copiar datos desde y hacia MongoDB.
Configuración admitida
Para la configuración de cada pestaña en la actividad de copia, vaya a las secciones siguientes respectivamente.
General
Consulte las instruccionesgenerales para configurar la pestaña de parámetros General.
Fuente
Vaya a la pestaña Origen para configurar el origen de la actividad de copia. Consulte el siguiente contenido para obtener la configuración detallada.
Las siguientes propiedades son obligatorias:
- Conexión: seleccione una conexión de MongoDB en la lista de conexiones. Si no existe ninguna conexión, cree una nueva conexión de MongoDB seleccionando Nuevo.
- Base de datos: seleccione la base de datos en la lista desplegable.
- Nombre de la colección: especifique el nombre de la colección en la base de datos de MongoDB. Puede seleccionar la colección en la lista desplegable o seleccionar Editar para escribirla manualmente.
- Versión: la versión que especifique. Se recomienda actualizar a la versión más reciente para aprovechar las mejoras más recientes. Para obtener información sobre la diferencia entre varias versiones, vaya a esta sección.
En Avanzado, puede especificar los campos siguientes:
- Filtro: especifica el filtro de selección mediante operadores de consulta. Para devolver todos los documentos de una colección, omita este parámetro o pase un documento vacío ({}).
-
Métodos de cursor: seleccione + Nuevo para especificar la forma en que se ejecuta la consulta subyacente. Las formas de ejecutar la consulta son:
- project: especifica los campos que se van a devolver en los documentos para la proyección. Para devolver todos los campos de los documentos coincidentes, omita este parámetro.
- sort: especifica el orden en el que la consulta devuelve documentos coincidentes. Vaya a cursor.sort() para obtener más información.
- limit: especifica el número máximo de documentos que devuelve el servidor. Vaya a cursor.limit() para obtener más información.
- skip: especifica el número de documentos que se van a omitir y desde dónde comienza MongoDB a devolver resultados. Vaya a cursor.skip() para obtener más información.
- Tamaño del lote: especifica el número de documentos que se van a devolver en cada lote de la respuesta de la instancia de MongoDB. En la mayoría de los casos, modificar el tamaño del lote no afectará al usuario ni a la aplicación.
- Columnas adicionales: agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último.
Destino
Vaya a la pestaña Destino para configurar el destino de la actividad de copia. Consulte el siguiente contenido para obtener la configuración detallada.
Las siguientes propiedades son obligatorias:
- Tipo de almacén de datos: seleccione externo .
- Conexión: seleccione una conexión de MongoDB en la lista de conexiones. Si no existe ninguna conexión, cree una nueva conexión de MongoDB seleccionando Nuevo.
- Base de datos: seleccione la base de datos en la lista desplegable.
- Nombre de la colección: especifique el nombre de la colección en la base de datos de MongoDB. Puede seleccionar la colección en la lista desplegable o seleccionar Editar para escribirla manualmente.
En Avanzado, puede especificar los campos siguientes:
Comportamiento de escritura: describe cómo escribir datos en MongoDB. Valores permitidos: Insert y Upsert.
El comportamiento de Upsert es reemplazar el documento si ya existe un documento con el mismo
_id
; de lo contrario, inserte el documento.Nota:
El servicio genera automáticamente un
_id
para un documento si no se especifica_id
en el documento original o tampoco mediante el mapeo de columnas. Esto significa que debe asegurarse de que, para que Upsert funcione según lo previsto, el documento tiene un identificador.Tiempo de espera de escritura de lotes: especifique el tiempo de espera para que finalice la operación de inserción por lotes antes de que se agote el tiempo de espera. El valor permitido es timespan.
Escribir tamaño del lote: esta propiedad controla el tamaño de los documentos que se van a escribir en cada lote. Puede intentar aumentar el valor para mejorar el rendimiento y reducir el valor si el tamaño del documento es grande.
Cartografía
Para la configuración de la pestaña Asignación , consulte Configuración de las asignaciones en la pestaña Asignación. No se admite la asignación cuando tanto el origen como el destino son datos jerárquicos.
Asignación de tipos para MongoDB
Al copiar datos desde MongoDB, se utilizan los siguientes mapeos de tipos de datos de MongoDB a tipos de datos provisionales que el servicio usa internamente.
Tipo de datos de MongoDB | Tipo de datos de servicio provisional (para la versión 1.1) | Tipo de datos de servicio provisional (para la versión 1.0) |
---|---|---|
Fecha | Fecha y hora | Cuerda |
ObjectId (identificador de objeto) | Cuerda | Cuerda |
Decimal128 | Cuerda | Cuerda |
Marca de tiempo | Los 32 bits más significativos:> DateTime Los 32 bits menos significativos:> Int32 |
Int32 |
Cuerda | Cuerda | Cuerda |
Arreglo | Arreglo | Arreglo |
Doble | Doble | Cuerda |
Int32 | Int32 | Cuerda |
Int64 | Int64 | Cuerda |
Booleano | Booleano | Booleano |
DatosNulos | Nulo | Nulo |
Documento | Diccionario | Diccionario |
javaScript | Cuerda | Cuerda |
Regex | Cuerda | Cuerda |
minKey | Cuerda | Int32 |
maxKey | Cuerda | Int32 |
Binario | GUID (cuando SubType es "04" ) Cuerda |
Cuerda |
Configuración
Para la configuración de la pestaña Configuración, vaya a Configurar los otros parámetros en la pestaña configuración.
Diferencias entre las versiones de MongoDB
En la tabla siguiente se muestran las diferencias de características entre varias versiones.
Versión 1.1 | Versión 1.0 |
---|---|
Las siguientes asignaciones se usan de tipos de datos de MongoDB para los tipos de datos intermedios de servicio. Fecha:> DateTime TimeStamp:> los 32 bits más significativos -> DateTime; Los 32 bits menos significativos:> Int32 Doble -> Doble Int32 -> Int32 Int64 -> Int64 minKey:> string maxKey:> cadena Binario:> GUID (cuando SubType es "04") / String |
Las siguientes asignaciones se usan de tipos de datos de MongoDB para los tipos de datos intermedios de servicio. Fecha -> cadena de texto TimeStamp:> Int32 Double -> String Int32-> String Int64:> cadena minKey:> Int32 maxKey:> Int32 Binario -> cadena de caracteres |
Resumen de tabla
La tabla siguiente contiene más información sobre la actividad de copia en MongoDB.
Información de origen
Nombre | Descripción | Importancia | Obligatorio | Propiedad de script JSON |
---|---|---|---|---|
Tipo de almacén de datos | El tipo de almacén de datos. | Externo | Sí | / |
Conexión | Tu conexión con el almacén de datos de origen. | < tu conexión de MongoDB > | Sí | conexión |
Base de datos | La base de datos que usa como origen. | < su base de datos > | Sí | base de datos |
Nombre de colección | Nombre de la colección en la base de datos de MongoDB. | < tu colección > | Sí | colección |
Versión | Versión que especifique. | • 1.1 • 1.0 |
Sí | Versión: • 1.1 • 1.0 |
Filtro | Filtro de selección mediante operadores de consulta. Para devolver todos los documentos de una colección, omita este parámetro o pase un documento vacío ({}). | < tu filtro de selección > | No | filtro |
Métodos de cursor | La forma en que se ejecuta la consulta subyacente. | • proyecto • ordenar • límite • omitir |
No | cursorMethods: •proyecto • ordenar •límite • omitir |
Tamaño de lote | Número de documentos que se van a devolver en cada lote de la respuesta de la instancia de MongoDB. |
< el tamaño del lote de escritura > (el valor predeterminado es 100) |
No | batchSize |
Columnas adicionales | Agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último. | • Nombre • Valor |
No | columnas adicionales: • nombre •valor |
Información de destino
Nombre | Descripción | Importancia | Obligatorio | Propiedad de script JSON |
---|---|---|---|---|
Tipo de almacén de datos | El tipo de almacén de datos. | Externo | Sí | / |
Conexión | Su conexión al almacén de datos de destino. | < tu conexión de MongoDB > | Sí | conexión |
Base de datos | Tu base de datos que utilizas como destino. | < su base de datos > | Sí | base de datos |
Nombre de colección | Nombre de la colección en la base de datos de MongoDB. | < tu colección > | Sí | colección |
Comportamiento de escritura | Describe cómo escribir datos en MongoDB. Valores permitidos: Insert y Upsert. El comportamiento de Upsert es reemplazar el documento si ya existe un documento con el mismo _id ; de lo contrario, inserte el documento.Nota: El servicio genera automáticamente un _id para un documento si no se especifica un _id ya sea en el documento original o mediante la asignación de columnas. Esto significa que debe asegurarse de que, para que Upsert funcione según lo previsto, el documento tiene un identificador. |
• Insertar (valor predeterminado) • Upsert |
No | writeBehavior: •insertar • Actualizar o Insertar |
Tiempo de espera de escritura por lotes | Tiempo que se concede a la operación de inserción por lotes para que finalice antes de que se agote el tiempo de espera. | lapso de tiempo (El valor predeterminado es 00:30:00 [30 minutos]). |
No | writeBatchTimeout |
Tamaño del lote de escritura | Controla el tamaño de los documentos que se van a escribir en cada lote. Puede intentar aumentar este valor para mejorar el rendimiento y reducir el valor si el tamaño del documento es grande. | < el tamaño del lote de escritura > | No | writeBatchSize |