Configuración de Azure Cosmos DB for NoSQL en una actividad de copia

En este artículo se describe cómo usar la actividad de copia en una canalización de datos para copiar datos desde y hacia Azure Cosmos DB for NoSQL.

Configuración admitida

Para la configuración de cada pestaña en la actividad de copia, vaya a las secciones siguientes respectivamente.

General

Consulte las instruccionesgenerales para configurar la pestaña de parámetros General.

Origen

Las siguientes propiedades son compatibles con Azure Cosmos DB for NoSQL en la pestaña Origen de una actividad de copia.

Screenshot showing source tab.

Se requieren las siguientes tres propiedades:

  • Tipo de banco de datos : seleccione Externo.
  • Conexión: seleccione una conexión de Azure Cosmos DB for NoSQL en la lista de conexiones. Si no existe ninguna conexión, cree una nueva conexión de Azure Cosmos DB for NoSQL seleccionando Nuevo.
  • Contenedor: seleccione el contenedor que quiere usar. Seleccione Editar para escribir manualmente el nombre del contenedor.

En Avanzado, puede especificar los campos siguientes:

  • Usar consulta: puede elegir Tabla o Consulta como consulta de uso. La siguiente lista describe la configuración de cada opción.

    • Tabla: lee los datos de la tabla especificada en Tabla.

    • Consulta: especifica la consulta de Azure Cosmos DB para leer datos.

      Screenshot showing query.

  • Tamaño de página: número de documentos por página del resultado de la consulta. El valor predeterminado es "-1", lo que significa usar el tamaño de página dinámica del servicio hasta 1000.

  • Detectar datetime: determina si se debe detectar datetime a partir de los valores de cadena de los documentos. Los valores permitidos son: True (valor predeterminado) y False.

  • Regiones preferidas: lista preferida de regiones a las que se conectará cuando recupere los datos de Azure Cosmos DB. Seleccione una región preferida en la lista desplegable después de seleccionar Nuevo.

    Screenshot showing preferred regions.

  • Columnas adicionales: añada columnas de datos adicionales para almacenar la ruta relativa o el valor estático de los archivos de origen. La expresión se admite para este último. Para más información, vaya a Agregar columnas adicionales durante la copia.

    Screenshot showing additional columns.

Destination

Las siguientes propiedades son compatibles con Azure Cosmos DB for NoSQL en la pestaña Destino de una actividad de copia.

Screenshot showing destination tab.

Se requieren las siguientes tres propiedades:

  • Tipo de banco de datos : seleccione Externo.
  • Conexión: seleccione una conexión de Azure Cosmos DB for NoSQL en la lista de conexiones.
  • Contenedor: seleccione Examinar para elegir el archivo que desea copiar o rellene la ruta manualmente.

En Avanzado, puede especificar los campos siguientes:

  • Comportamiento de escritura: define el comportamiento de escritura cuando el destino son archivos de un almacén de datos basado en archivos. Puede elegir Agregar contenido dinámico, Insertar o Upsert en la lista desplegable.

    • Agregar contenido dinámico: abra el panel Agregar contenido dinámico. Así se abre el generador de expresiones, donde puede compilar expresiones a partir de variables del sistema admitidas, salidas de actividad, funciones y variables o parámetros especificados por el usuario. Para más información sobre el lenguaje de expresiones, vaya a Expresiones y funciones.

    • Insertar: elija esta opción si los datos de origen tienen inserciones.

    • Upsert: el comportamiento de upsert consiste en reemplazar el documento si ya existe un documento con el mismo identificador; en caso contrario, inserta el documento.

      Screenshot showing write behavior.

  • Tiempo de espera de escritura por lotes: tiempo de espera para que la operación de inserción por lotes se complete antes de que se agote el tiempo de espera. Los valores permitidos son Timespan. Un ejemplo es 00:30:00 (30 minutos).

  • Tamaño del lote de escritura: especifique el número de filas a insertar en la tabla SQL por lote. El valor permitido es un entero (número de filas). De manera predeterminada, el servicio determina dinámicamente el tamaño adecuado del lote en función del tamaño de fila.

  • Máximo de conexiones simultáneas: límite superior de conexiones simultáneas establecidas con el almacén de datos durante la ejecución de la actividad. Especifique un valor solo cuando quiera limitar las conexiones simultáneas.

  • Deshabilitar el análisis de métricas de rendimiento: la configuración controla la recopilación de métricas, como DTU, DWU, RU, etc., para la optimización del rendimiento de la copia y las recomendaciones. Si le preocupa este comportamiento, desactive esta característica.

Asignación

Para la configuración de la pestañaAsignación, vaya a Configurar las asignaciones en la ficha Asignación .

Configuración

Para la configuración de la pestaña Parámetros, vaya a Configurar los otros parámetros en parámetros de pestaña.

Resumen de tabla

Las tablas siguientes contienen más información sobre la actividad de copia en Azure Cosmos DB for NoSQL.

Tabla de origen

Nombre Descripción Value Obligatorio Propiedad de script JSON
Tipo de almacén de datos El tipo de almacén de datos. Externo /
Connection La conexión al almacén de datos de origen. <su conexión> conexión
Contenedor Contenedor de los datos de origen. <contenedor del origen> contenedor
fileName
Usar consulta Puede elegir Tabla o Consulta como consulta de uso. Tabla
Consulta
No type
Tamaño de página Número de documentos por página del resultado de la consulta. El valor predeterminado es "-1", lo que significa usar el tamaño de página dinámica del servicio hasta 1000. <el tamaño de página> No pageSize
Eliminar datetime Los archivos del almacén de datos de origen se eliminarán justo después de moverse al almacén de destino. La eliminación del archivo es por archivo, por lo que cuando falla una actividad de copia, observará que algunos archivos ya se han copiado al destino y eliminado del origen, mientras que otros siguen en el almacén de origen. Selección o anulación de selección No detectDatetime
Regiones preferidas Lista preferida de regiones a las que se conectará cuando recupere los datos de Azure Cosmos DB. Seleccione una región preferida en la lista desplegable después de seleccionar Nuevo. <sus regiones preferidas> No preferredRegions
Columnas adicionales Agregue columnas de datos adicionales para almacenar la ruta de acceso relativa o el valor estático de los archivos de origen. La expresión se admite para este último. Para más información, vaya a Agregar columnas adicionales durante la copia. < número máximo de conexiones simultáneas > No additionalColumns

Tabla de destino

Nombre Descripción Value Obligatorio Propiedad de script JSON
Tipo de almacén de datos El tipo de almacén de datos. Externo /
Connection La conexión al almacén de datos de destino. <su conexión> conexión
Contenedor Contenedor de los datos de destino. <contenedor de origen> contenedor
fileName
Comportamiento de escritura Describe cómo escribir datos en Azure Cosmos DB. Valores permitidos: insert y upsert. El comportamiento de upsert consiste en reemplazar el documento si ya existe un documento con el mismo identificador; en caso contrario, inserta el documento. Agregar contenido dinámico
Insertar
Upsert
No writeBehavior
Tiempo de espera de escritura por lotes Tiempo de espera para que la operación de inserción por lotes se complete antes de que se agote el tiempo de espera. Los valores permitidos son intervalos de tiempo. Un ejemplo es 00:30:00 (30 minutos). timespan No writeBatchTimeout
Tamaño del lote de escritura Número de filas que se va a insertar en la tabla SQL por lote. El valor que se permite es un entero (número de filas). De manera predeterminada, el servicio determina dinámicamente el tamaño adecuado del lote en función del tamaño de fila. <número de filas >
(entero)
No writeBatchSize
Número máximo de conexiones simultáneas Número máximo de conexiones simultáneas establecidas en el almacén de datos durante la ejecución de la actividad. Especifique un valor solo cuando quiera limitar las conexiones simultáneas. < número máximo de conexiones simultáneas > No maxConcurrentConnections
Desactivar análisis de métricas de rendimiento Esta configuración controla la recopilación de métricas como DTU, DWU, RU, etc. para la optimización del rendimiento de la copia y las recomendaciones. Si le preocupa este comportamiento, desactive esta característica. Selección o anulación de selección No disableMetricsCollection