Cómo copiar datos mediante la actividad de copia

En Canalización de datos, puede usar la actividad de copia para copiar datos entre almacenes de datos locales y en la nube.

Después de copiar los datos, puede usar otras actividades para luego transformarlos y analizarlos. La actividad de copia también puede usarse para publicar los resultados de transformación y análisis de inteligencia empresarial (BI) y el consumo de la aplicación.

Para copiar datos de un origen a un destino, el servicio que ejecuta la actividad de copia realiza estos pasos:

  1. Lee datos desde un almacén de datos de origen.
  2. Realiza procesos de serialización y deserialización, compresión y descompresión, asignación de columnas, etc. Realiza estas operaciones en función de la configuración.
  3. Escribe datos en el almacén de datos de destino.

Requisitos previos

Para empezar, debe completar los siguientes requisitos previos:

  • Una cuenta de inquilino de Microsoft Fabric con una suscripción activa. Cree una cuenta gratuita.

  • Asegúrese de que tiene un área de trabajo habilitada para Microsoft Fabric.

Adición de una actividad de copia mediante el asistente de copia

Siga estos pasos para configurar la actividad de copia mediante el asistente de copia.

Empezar con el asistente de copia

  1. Abra una canalización de datos existente o cree una nueva canalización de datos.

  2. Seleccione Copiar datos en el lienzo para abrir la herramienta Asistente para copia para empezar. O bien, seleccione Usar asistente para copia en la lista desplegable Copiar datos en la pestaña Actividades de la cinta de opciones.

    Screenshot showing options for opening the copy assistant.

Configuración del origen

  1. Seleccione un tipo de origen de datos de la categoría. Usará Azure Blob Storage como ejemplo. Después, seleccione Azure Blob Storage y Siguiente.

    Screenshot of Choose data source screen.

    Screenshot showing where to select the correct data source.

  2. Cree una conexión al origen de datos seleccionando Crear nueva conexión.

    Screenshot showing where to select New connection.

    Después de seleccionar Crear nueva conexión, rellene la información de conexión necesaria y, a continuación, seleccione Siguiente. Para obtener información detallada sobre la creación de conexiones para cada tipo de origen de datos, puede consultar el artículo de cada conector.

    Si tiene conexiones existentes, puede seleccionar Conexión existente y seleccionar la conexión en la lista desplegable.

    Screenshot showing the existing connection.

  3. Elija el archivo o la carpeta que se va a copiar en este paso de configuración de origen y, a continuación, seleccione Siguiente.

    Screenshot showing where to select the data to be copied.

Configuración del destino

  1. Seleccione un tipo de origen de datos de la categoría. Usará Azure Blob Storage como ejemplo. Seleccione Azure Blob Storage y, después, Siguiente.

    Screenshot showing how to select Azure Blob Storage.

  2. Puede crear una nueva conexión que se vincule a una nueva cuenta de Azure Blob Storage siguiendo los pasos de la sección anterior o use una conexión existente en la lista desplegable de conexiones. Las funcionalidades de Probar conexión y Editar están disponibles para cada conexión seleccionada.

    Screenshot showing data connection options.

  3. Configure y asigne los datos de origen al destino. A continuación, seleccione Siguiente para finalizar las configuraciones de destino.

    Screenshot of Map to destination screen.

    Screenshot of Connect to data destination.

Revisión y creación de la actividad de copia

  1. Revise la configuración de la actividad de copia en los pasos anteriores y seleccione Aceptar para finalizar. O bien, puede volver a los pasos anteriores para editar la configuración en la herramienta, si fuera necesario.

    Screenshot showing the Review and create screen.

Una vez finalizada, la actividad de copia se agregará al lienzo de la canalización de datos. Toda la configuración, incluida la configuración avanzada para esta actividad de copia, está disponible en la pestaña cuando está seleccionada.

Screenshot showing a copy activity on the data pipeline canvas.

Ahora puede guardar la canalización de datos con esta única actividad de copia o seguir diseñando la canalización de datos.

Agregar una actividad de copia directamente

Siga estos pasos para agregar una actividad de copia directamente.

Agregar una actividad de copia

  1. Abra una canalización de datos existente o cree una nueva canalización de datos.

  2. Agregue una actividad de copia seleccionando Agregar actividad de canalización>Actividad de copia o seleccionando Copiar datos>Agregar al lienzo en la pestaña Actividades.

    Screenshot showing two ways to add a copy activity.

Configuración de las opciones generales en la pestaña General

Para obtener información sobre cómo configurar las opciones generales, consulte General.

Configuración del origen en la pestaña origen

  1. Seleccione + Nuevo junto a Conexión para crear una conexión con el origen de datos.

    Screenshot showing where to select New.

    1. Elija el tipo de origen de datos en la ventana emergente. Usará Azure SQL Database como ejemplo. Seleccione Azure SQL Database y luego Continuar.

      Screenshot showing how to select the data source.

    2. Navega a la página de creación de la conexión. Rellene la información de conexión necesaria en el panel y, a continuación, seleccione Crear. Para obtener información detallada sobre la creación de conexiones para cada tipo de origen de datos, puede consultar el artículo de cada conector.

      Screenshot showing New connection page.

    3. Una vez que la conexión se haya creado correctamente, volverá a la página de canalización de datos. A continuación, seleccione Actualizar para capturar la conexión que creó en la lista desplegable. También puede elegir una conexión existente de Azure SQL Database en la lista desplegable directamente si ya la creó antes. Las funcionalidades de Probar conexión y Editar están disponibles para cada conexión seleccionada. A continuación, seleccione Azure SQL Database en Tipo de conexión.

      Screenshot showing where to refresh your connection.

  2. Especifique una tabla que se va a copiar. Seleccione Vista previa de los datos para obtener una vista previa de la tabla de origen. También puede usar Consultar y Procedimiento almacenado para leer datos del origen.

    Screenshot showing source table settings options.

  3. Expanda Opciones avanzadas para obtener una configuración más avanzada.

    Screenshot of advanced settings.

Configuración del destino en la pestaña destino

  1. Elija el tipo de destino. Podría ser el tanto almacén de datos interno de primera clase del área de trabajo, como el lago de datos o los almacenes de datos externos. Usará el lago de datos como ejemplo.

    Screenshot showing where to select destination type.

  2. Elija usar Lago de datos en el Tipo de almacén de datos del área de trabajo. Seleccione + Nuevo y le llevará a la página de creación de lago de datos. Especifique el nombre del lago de datos y, a continuación, seleccione Crear.

    Screenshot showing Lakehouse creation.

  3. Una vez que la conexión se haya creado correctamente, volverá a la página de canalización de datos. A continuación, seleccione Actualizar para capturar la conexión que creó en la lista desplegable. También puede elegir una conexión de lago de datos existente en la lista desplegable directamente si ya la creó antes.

    Screenshot showing selecting connection.

  4. Especifique una tabla o configure la ruta de acceso del archivo para definir el archivo o la carpeta como destino. Aquí, seleccione Tablas y especifique una tabla para escribir datos.

    Screenshot showing where to find Table settings.

  5. Expanda Opciones avanzadas para obtener una configuración más avanzada.

    Screenshot of Advanced options.

Ahora puede guardar la canalización de datos con esta única actividad de copia o seguir diseñando la canalización de datos.

Configuración de las asignaciones en la pestaña asignación

Si el conector que aplica admite la asignación, puede ir a la pestaña Asignación para configurar la asignación.

  1. Seleccione Importar esquemas para importar el esquema de datos.

    Screenshot of mapping settings 1.

  2. Puede ver que se muestra la asignación automática. Especifique la columna Origen y la columna Destino. Si crea una nueva tabla en el destino, puede personalizar el nombre de la columna Destino aquí. Si desea escribir datos en la tabla de destino existente, no puede modificar el nombre de la columna Destino existente. También puede ver las columnas Tipo de origen y destino.

    Screenshot of mapping settings 2.

Además, puede seleccionar + Nueva asignación para agregar una nueva asignación, seleccionar Borrar para borrar todas las opciones de asignación y Restablecer para restablecer todas las columnas deOrigen de asignación.

Configuración de la conversión de tipos

Expanda Opciones de conversión de tipos para configurar la conversión de tipos si es necesario.

Screenshot of mapping type conversion.

Consulte la siguiente tabla para conocer los detalles de configuración.

Configuración Descripción
Permitir truncamiento de datos Permita el truncamiento de datos al convertir los datos de origen en destino con un tipo diferente durante la copia. Por ejemplo, de decimal a entero, de DatetimeOffset a Datetime.
Tratar booleano como número Trate booleano como número. Por ejemplo, tratar true como 1.
Formato DateTime Da formato a la cadena al realizar conversiones entre fechas sin desplazamiento de zona horaria y cadenas. Por ejemplo, "aaaa-MM-dd HH:mm:ss.fff".
Formato DateTimeOffset Da formato a la cadena al realizar conversiones entre fechas con desplazamiento de zona horaria y cadenas. Por ejemplo, "aaaa-MM-dd HH:mm:ss.fff zzz".
Formato TimeSpan Da formato a la cadena al realizar conversiones entre intervalos de tiempo y cadenas. Por ejemplo, "dd.hh:mm:ss".
Referencia cultural Información de referencia cultural que se usará al convertir tipos. Por ejemplo, "en-us", "fr-fr".

Configure otras opciones en la pestaña Configuración

La pestaña Configuración contiene la configuración de rendimiento, almacenamiento provisional, etc.

Screenshot of Settings tab.

Consulta la tabla siguiente para ver una descripción de cada configuración.

Configuración Descripción
Optimización inteligente del rendimiento Especifique para optimizar el rendimiento. Puede elegir entre:
Automático
Estándar
Equilibrado
Máximo
Al elegir Automático, la configuración óptima se aplica dinámicamente en función del patrón de datos y el par de destino y origen. También puede personalizar el rendimiento y el valor personalizado puede ser de 2 a 256, mientras que un valor mayor implica más ganancias.
Grado de paralelismo de copia Especifique el grado de paralelismo que usaría la carga de datos.
Tolerancia a errores Al seleccionar esta opción, puede omitir algunos errores en medio del proceso de copia. Por ejemplo, filas incompatibles entre el almacén de origen y destino, un archivo que se elimina durante el movimiento de datos, etc.
Habilitar registro Al seleccionar esta opción, puede registrar archivos copiados, archivos omitidos y filas.
Enable staging (Habilitar almacenamiento provisional) Especifique si desea copiar los datos a través de un almacén provisional. Habilite el almacenamiento provisional solo para los escenarios beneficiosos.
Conexión de la cuenta de almacenamiento provisional Al seleccionar Habilitar almacenamiento provisional, especifique la conexión de un origen de datos de Almacenamiento de Azure como almacén provisional. Seleccione + Nuevo para crear una conexión de almacenamiento provisional si no la tiene.

Configuración de parámetros en una actividad de copia

Los parámetros se pueden usar para controlar el comportamiento de una canalización y sus actividades. Puede usar Agregar contenido dinámico para especificar parámetros para las propiedades de la actividad de copia. Vamos a especificar Lakehouse/Data Warehouse/KQL Database como ejemplo para ver cómo usarlo.

  1. En el origen o destino, después de seleccionar Área de trabajo como tipo de almacén de datos y especificar la base de datos KQL de Lakehouse/Data Warehouse/como tipo de almacén de datos del área de trabajo, seleccioneAgregar contenidodinámico en la lista desplegable deLakehouse o Data Warehouse o KQL Database.

  2. En el panel emergente Agregar contenido dinámico, en la pestaña Parámetros , seleccione+.

    Screenshot showing the Add dynamic content page.

  3. Especifique el nombre del parámetro y asígnele un valor predeterminado si lo desea, o bien puede especificar el valor del parámetro después de seleccionar Ejecutar en la canalización.

    Screenshot shows creating a new parameter.

    Tenga en cuenta que el valor del parámetro debe ser Lakehouse/Data Warehouse/KQL Database id. de objeto. Para obtener el identificador de objeto de base de datos de Lakehouse/Data Warehouse/KQL, abra la base de datos de Lakehouse/Data Warehouse/KQL en el área de trabajo y el identificador es posterior /lakehouses/o /datawarehouses//databases/ en la dirección URL.

    • Identificador deobjeto de Lakehouse:

      Screenshot showing the Lakehouse object ID.

    • ID de objeto de Data Warehouse:

      Screenshot showing the Data Warehouse object ID.

    • ID Objetos de base de datos KQL:

      Screenshot showing the KQL Database object ID.

  4. Seleccione Guardar para volver al panel Agregar contenido dinámico. A continuación, seleccione el parámetro para que aparezca en el cuadro de expresión. A continuación, seleccione Aceptar. Volverá a la página de canalización y verá que la expresión de parámetro se especifica después de que el identificador de objeto de Lakehouse Id/. de objeto de ID Data Warehouse/. de objeto KQL Database id.

    Screenshot showing selecting parameter.