Compartir vía


Cómo copiar datos mediante la actividad de copia

En Canalización de datos, puede usar la actividad de copia para copiar datos entre almacenes de datos locales y en la nube.

Después de copiar los datos, puede usar otras actividades para luego transformarlos y analizarlos. La actividad de copia también puede usarse para publicar los resultados de transformación y análisis de inteligencia empresarial (BI) y el consumo de la aplicación.

Para copiar datos de un origen a un destino, el servicio que ejecuta la actividad de copia realiza estos pasos:

  1. Lee datos desde un almacén de datos de origen.
  2. Realiza procesos de serialización y deserialización, compresión y descompresión, asignación de columnas, etc. Realiza estas operaciones en función de la configuración.
  3. Escribe datos en el almacén de datos de destino.

Requisitos previos

Para empezar, debe completar los siguientes requisitos previos:

  • Una cuenta de inquilino de Microsoft Fabric con una suscripción activa. Cree una cuenta gratuita.

  • Asegúrese de que tiene un área de trabajo habilitada para Microsoft Fabric.

Adición de una actividad de copia mediante el asistente de copia

Siga estos pasos para configurar la actividad de copia mediante el asistente de copia.

Empezar con el asistente de copia

  1. Abra una canalización de datos existente o cree una nueva canalización de datos.

  2. Seleccione Copiar datos en el lienzo para abrir la herramienta Asistente para copia para empezar. O bien, seleccione Usar asistente para copia en la lista desplegable Copiar datos en la pestaña Actividades de la cinta de opciones.

    Captura de pantalla que muestra las opciones para abrir el asistente de copia.

Configuración del origen

  1. Seleccione un tipo de origen de datos de la categoría. Usará Azure Blob Storage como ejemplo. Después, seleccione Azure Blob Storage y Siguiente.

    Captura de pantalla de Elegir origen de datos.

    Captura de pantalla que muestra dónde seleccionar el origen de datos correcto.

  2. Cree una conexión al origen de datos seleccionando Crear nueva conexión.

    Captura de pantalla que muestra dónde seleccionar Nueva conexión.

    Después de seleccionar Crear nueva conexión, rellene la información de conexión necesaria y, a continuación, seleccione Siguiente. Para obtener información detallada sobre la creación de conexiones para cada tipo de origen de datos, puede consultar el artículo de cada conector.

    Si tiene conexiones existentes, puede seleccionar Conexión existente y seleccionar la conexión en la lista desplegable.

    Captura de pantalla en la que se muestran las conexiones existentes.

  3. Elija el archivo o la carpeta que se va a copiar en este paso de configuración de origen y, a continuación, seleccione Siguiente.

    Captura de pantalla que muestra dónde seleccionar los datos que se van a copiar.

Configuración del destino

  1. Seleccione un tipo de origen de datos de la categoría. Usará Azure Blob Storage como ejemplo. Seleccione Azure Blob Storage y, después, Siguiente.

    Captura de pantalla que muestra cómo seleccionar Azure Blob Storage.

  2. Puede crear una nueva conexión que se vincule a una nueva cuenta de Azure Blob Storage siguiendo los pasos de la sección anterior o use una conexión existente en la lista desplegable de conexiones. Las funcionalidades de Probar conexión y Editar están disponibles para cada conexión seleccionada.

    Captura de pantalla que muestra las opciones de conexión de datos.

  3. Configure y asigne los datos de origen al destino. A continuación, seleccione Siguiente para finalizar las configuraciones de destino.

    Captura de pantalla de la pantalla Asignar a destino.

    Captura de pantalla de Conectarse al destino de datos.

    Nota:

    Solo puede usar una única puerta de enlace de datos local dentro de la misma actividad de copia. Si tanto el origen como el receptor son orígenes de datos en el entorno local, deben usar la misma puerta de enlace. Para mover datos entre orígenes de datos en el entorno local con puertas de enlace diferentes, debe copiar mediante la primera puerta de enlace a un origen en la nube intermedio en una Actividad de copia. A continuación, puede usar otra Actividad de copia para copiarlo desde el origen intermedio en la nube mediante la segunda puerta de enlace.

Revisión y creación de la actividad de copia

  1. Revise la configuración de la actividad de copia en los pasos anteriores y seleccione Aceptar para finalizar. O bien, puede volver a los pasos anteriores para editar la configuración si es necesario en la herramienta.

    Captura de pantalla donde se muestra la pantalla Revisar y crear.

Una vez finalizada, la actividad de copia se agregará al lienzo de la canalización de datos. Toda la configuración, incluida la configuración avanzada para esta actividad de copia, está disponible en la pestaña cuando está seleccionada.

Captura de pantalla que muestra una actividad de copia en el lienzo de la canalización de datos.

Ahora puede guardar la canalización de datos con esta única actividad de copia o seguir diseñando la canalización de datos.

Agregar una actividad de copia directamente

Siga estos pasos para agregar una actividad de copia directamente.

Agregar una actividad de copia

  1. Abra una canalización de datos existente o cree una nueva canalización de datos.

  2. Agregue una actividad de copia seleccionando Agregar actividad de canalización>Actividad de copia o seleccionando Copiar datos>Agregar al lienzo en la pestaña Actividades.

    Captura de pantalla que muestra dos formas de añadir una actividad de copia.

Configuración de las opciones generales en la pestaña General

Para obtener información sobre cómo configurar las opciones generales, consulte General.

Configuración del origen en la pestaña origen

  1. Seleccione + Nuevo junto a Conexión para crear una conexión con el origen de datos.

    Captura de pantalla que muestra dónde seleccionar Nuevo.

    1. Elija el tipo de origen de datos en la ventana emergente. Usará Azure SQL Database como ejemplo. Seleccione Azure SQL Database y luego Continuar.

      Captura de pantalla que muestra cómo seleccionar el origen de datos.

    2. Navega a la página de creación de la conexión. Rellene la información de conexión necesaria en el panel y, a continuación, seleccione Crear. Para obtener información detallada sobre la creación de conexiones para cada tipo de origen de datos, puede consultar el artículo de cada conector.

      Captura de pantalla que muestra la página de Nueva conexión.

    3. Una vez que la conexión se haya creado correctamente, volverá a la página de canalización de datos. A continuación, seleccione Actualizar para capturar la conexión que creó en la lista desplegable. También puede elegir una conexión existente de Azure SQL Database en la lista desplegable directamente si ya la creó antes. Las funcionalidades de Probar conexión y Editar están disponibles para cada conexión seleccionada. A continuación, seleccione Azure SQL Database en Tipo de conexión.

      Captura de pantalla que muestra dónde actualizar la conexión.

  2. Especifique una tabla que se va a copiar. Seleccione Vista previa de los datos para obtener una vista previa de la tabla de origen. También puede usar Consultar y Procedimiento almacenado para leer datos del origen.

    Captura de pantalla que muestra las opciones de configuración de la tabla de origen.

  3. Expanda Opciones avanzadas para obtener una configuración más avanzada.

    Captura de pantalla de la configuración avanzada.

Configuración del destino en la pestaña destino

  1. Elija el tipo de destino. Podría ser el tanto almacén de datos interno de primera clase del área de trabajo, como el lago de datos o los almacenes de datos externos. Usará el lago de datos como ejemplo.

    Captura de pantalla que muestra dónde seleccionar el tipo de destino.

  2. Elija usar Lago de datos en el Tipo de almacén de datos del área de trabajo. Seleccione + Nuevo y le llevará a la página de creación de lago de datos. Especifique el nombre del lago de datos y, a continuación, seleccione Crear.

    Captura de pantalla que muestra la creación del lago de datos.

  3. Una vez que la conexión se haya creado correctamente, volverá a la página de canalización de datos. A continuación, seleccione Actualizar para capturar la conexión que creó en la lista desplegable. También puede elegir una conexión de lago de datos existente en la lista desplegable directamente si ya la creó antes.

    Captura de pantalla que muestra la selección de la conexión.

  4. Especifique una tabla o configure la ruta de acceso del archivo para definir el archivo o la carpeta como destino. Aquí, seleccione Tablas y especifique una tabla para escribir datos.

    Captura de pantalla que muestra dónde encontrar la configuración de la Tabla.

  5. Expanda Opciones avanzadas para obtener una configuración más avanzada.

    Captura de pantalla de Opciones avanzadas.

Ahora puede guardar la canalización de datos con esta única actividad de copia o seguir diseñando la canalización de datos.

Configuración de las asignaciones en la pestaña asignación

Si el conector que aplica admite la asignación, puede ir a la pestaña Asignación para configurar la asignación.

  1. Seleccione Importar esquemas para importar el esquema de datos.

    Captura de pantalla de la configuración de asignación 1.

  2. Puede ver que se muestra la asignación automática. Especifique la columna Origen y la columna Destino. Si crea una nueva tabla en el destino, puede personalizar el nombre de la columna Destino aquí. Si desea escribir datos en la tabla de destino existente, no puede modificar el nombre de la columna Destino existente. También puede ver las columnas Tipo de origen y destino.

    Captura de pantalla de la configuración de asignación 2.

Además, puede seleccionar + Nueva asignación para agregar una nueva asignación, seleccionar Borrar para borrar todas las opciones de asignación y Restablecer para restablecer todas las columnas deOrigen de asignación.

Configuración de la conversión de tipos

Expanda Opciones de conversión de tipos para configurar la conversión de tipos si es necesario.

Captura de pantalla de la conversión de tipos de asignación.

Consulte la siguiente tabla para conocer los detalles de configuración.

Configuración Descripción
Permitir truncamiento de datos Permita el truncamiento de datos al convertir los datos de origen en destino con un tipo diferente durante la copia. Por ejemplo, de decimal a entero, de DatetimeOffset a Datetime.
Tratar booleano como número Trate booleano como número. Por ejemplo, tratar true como 1.
Formato de fecha Dar formato a la cadena al convertir entre fechas y cadenas, por ejemplo, "aaaa-MM-dd". Para más información, consulte Cadenas con formato de fecha y hora personalizado.

La columna de fecha se puede leer como tipo de fecha para:
 • Amazon RDS para SQL Server
 • Azure SQL Database
 • Instancia administrada de Azure SQL Database
 • Azure Synapse Analytics
 • Formato de texto delimitado
 • Tabla del almacén de lago
 • Formato Parquet
 • Servidor SQL Server
Formato DateTime Da formato a la cadena al realizar conversiones entre fechas sin desplazamiento de zona horaria y cadenas. Por ejemplo, "aaaa-MM-dd HH:mm:ss.fff".
Formato DateTimeOffset Da formato a la cadena al realizar conversiones entre fechas con desplazamiento de zona horaria y cadenas. Por ejemplo, "aaaa-MM-dd HH:mm:ss.fff zzz".
Formato TimeSpan Da formato a la cadena al realizar conversiones entre intervalos de tiempo y cadenas. Por ejemplo, "dd.hh:mm:ss".
Referencia cultural Información de referencia cultural que se usará al convertir tipos. Por ejemplo, "en-us", "fr-fr".

Configure otras opciones en la pestaña Configuración

La pestaña Configuración contiene la configuración de rendimiento, almacenamiento provisional, etc.

Captura de pantalla de la pestaña Configuración.

Consulta la tabla siguiente para ver una descripción de cada configuración.

Configuración Descripción
Optimización inteligente del rendimiento Especifique para optimizar el rendimiento. Puede elegir entre:
Automático
Estándar
Equilibrado
Máximo
Al elegir Automático, la configuración óptima se aplica dinámicamente en función del patrón de datos y el par de destino y origen. También puede personalizar el rendimiento y el valor personalizado puede ser de 2 a 256, mientras que un valor mayor implica más ganancias.
Grado de paralelismo de copia Especifique el grado de paralelismo que usaría la carga de datos.
Tolerancia a errores Al seleccionar esta opción, puede omitir algunos errores en medio del proceso de copia. Por ejemplo, filas incompatibles entre el almacén de origen y destino, un archivo que se elimina durante el movimiento de datos, etc.
Habilitar registro Al seleccionar esta opción, puede registrar archivos copiados, archivos omitidos y filas.
Enable staging (Habilitar almacenamiento provisional) Especifique si desea copiar los datos a través de un almacén provisional. Habilite el almacenamiento provisional solo para los escenarios beneficiosos.
Conexión de la cuenta de almacenamiento provisional Al seleccionar Habilitar almacenamiento provisional, especifique la conexión de un origen de datos de Almacenamiento de Azure como almacén provisional. Seleccione + Nuevo para crear una conexión de almacenamiento provisional si no la tiene.

Configuración de parámetros en una actividad de copia

Los parámetros se pueden usar para controlar el comportamiento de una canalización y sus actividades. Puede usar Agregar contenido dinámico para especificar parámetros para las propiedades de la actividad de copia. Vamos a especificar Lakehouse/Data Warehouse/KQL Database como ejemplo para ver cómo usarlo.

  1. En el origen o destino, después de seleccionar Área de trabajo como tipo de almacén de datos y especificar la base de datos KQL de Lakehouse/Data Warehouse/como tipo de almacén de datos del área de trabajo, seleccioneAgregar contenidodinámico en la lista desplegable deLakehouse o Data Warehouse o KQL Database.

  2. En el panel emergente Agregar contenido dinámico, en la pestaña Parámetros , seleccione+.

    Captura de pantalla que muestra la página Agregar contenido dinámico.

  3. Especifique el nombre del parámetro y asígnele un valor predeterminado si lo desea, o bien puede especificar el valor del parámetro después de seleccionar Ejecutar en la canalización.

    Captura de pantalla que muestra la creación de un nuevo parámetro.

    Tenga en cuenta que el valor del parámetro debe ser Lakehouse/Data Warehouse/KQL Database id. de objeto. Para obtener el identificador de objeto de base de datos de Lakehouse/Data Warehouse/KQL, abra la base de datos de Lakehouse/Data Warehouse/KQL en el área de trabajo y el identificador es posterior /lakehouses/o /datawarehouses/ /databases/ en la dirección URL.

    • Identificador deobjeto de Lakehouse:

      Captura de pantalla que muestra el id. de objeto de Lakehouse.

    • ID de objeto de Data Warehouse:

      Captura de pantalla que muestra el identificador del objeto de Almacenamiento de datos.

    • ID Objetos de base de datos KQL:

      Captura de pantalla que muestra el identificador del objeto de base de datos KQL.

  4. Seleccione Guardar para volver al panel Agregar contenido dinámico. A continuación, seleccione el parámetro para que aparezca en el cuadro de expresión. A continuación, seleccione Aceptar. Volverá a la página de canalización y verá que la expresión de parámetro se especifica después de que el identificador de objeto de Lakehouse Id/. de objeto de ID Data Warehouse/. de objeto KQL Database id.

    Captura de pantalla que muestra la selección de parámetros.