Compartir a través de


Copia masiva desde archivos a una base de datos

SE APLICA A: Azure Data Factory Azure Synapse Analytics

Sugerencia

Pruebe Data Factory en Microsoft Fabric, una solución de análisis todo en uno para empresas. Microsoft Fabric abarca todo, desde el movimiento de datos hasta la ciencia de datos, el análisis en tiempo real, la inteligencia empresarial y los informes. ¡Obtenga más información sobre cómo iniciar una nueva evaluación gratuita!

Este artículo describe una plantilla de solución para copiar datos de forma masiva desde Azure Data Lake Storage Gen2 a Azure Synapse Analytics/Azure SQL Database.

Acerca de esta plantilla de solución

Esta plantilla recupera archivos de un origen de Azure Data Lake Storage Gen2. A continuación, recorre en iteración cada archivo de origen y copia el archivo al almacén de datos de destino.

Actualmente, esta plantilla solo admite la copia de datos en formato DelimitedText. Los archivos de otros formatos de datos también se pueden recuperar del almacén de datos de origen, pero no se pueden copiar en el almacén de datos de destino.

La plantilla contiene tres actividades:

  • La actividad Obtener metadatos recupera archivos de Azure Data Lake Storage Gen2 y los envía a la actividad ForEach posterior.
  • La actividad ForEach obtiene los archivos de la actividad Obtener metadatos e itera cada archivo en la actividad Copiar.
  • La actividad Copiar reside en la actividad ForEach para copiar cada archivo del almacén de datos de origen al almacén de datos de destino.

La plantilla define los dos parámetros siguientes:

  • SourceContainer es la ruta de acceso del contenedor raíz en el que se copian los datos en el Azure Data Lake Storage Gen2.
  • SourceDirectory es la ruta de acceso del directorio en el contenedor raíz del que se copian los datos en el Azure Data Lake Storage Gen2.

Uso de esta plantilla de solución

  1. Abra Azure Data Factory Studio y seleccione la pestaña Autor con el icono de lápiz.

  2. Mantenga el puntero sobre la sección Canalizaciones y seleccione los puntos suspensivos que aparecen en el lado derecho. Después, seleccione Pipeline from template (Canalización a partir de una plantilla). Captura de pantalla de la interfaz de usuario de Data Factory en la que se muestra el botón Canalización a partir de una plantilla.

  3. Seleccione la plantilla Copia masiva de archivos a base de datos y, después, Continuar. Captura de pantalla de la plantilla Copia masiva de archivos a base de datos en el explorador de plantillas.

  4. Cree una nueva conexión al almacén gen2 de origen como origen y otra a la base de datos del receptor. Luego seleccione Usar esta plantilla.

    Captura de pantalla del editor de plantillas con los orígenes y los orígenes de datos del receptor resaltados.

  5. Se crea una canalización como se muestra en el ejemplo siguiente:

    Revisión de la canalización

  6. Seleccione Depurar, escriba los parámetros y, a continuación, seleccione Finalizar.

    Clic en **Depurar**

  7. Cuando la ejecución de canalización se complete correctamente, verá resultados similares al ejemplo siguiente:

    Revisión del resultado