Compartir vía


Ingesta de datos en el almacén mediante canalizaciones de datos

Esto se aplica a:✅ almacén en Microsoft Fabric

Las canalizaciones de datos ofrecen una alternativa al uso del comando COPY a través de una interfaz gráfica de usuario. Una canalización de datos es una agrupación lógica de actividades que realizan una tarea de ingesta de datos. Las canalizaciones permiten administrar las actividades de extracción, transformación y carga (ETL) en lugar de administrar cada una individualmente.

En este tutorial, creará una nueva canalización que cargará datos de ejemplo en un almacén de Microsoft Fabric.

Nota:

Algunas características de Azure Data Factory no están disponibles en Microsoft Fabric, pero los conceptos son intercambiables. Puede obtener más información sobre Azure Data Factory y canalizaciones en Canalizaciones y actividades en Azure Data Factory y Azure Synapse Analytics. Para ver un inicio rápido, visite Inicio rápido: creación de la primera canalización para copiar datos.

Crear una canalización de datos

  1. Para crear una canalización nueva, vaya al área de trabajo, seleccione el botón +Nuevo y seleccione Canalización de datos. Captura de pantalla de la sección superior del espacio de trabajo del usuario que muestra el botón Nuevo y las opciones Almacén, Canalización de datos y Mostrar todo.

  2. En el cuadro de diálogo Nueva canalización, proporcione un nombre para la nueva canalización y seleccione Crear.

  3. Llegará al área de lienzo de la canalización, donde verá tres opciones para empezar: Agregar una actividad de canalización, Copiar datos y Elegir una tarea para comenzar.

    Captura de pantalla que muestra las tres opciones que se seleccionan para iniciar la ingestión.

    Cada una de estas opciones ofrece diferentes alternativas para crear una canalización:

    • Agregar una actividad de canalización: esta opción inicia el editor de canalizaciones, donde puede crear nuevas canalizaciones desde cero mediante actividades de canalización.
    • Copiar datos: esta opción inicia un asistente paso a paso que le ayudará a seleccionar un origen de datos, un destino y configurar opciones de carga de datos, como las asignaciones de columnas. Al finalizar, creará una nueva actividad de canalización con una tarea Copiar datos ya configurada automáticamente.
    • Elegir una tarea para comenzar: esta opción iniciará un conjunto de plantillas predefinidas para ayudarle a empezar a trabajar con canalizaciones basadas en diferentes escenarios.

    Seleccione la opción Copiar datos para iniciar el Asistente de copia.

  4. La primera página del asistente Copiar datos le ayudará a elegir sus propios datos de varios orígenes de datos o a seleccionar uno de los ejemplos proporcionados para comenzar. En este tutorial, usaremos el ejemplo Lago de datos de la COVID-19. Seleccione esta opción y elija Siguiente.

    Captura de pantalla que muestra opciones para usar datos de muestra u otros orígenes de datos.

  5. En la página siguiente, podrá seleccionar un conjunto de datos, el formato de archivo de origen y obtener una vista previa del conjunto de datos seleccionado. Seleccione Bing COVID-19, el formato CSV y seleccione Siguiente.

    Captura de pantalla que muestra diferentes opciones de conjuntos de datos para la muestra de COVID-19, formatos de archivo y una cuadrícula que muestra una vista previa de los datos.

  6. La siguiente página, Destinos de datos, permite configurar el tipo del área de trabajo de destino. Cargaremos datos en un almacén de nuestra área de trabajo, así que seleccione la pestaña Almacenamiento y la opción Almacenamiento de datos. Seleccione Siguiente.

    Captura de pantalla que muestra diferentes opciones de destino.

  7. Ahora es el momento de elegir el almacenamiento en el que cargar los datos. Selecciona el almacén deseado en la lista desplegable y selecciona Siguiente.

    Captura de pantalla que muestra una lista desplegable con un almacén seleccionado.

  8. El último paso para configurar el destino consiste en proporcionar un nombre a la tabla de destino y configurar las asignaciones de columnas. Aquí puede elegir cargar los datos en una nueva tabla o en una existente, proporcionar un esquema y nombres de tabla, cambiar los nombres de las columnas, quitar columnas o cambiar sus asignaciones. Es posible aceptar los valores predeterminados o ajustar la configuración a su preferencia.

    Captura de pantalla que muestra las opciones para cargar datos en una tabla existente o crear una nueva.

    Cuando haya terminado de revisar las opciones, seleccione Siguiente.

  9. La página siguiente ofrece la opción de usar el almacenamiento provisional o proporcionar opciones avanzadas para la operación de copia de datos (que usa el comando COPY de T-SQL). Revise las opciones sin cambiarlas y seleccione Siguiente.

  10. La última página del asistente ofrece un resumen de la actividad de copia. Seleccione la opción Iniciar transferencia de datos inmediatamente y seleccione Guardar y ejecutar.

    Captura de pantalla que muestra la opción de iniciar la operación de transferencia de datos inmediatamente y los botones Atrás y Guardar + Ejecutar.

  11. Se le dirigirá al área de lienzo de la canalización, donde ya está configurada una nueva actividad Copiar datos. La canalización comenzará a ejecutarse automáticamente. Es posible supervisar el estado de la canalización en el panel Salida:

    Captura de pantalla que muestra el lienzo de la canalización con una actividad de copia en el centro y el estado de ejecución de la canalización mostrando el estado actual En curso.

  12. Después de unos segundos, la canalización finalizará correctamente. Volviendo al almacén, seleccione la tabla para obtener una vista previa de los datos y confirmar que la operación de copia haya finalizado.

    Captura de pantalla que muestra un almacén con la tabla bing_covid_19 seleccionada y una cuadrícula que muestra una vista previa de los datos de la tabla.

Para obtener más información sobre ingesta de datos en el almacén en Microsoft Fabric, visite:

Paso siguiente