Ingesta de datos en el almacén mediante canalizaciones de datos
Esto se aplica a:✅ almacén en Microsoft Fabric
Las canalizaciones de datos ofrecen una alternativa al uso del comando COPY a través de una interfaz gráfica de usuario. Una canalización de datos es una agrupación lógica de actividades que realizan una tarea de ingesta de datos. Las canalizaciones permiten administrar las actividades de extracción, transformación y carga (ETL) en lugar de administrar cada una individualmente.
En este tutorial, creará una nueva canalización que cargará datos de ejemplo en un almacén de Microsoft Fabric.
Nota:
Algunas características de Azure Data Factory no están disponibles en Microsoft Fabric, pero los conceptos son intercambiables. Puede obtener más información sobre Azure Data Factory y canalizaciones en Canalizaciones y actividades en Azure Data Factory y Azure Synapse Analytics. Para ver un inicio rápido, visite Inicio rápido: creación de la primera canalización para copiar datos.
Crear una canalización de datos
Para crear una canalización nueva, vaya al área de trabajo, seleccione el botón +Nuevo y seleccione Canalización de datos.
En el cuadro de diálogo Nueva canalización, proporcione un nombre para la nueva canalización y seleccione Crear.
Llegará al área de lienzo de la canalización, donde verá tres opciones para empezar: Agregar una actividad de canalización, Copiar datos y Elegir una tarea para comenzar.
Cada una de estas opciones ofrece diferentes alternativas para crear una canalización:
- Agregar una actividad de canalización: esta opción inicia el editor de canalizaciones, donde puede crear nuevas canalizaciones desde cero mediante actividades de canalización.
- Copiar datos: esta opción inicia un asistente paso a paso que le ayudará a seleccionar un origen de datos, un destino y configurar opciones de carga de datos, como las asignaciones de columnas. Al finalizar, creará una nueva actividad de canalización con una tarea Copiar datos ya configurada automáticamente.
- Elegir una tarea para comenzar: esta opción iniciará un conjunto de plantillas predefinidas para ayudarle a empezar a trabajar con canalizaciones basadas en diferentes escenarios.
Seleccione la opción Copiar datos para iniciar el Asistente de copia.
La primera página del asistente Copiar datos le ayudará a elegir sus propios datos de varios orígenes de datos o a seleccionar uno de los ejemplos proporcionados para comenzar. En este tutorial, usaremos el ejemplo Lago de datos de la COVID-19. Seleccione esta opción y elija Siguiente.
En la página siguiente, podrá seleccionar un conjunto de datos, el formato de archivo de origen y obtener una vista previa del conjunto de datos seleccionado. Seleccione Bing COVID-19, el formato CSV y seleccione Siguiente.
La siguiente página, Destinos de datos, permite configurar el tipo del área de trabajo de destino. Cargaremos datos en un almacén de nuestra área de trabajo, así que seleccione la pestaña Almacenamiento y la opción Almacenamiento de datos. Seleccione Siguiente.
Ahora es el momento de elegir el almacenamiento en el que cargar los datos. Selecciona el almacén deseado en la lista desplegable y selecciona Siguiente.
El último paso para configurar el destino consiste en proporcionar un nombre a la tabla de destino y configurar las asignaciones de columnas. Aquí puede elegir cargar los datos en una nueva tabla o en una existente, proporcionar un esquema y nombres de tabla, cambiar los nombres de las columnas, quitar columnas o cambiar sus asignaciones. Es posible aceptar los valores predeterminados o ajustar la configuración a su preferencia.
Cuando haya terminado de revisar las opciones, seleccione Siguiente.
La página siguiente ofrece la opción de usar el almacenamiento provisional o proporcionar opciones avanzadas para la operación de copia de datos (que usa el comando COPY de T-SQL). Revise las opciones sin cambiarlas y seleccione Siguiente.
La última página del asistente ofrece un resumen de la actividad de copia. Seleccione la opción Iniciar transferencia de datos inmediatamente y seleccione Guardar y ejecutar.
Se le dirigirá al área de lienzo de la canalización, donde ya está configurada una nueva actividad Copiar datos. La canalización comenzará a ejecutarse automáticamente. Es posible supervisar el estado de la canalización en el panel Salida:
Después de unos segundos, la canalización finalizará correctamente. Volviendo al almacén, seleccione la tabla para obtener una vista previa de los datos y confirmar que la operación de copia haya finalizado.
Para obtener más información sobre ingesta de datos en el almacén en Microsoft Fabric, visite:
- Ingesta de datos en el almacén
- Ingesta de datos en el almacén mediante la instrucción COPY
- Ingesta de datos en el almacén mediante Transact-SQL