Compartir por


Introducción a Azure Data Factory

SE APLICA A: Azure Data Factory Azure Synapse Analytics

Sugerencia

Pruebe Data Factory en Microsoft Fabric, una solución de análisis todo en uno para empresas. Microsoft Fabric abarca todo, desde el movimiento de datos hasta la ciencia de datos, el análisis en tiempo real, la inteligencia empresarial y los informes. Obtenga información sobre cómo iniciar una nueva evaluación gratuita.

Bienvenido a Azure Data Factory Este artículo le ayuda a crear su primera factoría de datos y canalización en un plazo de cinco minutos.

La plantilla de Azure Resource Manager (plantilla de ARM) de este artículo crea y configura todo lo que necesita. A continuación, puede ir a la factoría de datos de demostración y desencadenar la canalización, que mueve algunos datos de ejemplo de una carpeta de Azure Blob Storage a otra.

Prerrequisitos

Si no tiene una suscripción a Azure, cree una cuenta gratuita antes de empezar.

Resumen en vídeo

En el vídeo siguiente se proporciona un tutorial del ejemplo de este artículo:

Paso 1: Uso de la demostración para crear recursos

En este escenario de demostración, usará la actividad de copia en una factoría de datos para copiar un blob denominado moviesDB2.csv de una carpeta de entrada de Azure Blob Storage en una carpeta de salida. En un escenario real, esta operación de copia podría estar entre cualquiera de los muchos orígenes de datos y receptores admitidos disponibles en el servicio. También podría implicar transformaciones en los datos.

  1. Seleccione el botón siguiente.

    Pruebe la primera demo de factoría de datos

    Al seleccionar el botón se crean los siguientes recursos de Azure:

    • Una cuenta de Azure Data Factory
    • Una factoría de datos que contiene una canalización con una actividad de copia
    • Una cuenta de Azure Blob Storage con moviesDB2.csv cargado en una carpeta de entrada como origen
    • Un servicio vinculado para conectar la factoría de datos a Blob Storage
  2. Se le dirigirá a la página de configuración para implementar la plantilla. En esta página:

    1. En Grupo de recursos, seleccione Crear nuevo para crear un grupo de recursos. Puede dejar todos los demás valores tal como están por defecto.

    2. Seleccione Revisar y crear y, a continuación, seleccione Crear para implementar los recursos.

    Captura de pantalla de la página para implementar una plantilla para la creación de recursos.

Nota

El usuario que implementa la plantilla debe asignar un rol a una identidad administrada. Este paso requiere permisos que se pueden conceder a través del rol Propietario, Administrador de acceso de usuario o Operador de identidad administrada.

Todos los recursos de esta demostración se crean en el nuevo grupo de recursos, por lo que puede limpiarlos fácilmente más adelante.

Paso 2: revise los recursos implementados

  1. En el mensaje que muestra la finalización correcta de la implementación, seleccione Ir al grupo de recursos.

    Captura de pantalla de la página de Azure Portal que muestra la implementación correcta de la plantilla de demostración.

  2. El grupo de recursos incluye la nueva factoría de datos, la cuenta de Blob Storage y la identidad administrada que creó la implementación. Seleccione la factoría de datos en el grupo de recursos para verla.

    Captura de pantalla del contenido del grupo de recursos creado para la demostración, con la factoría de datos resaltada.

  3. Seleccione el botón Iniciar estudio .

    Captura de pantalla de Azure Portal que muestra los detalles de la factoría de datos recién creada, con el botón para abrir Azure Data Factory Studio resaltado.

  4. En Azure Data Factory Studio:

    1. Seleccione la pestaña Autorpestaña Autor.
    2. Seleccione la canalización que creó la plantilla.
    3. Para comprobar los datos de origen, seleccione Abrir.

    Captura de pantalla de Azure Data Factory Studio que muestra la canalización creada por la plantilla.

  5. En el conjunto de datos de origen, seleccione Examinar para ver el archivo de entrada creado para la demostración.

    Captura de pantalla del conjunto de datos de origen, con el botón Examinar resaltado.

    Anote el archivo moviesDB2.csv, que ya se cargó en la carpeta de entrada.

    Captura de pantalla del contenido de la carpeta de entrada, en la que se muestra el archivo de entrada usado en la demostración.

Paso 3: Desencadenamiento de la canalización de demostración que se va a ejecutar

  1. Seleccione Agregar desencadenador y, a continuación, seleccione Desencadenar ahora.

    Captura de pantalla del botón para desencadenar la canalización de demostración que se va a ejecutar.

  2. En el panel derecho, en Ejecución de canalización, seleccione Aceptar.

Supervisar la canalización

  1. Seleccione la pestaña SupervisiónMonitor tab. En esta pestaña se proporciona información general sobre las ejecuciones de canalización, incluida la hora de inicio y el estado.

    Recorte de pantalla de la pestaña para supervisar las ejecuciones de canalización en una factoría de datos.

  2. En este inicio rápido, la canalización solo tiene un tipo de actividad: Copiar datos. Seleccione el nombre de la canalización para ver los detalles de los resultados de ejecución de la actividad de copia.

    Captura de pantalla de los resultados de ejecución de una actividad de copia en la pestaña para supervisar una factoría de datos.

  3. Seleccione el icono Detalles para mostrar el proceso de copia detallado. En los resultados, los tamaños de lectura de datos y de escritura de datos son los mismos, y un archivo se leyó y se escribió. Esta información demuestra que todos los datos se copiaron correctamente en el destino.

    Captura de pantalla de los resultados detallados de la ejecución de una actividad de copia.

Limpieza de recursos

Puede limpiar todos los recursos que creó en este artículo de dos maneras:

  • Puede eliminar el grupo de recursos de Azure completo, lo que incluye todos los recursos del mismo.

  • Si desea mantener intactos algunos recursos, vaya al grupo de recursos y elimine solo los recursos específicos que desea quitar.

    Por ejemplo, si usa esta plantilla para crear una factoría de datos para usarla en otro tutorial, puede eliminar los demás recursos, pero mantener solo la factoría de datos.

En este artículo, ha creado una factoría de datos que contenía una canalización con una actividad de copia. Para más información sobre Azure Data Factory, continúe con el siguiente artículo y módulo de entrenamiento: