Partekatu bidez


Creación y ejecución de la actividad de funciones de datos de usuario en canalizaciones

Ejecute las funciones personalizadas de Python como parte de flujos de trabajo de datos automatizados agregando una actividad de funciones de datos de usuario a una canalización de Fabric. Esta integración le permite centralizar la lógica de negocios en funciones y llamarlas durante los procesos ETL programados, lo que elimina la necesidad de duplicar el código entre cuadernos y scripts.

Cuándo usar funciones en canalizaciones

Agregue una actividad de funciones sobre datos de usuario a su canalización cuando necesite:

  • Aplicar reglas de negocio durante el movimiento de datos: valide, limpie o transforme los datos a medida que fluye a través de la canalización. Por ejemplo, normalice las categorías de productos o aplique reglas de precios antes de cargarse en un almacén.
  • Programar lógica reutilizable: ejecute la misma lógica de negocios según una programación sin mantener una infraestructura independiente.

Prerrequisitos

Para empezar, debe completar los siguientes requisitos previos:

Adición de la actividad Functions a una canalización

Las canalizaciones de tejido proporcionan una manera visual de orquestar actividades de movimiento y transformación de datos. En esta sección, crearás una canalización y agregarás una actividad de funciones a esta. En una sección posterior, configurarás la actividad específicamente para la función de datos de usuario.

Para crear una canalización con una actividad de Functions:

  1. En su área de trabajo, seleccione + Nuevo elemento.

  2. En el cuadro de diálogo Nuevo elemento, busque Pipeline y selecciónelo.

  3. En el cuadro de diálogo Nueva canalización , escriba un nombre para la canalización y seleccione Crear.

  4. En la página principal de la canalización, seleccione la pestaña Actividades .

  5. En la cinta actividades, seleccione el icono ... (puntos suspensivos) para ver más actividades.

  6. Busque Funciones en la lista de actividades de Orchestrate y, a continuación, selecciónela para agregar la actividad de funciones al lienzo de la canalización.

    Recorte de pantalla en el que se muestra cómo buscar la actividad de funciones.

Configura la actividad para las funciones de datos de usuario

Después de agregar la actividad de funciones al lienzo, configúrela para llamar a la función de datos de usuario.

Configuración general

  1. Seleccione la actividad de funciones en el canvas.

  2. Seleccione la pestaña General.

  3. Escriba un nombre para la actividad.

    Recorte de pantalla en el que se muestra la configuración general de la actividad de funciones.

  4. Opcionalmente, configure los valores de reintento y especifique si va a pasar una entrada o salida seguras.

Configuración de las opciones de función

  1. Seleccione la pestaña Configuración .

  2. Seleccione Funciones de datos de usuario de Fabric como Tipo.

  3. En la lista desplegable Conexión , seleccione una conexión que quiera usar. Si no ve la conexión que desea, seleccione Examinar todo.

  4. En el cuadro de diálogo Elegir un origen de datos para empezar , busque Funciones de datos de usuario y selecciónelo. Debería verlo en Nuevas fuentes.

  5. En el cuadro de diálogo Conectar al origen de datos, puede mantener el nombre de conexión predeterminado y las credenciales. Asegúrese de que ha iniciado sesión y, a continuación, seleccione Conectar.

    Captura de pantalla de la selección de Funciones de datos de usuario en el panel de conexión.

    Nota:

    Si ya tiene una conexión, es posible que se preseleccione en el cuadro de diálogo. Puede mantener la conexión existente o seleccionar Crear nueva conexión en la lista desplegable para crear una nueva.

  6. De nuevo en la configuración de actividad, seleccione UserDataFunctions en la lista desplegable Conexión . Esta es la conexión que acaba de crear.

    Captura de pantalla de la selección de la conexión UserDataFunctions.

  7. Seleccione el área de trabajo que contiene el elemento de funciones de datos de usuario.

  8. Seleccione el nombre del elemento Funciones de datos de usuario.

  9. Seleccione la función que desea invocar.

  10. Proporcione parámetros de entrada para la función seleccionada. Puede usar valores estáticos o contenido dinámico proveniente de expresiones de 'pipelines'.

    Recorte de pantalla en el que se muestra la configuración de la actividad de funciones.

    Nota:

    Para escribir contenido dinámico, seleccione el campo que desea rellenar y presione Alt+Mayús+D para abrir el generador de expresiones.

Pasar parámetros dinámicos

Para pasar valores de otras actividades o variables de pipeline a tu función:

  1. Seleccione un campo que admita contenido dinámico, como el campo Valor del name parámetro mostrado anteriormente.

  2. Presione Alt+Mayús+D para abrir el generador de expresiones.

  3. Use expresiones de canalización para hacer referencia a variables, parámetros o resultados de actividades anteriores. Por ejemplo, use @pipeline().parameters.PipelineName para pasar un parámetro de canalización a la función.

    Captura de pantalla que muestra el generador de expresiones.

Para obtener más información sobre las expresiones de canalización, consulte Expresiones y funciones.

Utilizar la salida de la función en actividades subsecuentes

El valor devuelto de la función está disponible en el resultado de la actividad. Para hacer referencia al resultado en las actividades que siguen:

  1. Agregue otra actividad al flujo de trabajo después de la actividad Funciones.

  2. Seleccione la actividad Functions y arrastre su resultado En caso de éxito (la marca de verificación verde en el lado derecho de la actividad) a la nueva actividad. Esto crea una dependencia para que la nueva actividad se ejecute después de que la función se complete correctamente.

  3. Seleccione la nueva actividad y busque un campo que admita contenido dinámico.

  4. Presione Alt+Mayús+D para abrir el generador de expresiones.

  5. Use la expresión @activity('YourFunctionActivityName').output para hacer referencia al valor devuelto de la función. Por ejemplo, el nombre de la actividad de función es Functions1, puede usar @activity('Functions1').output para hacer referencia a su salida.

    Captura de pantalla que muestra el generador de expresiones para las actividades de nivel inferior.

La estructura exacta de la salida depende de lo que devuelve la función. Por ejemplo, si la función devuelve un diccionario, puede acceder a propiedades específicas como @activity('YourFunctionActivityName').output.propertyName.

Guardar y ejecutar la canalización

Después de configurar la actividad Functions y cualquier otra actividad para la canalización:

  1. Seleccione la pestaña Inicio en la parte superior del editor de canalizaciones.
  2. Seleccione Guardar para guardar la canalización.
  3. Seleccione Ejecutar para ejecutar la canalización inmediatamente o seleccione Programar para configurar una programación periódica.

Una vez que se haya ejecutado, puede supervisar la ejecución de la canalización y ver el historial de ejecución desde la pestaña Salida debajo del lienzo. Para más información, consulte Monitorización de procesos del pipeline.