Compartir vía


Configurar el modo de simultaneidad alta para cuadernos de Fabric

Al ejecutar un cuaderno en Microsoft Fabric, se inicia una sesión de Apache Spark y se usa para ejecutar las consultas enviadas como parte de las ejecuciones de celdas del cuaderno. Con el modo de simultaneidad alta habilitado, no es necesario iniciar nuevas sesiones de Spark cada vez que ejecute un cuaderno.

Si ya tiene una sesión de simultaneidad alta en ejecución, podría adjuntar cuadernos a la sesión de simultaneidad alta obteniendo una sesión de Spark al instante para ejecutar las consultas y lograr una mayor tasa de uso de la sesión.

Animación que muestra una sesión de simultaneidad alta para cuadernos.

Nota:

El uso compartido de sesiones basado en el modo de simultaneidad alta siempre está dentro de un único límite de usuario. Los cuadernos deben tener configuraciones de Spark coincidentes, deben formar parte de la misma área de trabajo, compartir el mismo lakehouse y las mismas bibliotecas predeterminados para compartir una sola sesión de Spark.

Condiciones para el uso compartido de sesiones

Para que los cuadernos compartan una única sesión de Spark, deben:

  • Estar ejecutadas por el mismo usuario.
  • Tener la misma instancia de Data Lakehouse predeterminada. Los cuadernos sin una instancia predeterminada de Data Lakehouse pueden compartir sesiones con otros cuadernos que no tienen una instancia predeterminada.
  • Tener las mismas configuraciones de proceso de Spark.
  • Tener los mismos paquetes de biblioteca. Puede tener instalaciones de biblioteca insertadas diferentes como parte de las celdas del cuaderno y compartir la sesión con cuadernos que tengan dependencias de biblioteca diferentes.

Configuración del modo de simultaneidad alta

De forma predeterminada, todas las áreas de trabajo de Fabric están habilitadas con el modo de simultaneidad alta. Siga estos pasos para configurar la característica de simultaneidad alta:

  1. Haga clic en la opción Configuración del área de trabajo en el área de trabajo de Fabric

    Captura de pantalla que muestra la navegación a la configuración del área de trabajo.

  2. Vaya a la sección Synapse>Proceso de Spark>Simultaneidad alta

  3. En la sección Alta simultaneidad, puede optar por habilitar o deshabilitar la configuración.

    Captura de pantalla que muestra la sección de alta simultaneidad en la configuración del área de trabajo.

  4. Habilitar la opción de simultaneidad alta permite a los usuarios iniciar una sesión de simultaneidad alta en sus cuadernos o asociarse a la sesión de simultaneidad alta existente.

  5. Al deshabilitar el modo de simultaneidad alta, se oculta la sección para configurar el período de inactividad y también se oculta la opción de iniciar una nueva sesión de simultaneidad alta en el menú del cuaderno.

    Captura de pantalla que muestra la opción de simultaneidad alta desactivada en la configuración del área de trabajo.

Ejecutar cuadernos en una sesión de simultaneidad alta

  1. Abrir el área de trabajo de Fabric

  2. Crear un cuaderno o abrir un cuaderno existente

  3. Vaya a la pestaña Ejecutar de la cinta de opciones de menú y seleccione en la lista desplegable Tipo de sesión que tiene seleccionada la opción Estándar como opción predeterminada.

    Captura de pantalla que muestra la opción de simultaneidad alta en el menú Notebook.

  4. Seleccione Nueva sesión de simultaneidad alta.

  5. Una vez iniciada la sesión de simultaneidad alta, puede agregar hasta 5 cuadernos en la sesión de simultaneidad alta.

    Captura de pantalla que muestra la opción de iniciar una nueva sesión de simultaneidad alta en el menú Notebook.

  6. Cree un cuaderno y, para ello, vaya al menú Ejecutar, tal como se mencionó en los pasos anteriores, en el menú desplegable ahora verá la sesión de simultaneidad alta recién creada.

  7. Al seleccionar la sesión de simultaneidad alta existente, se adjunta el segundo cuaderno a la sesión.

    Captura de pantalla que muestra la opción de adjuntar a una sesión de simultaneidad alta existente en el menú Notebook.

  8. Una vez conectado el cuaderno, puede empezar a ejecutar los pasos del cuaderno al instante.

  9. El estado de la sesión de alta simultaneidad también muestra el número de cuadernos adjuntos a una sesión determinada en cualquier momento dado.

  10. En cualquier momento si cree que el cuaderno asociado a una sesión de simultaneidad alta requiere un proceso más dedicado, puede elegir cambiar el cuaderno a una sesión estándar seleccionando la opción de desasociar el cuaderno de la simultaneidad alta en la pestaña de menú Ejecutar.

    Captura de pantalla que muestra la opción para desasociarse de una sesión de simultaneidad alta en el menú Notebook.

  11. Puede ver el estado de la sesión, el tipo y el id. de sesión navegando a la barra de estado, seleccionar el id. de sesión le permite explorar los trabajos ejecutados en esta sesión de simultaneidad alta y ver los registros de la sesión de Spark en la página de detalles de supervisión.

    Captura de pantalla que muestra los detalles de sesión de una sesión de simultaneidad alta en el menú Notebook.

Supervisar y depurar cuadernos que se ejecutan en una sesión de simultaneidad alta

La supervisión y la depuración suelen ser una tarea no trivial cuando se ejecutan varios cuadernos en una sesión compartida. Para el modo de simultaneidad alta en Fabric, se ofrece la separación de registros, lo que permitiría a los usuarios realizar un seguimiento de los registros emitidos por eventos de Spark de diferentes cuadernos.

  1. Cuando la sesión está en curso o en estado completado, puede ver el estado de la sesión; para ello, vaya al menú Ejecutar y seleccione la opción Todas las ejecuciones

  2. Esto abriría el historial de ejecución del cuaderno en el que se muestra la lista de sesiones activas e históricas actuales de Spark

    Captura de pantalla que muestra la página de todas las ejecuciones de un cuaderno en una sesión de simultaneidad alta.

  3. Los usuarios al seleccionar una sesión pueden acceder a la vista de detalles de supervisión, que muestra la lista de todos los trabajos de Spark que se han ejecutado en la sesión.

  4. En el caso de una sesión de simultaneidad alta, los usuarios podrían identificar los trabajos y sus registros asociados de distintos cuadernos mediante la pestaña Cuaderno relacionado, que muestra el cuaderno desde el que se ha ejecutado ese trabajo.

    Captura de pantalla que muestra todos los cuadernos relacionados con la sesión de simultaneidad alta en la vista detallada de supervisión.

En este documento, obtendrá una comprensión básica de una sesión compartida a través del modo de simultaneidad alta en cuadernos. Pase a los siguientes artículos para aprender a crear y empezar a trabajar con sus propias experiencias de Ingeniería de datos mediante Lakehouse y Notebooks: