Compartir vía


Configurar el modo de simultaneidad alta para cuadernos de Fabric

Al ejecutar un cuaderno en Microsoft Fabric, se inicia una sesión de Apache Spark y se usa para ejecutar las consultas enviadas como parte de las ejecuciones de celdas del cuaderno. Con el modo de simultaneidad alto habilitado, no es necesario iniciar nuevas sesiones de Spark cada vez que ejecute un cuaderno.

Si ya tiene una sesión de alta simultaneidad en ejecución, podría adjuntar cuadernos a esta sesión para obtener al instante una sesión de Spark, lo que le permitiría ejecutar las consultas y lograr una mayor tasa de uso de la sesión.

Animación que muestra una sesión de alta concurrencia para notebooks.

Nota:

El uso compartido de sesiones basado en el modo de simultaneidad alta siempre está dentro de un único límite de usuario. Los cuadernos deben tener configuraciones de Spark coincidentes, deben formar parte de la misma área de trabajo, compartir el mismo lakehouse y las mismas bibliotecas predeterminados para compartir una sola sesión de Spark.

Condiciones para el uso compartido de sesiones

Para que los cuadernos compartan una única sesión de Spark, deben:

  • Estar ejecutadas por el mismo usuario.
  • Tener la misma instancia de Data Lakehouse predeterminada. Los cuadernos sin una instancia predeterminada de Data Lakehouse pueden compartir sesiones con otros cuadernos que no tienen una instancia predeterminada.
  • Tener las mismas configuraciones de proceso de Spark.
  • Tener los mismos paquetes de biblioteca. Puede tener instalaciones de biblioteca insertadas diferentes como parte de las celdas del cuaderno y compartir la sesión con cuadernos que tengan dependencias de biblioteca diferentes.

Configuración del modo de simultaneidad alta

De forma predeterminada, todas las áreas de trabajo de Fabric están habilitadas con el modo de simultaneidad alta. Siga estos pasos para configurar la característica de simultaneidad alta:

  1. Haga clic en la opción Configuración del área de trabajo de Fabric.

  2. Ve a la sección Ingeniería/ciencia de datos>Configuración de Spark>Alta simultaneidad.

  3. En la sección Alta simultaneidad , habilite la configuración Para cuadernos . Puede habilitar o deshabilitar la configuración en este panel.

    Captura de pantalla que muestra la sección de alta simultaneidad en la configuración del área de trabajo.

  4. Habilitar la opción de simultaneidad alta permite a los usuarios iniciar una sesión de simultaneidad alta en sus cuadernos o asociarse a la sesión de simultaneidad alta existente.

  5. Al deshabilitar el modo de simultaneidad alta, se oculta la sección para configurar el período de inactividad y también se oculta la opción de iniciar una nueva sesión de simultaneidad alta en el menú del cuaderno.

    Captura de pantalla que muestra la opción de alta simultaneidad deshabilitada en la configuración del área de trabajo.

Ejecutar cuadernos en una sesión de simultaneidad alta

  1. Abra el área de trabajo Fabric.

  2. Cree un cuaderno o abra un cuaderno existente.

  3. Vaya a la pestaña Ejecutar de la cinta de opciones de menú y seleccione la lista desplegable Tipo de sesión que tiene Estándar seleccionado como opción predeterminada.

    Captura de pantalla que muestra la opción de alta simultaneidad en el menú Cuaderno.

  4. Seleccione Nueva sesión de simultaneidad alta.

  5. Una vez iniciada la sesión de simultaneidad alta, puede agregar hasta 5 cuadernos en la sesión de simultaneidad alta.

    Captura de pantalla que muestra la opción para iniciar una nueva sesión de simultaneidad alta en el menú Cuaderno.

  6. Crea un cuaderno; para ello, ve al menú Ejecutar, tal como se mencionó en los pasos anteriores, en el menú desplegable ahora verás la sesión de simultaneidad alta recién creada.

  7. Al seleccionar la sesión de simultaneidad alta existente, se adjunta el segundo cuaderno a la sesión.

    Captura de pantalla que muestra la opción de adjuntar a una sesión de alta concurrencia existente en el menú del Bloc de notas.

  8. Una vez conectado el cuaderno, puede empezar a ejecutar los pasos del cuaderno al instante.

  9. El estado de la sesión de alta simultaneidad también muestra el número de cuadernos adjuntos a una sesión determinada en cualquier momento dado.

  10. En cualquier momento si cree que el cuaderno asociado a una sesión de alta simultaneidad requiere un proceso más dedicado, puede optar por cambiar el cuaderno a una sesión estándar seleccionando la opción de desasociar el cuaderno de la alta simultaneidad en la pestaña menú Ejecutar.

    Captura de pantalla que muestra la opción de desconectar de una sesión con alta concurrencia en el menú Notebook.

  11. Puede ver el estado, el tipo y el identificador de la sesión en la barra de estado. Seleccione el identificador de sesión para explorar los trabajos ejecutados en esta sesión de simultaneidad alta y para ver los registros de la sesión de Spark en la página de detalles de supervisión.

    Captura de pantalla que muestra los detalles de una sesión de alta simultaneidad en el menú Notebook.

También puede configurar el modo de alta concurrencia para cuadernos de notas en las canalizaciones y usar etiquetas de sesión para agrupar sesiones compartidas.

Supervisar y depurar cuadernos que se ejecutan en una sesión de simultaneidad alta

La supervisión y la depuración suelen ser una tarea no trivial cuando se ejecutan varios cuadernos en una sesión compartida. Para el modo de simultaneidad alta en Fabric, se ofrece la separación de registros, lo que permitiría a los usuarios realizar un seguimiento de los registros emitidos por eventos de Spark de diferentes cuadernos.

  1. Cuando la sesión está en curso o en estado completado, puede ver el estado de la sesión; para ello, vaya al menú Ejecutar y seleccione la opción Todas las ejecuciones

  2. Esto abriría el historial de ejecución del cuaderno en el que se muestra la lista de sesiones activas e históricas actuales de Spark

    Captura de pantalla que muestra la página de todas las ejecuciones de un cuaderno en una sesión de simultaneidad alta.

  3. Los usuarios al seleccionar una sesión pueden acceder a la vista de detalles de supervisión, que muestra la lista de todos los trabajos de Spark que se han ejecutado en la sesión.

  4. En el caso de una sesión de simultaneidad alta, los usuarios podrían identificar los trabajos y sus registros asociados de distintos cuadernos mediante la pestaña Cuaderno relacionado, que muestra el cuaderno desde el que se ha ejecutado ese trabajo.

    Captura de pantalla que muestra todos los cuadernos relacionados con la sesión de simultaneidad alta en la vista detallada de supervisión.

En este documento, obtendrá una comprensión básica de una sesión compartida a través del modo de simultaneidad alta en cuadernos. Pase a los siguientes artículos para aprender a crear y empezar a trabajar con sus propias experiencias de Ingeniería de datos mediante Lakehouse y Notebooks: