Configurar el modo de simultaneidad alta para cuadernos de Fabric
Al ejecutar un cuaderno en Microsoft Fabric, se inicia una sesión de Apache Spark y se usa para ejecutar las consultas enviadas como parte de las ejecuciones de celdas del cuaderno. Con el modo de simultaneidad alta habilitado, no es necesario iniciar nuevas sesiones de Spark cada vez que ejecute un cuaderno.
Si ya tiene una sesión de simultaneidad alta en ejecución, podría adjuntar cuadernos a la sesión de simultaneidad alta obteniendo una sesión de Spark al instante para ejecutar las consultas y lograr una mayor tasa de uso de la sesión.
Nota:
El uso compartido de sesiones basado en el modo de simultaneidad alta siempre está dentro de un único límite de usuario. Los cuadernos deben tener configuraciones de Spark coincidentes, deben formar parte de la misma área de trabajo, compartir el mismo lakehouse y las mismas bibliotecas predeterminados para compartir una sola sesión de Spark.
Condiciones para el uso compartido de sesiones
Para que los cuadernos compartan una única sesión de Spark, deben:
- Estar ejecutadas por el mismo usuario.
- Tener la misma instancia de Data Lakehouse predeterminada. Los cuadernos sin una instancia predeterminada de Data Lakehouse pueden compartir sesiones con otros cuadernos que no tienen una instancia predeterminada.
- Tener las mismas configuraciones de proceso de Spark.
- Tener los mismos paquetes de biblioteca. Puede tener instalaciones de biblioteca insertadas diferentes como parte de las celdas del cuaderno y compartir la sesión con cuadernos que tengan dependencias de biblioteca diferentes.
Configuración del modo de simultaneidad alta
De forma predeterminada, todas las áreas de trabajo de Fabric están habilitadas con el modo de simultaneidad alta. Siga estos pasos para configurar la característica de simultaneidad alta:
Haga clic en la opción Configuración del área de trabajo en el área de trabajo de Fabric
Vaya a la sección Synapse>Proceso de Spark>Simultaneidad alta
En la sección Alta simultaneidad, puede optar por habilitar o deshabilitar la configuración.
Habilitar la opción de simultaneidad alta permite a los usuarios iniciar una sesión de simultaneidad alta en sus cuadernos o asociarse a la sesión de simultaneidad alta existente.
Al deshabilitar el modo de simultaneidad alta, se oculta la sección para configurar el período de inactividad y también se oculta la opción de iniciar una nueva sesión de simultaneidad alta en el menú del cuaderno.
Ejecutar cuadernos en una sesión de simultaneidad alta
Abrir el área de trabajo de Fabric
Crear un cuaderno o abrir un cuaderno existente
Vaya a la pestaña Ejecutar de la cinta de opciones de menú y seleccione en la lista desplegable Tipo de sesión que tiene seleccionada la opción Estándar como opción predeterminada.
Seleccione Nueva sesión de simultaneidad alta.
Una vez iniciada la sesión de simultaneidad alta, puede agregar hasta 5 cuadernos en la sesión de simultaneidad alta.
Cree un cuaderno y, para ello, vaya al menú Ejecutar, tal como se mencionó en los pasos anteriores, en el menú desplegable ahora verá la sesión de simultaneidad alta recién creada.
Al seleccionar la sesión de simultaneidad alta existente, se adjunta el segundo cuaderno a la sesión.
Una vez conectado el cuaderno, puede empezar a ejecutar los pasos del cuaderno al instante.
El estado de la sesión de alta simultaneidad también muestra el número de cuadernos adjuntos a una sesión determinada en cualquier momento dado.
En cualquier momento si cree que el cuaderno asociado a una sesión de simultaneidad alta requiere un proceso más dedicado, puede elegir cambiar el cuaderno a una sesión estándar seleccionando la opción de desasociar el cuaderno de la simultaneidad alta en la pestaña de menú Ejecutar.
Puede ver el estado de la sesión, el tipo y el id. de sesión navegando a la barra de estado, seleccionar el id. de sesión le permite explorar los trabajos ejecutados en esta sesión de simultaneidad alta y ver los registros de la sesión de Spark en la página de detalles de supervisión.
Supervisar y depurar cuadernos que se ejecutan en una sesión de simultaneidad alta
La supervisión y la depuración suelen ser una tarea no trivial cuando se ejecutan varios cuadernos en una sesión compartida. Para el modo de simultaneidad alta en Fabric, se ofrece la separación de registros, lo que permitiría a los usuarios realizar un seguimiento de los registros emitidos por eventos de Spark de diferentes cuadernos.
Cuando la sesión está en curso o en estado completado, puede ver el estado de la sesión; para ello, vaya al menú Ejecutar y seleccione la opción Todas las ejecuciones
Esto abriría el historial de ejecución del cuaderno en el que se muestra la lista de sesiones activas e históricas actuales de Spark
Los usuarios al seleccionar una sesión pueden acceder a la vista de detalles de supervisión, que muestra la lista de todos los trabajos de Spark que se han ejecutado en la sesión.
En el caso de una sesión de simultaneidad alta, los usuarios podrían identificar los trabajos y sus registros asociados de distintos cuadernos mediante la pestaña Cuaderno relacionado, que muestra el cuaderno desde el que se ha ejecutado ese trabajo.
Contenido relacionado
En este documento, obtendrá una comprensión básica de una sesión compartida a través del modo de simultaneidad alta en cuadernos. Pase a los siguientes artículos para aprender a crear y empezar a trabajar con sus propias experiencias de Ingeniería de datos mediante Lakehouse y Notebooks:
- Para empezar a trabajar con un lakehouse, consulte Crear un lakehouse.
- Para empezar a trabajar con Notebooks, consulte Cómo usar un Notebook