Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Al ejecutar un paso de cuaderno en una canalización, se inicia una sesión de Apache Spark y se usa para ejecutar las consultas enviadas desde el cuaderno. Al habilitar el modo de simultaneidad alta para canalizaciones, los cuadernos se empaquetarán automáticamente en las sesiones de Spark existentes.
Esto le ofrece la funcionalidad de uso compartido de sesiones en todos los cuadernos dentro de un único límite de usuario. El sistema empaqueta automáticamente todos los cuadernos en una sesión de simultaneidad alta existente.
Nota:
El uso compartido de sesiones con el modo de simultaneidad alta siempre está dentro de un único límite de usuario. Para compartir una única sesión de Spark, los cuadernos deben tener configuraciones de Spark coincidentes, pertenecer a la misma área de trabajo y compartir el mismo lakehouse predeterminado y las mismas bibliotecas.
Condiciones para el uso compartido de sesiones
Para que los cuadernos compartan una sola sesión de Spark, deben:
- Estar ejecutadas por el mismo usuario.
- Tener el mismo almacén de lago predeterminado. Los cuadernos sin un almacén de lago predeterminado pueden compartir sesiones con otros cuadernos que no tienen un almacén de lago predeterminado.
- Tengan las mismas configuraciones de cómputo de Spark.
- Tener los mismos paquetes de biblioteca. Puede tener instalaciones de biblioteca insertadas diferentes como parte de las celdas del cuaderno y compartir la sesión con cuadernos que tienen dependencias de biblioteca diferentes.
Configuración del modo de simultaneidad alta
Los administradores del área de trabajo de Fabric pueden habilitar el modo de alta concurrencia para las canalizaciones mediante la configuración del área de trabajo. Siga estos pasos para configurar la característica de simultaneidad alta:
Seleccione la opción Configuración del área de trabajo en el área de trabajo de Fabric
Ve a la sección Ingeniería/ciencia de datos>Configuración de Spark>Alta simultaneidad.
En la sección Alta simultaneidad, habilite el valor Para la canalización que ejecuta varios cuadernos.
La habilitación de la opción de alta simultaneidad permite todas las sesiones de cuaderno desencadenadas por canalizaciones como una sesión de simultaneidad alta.
El sistema empaqueta automáticamente las sesiones de cuaderno entrantes en sesiones activas de simultaneidad alta. Si no hay sesiones activas de alta concurrencia, se crea una nueva sesión de alta concurrencia y los cuadernos concurrentes enviados se agrupan en la nueva sesión.
Uso de la etiqueta de sesión en el cuaderno para agrupar sesiones compartidas
Dirígete a tu área de trabajo, selecciona el botón Nuevo elemento y crea una nueva canalización.
Vaya a la pestaña Actividades de la cinta de menús y agregue una actividad Cuaderno.
En Configuración avanzada, especifique cualquier valor de cadena para la propiedad etiqueta de sesión.
Una vez que se agregue la etiqueta de sesión, el uso compartido de cuadernos la usa como criterios coincidentes que agrupan todos los cuadernos con la misma etiqueta de sesión.
Nota:
Para optimizar el rendimiento, una sola sesión de alta concurrencia puede compartir recursos entre un máximo de 5 cuadernos identificados por la misma etiqueta de sesión. Cuando se envían más de 5 cuadernos con la misma etiqueta, el sistema creará automáticamente una nueva sesión de alta simultaneidad para hospedar los pasos posteriores del cuaderno. Esto permite un escalado y equilibrio de carga eficientes mediante la distribución de la carga de trabajo entre varias sesiones.
Supervisión y depuración de cuadernos desencadenados por canalizaciones
La supervisión y la depuración pueden resultar difíciles cuando varios cuadernos se ejecutan dentro de una sesión compartida. En el modo de simultaneidad alta, se proporciona la separación de registros, lo que permite realizar el seguimiento de los registros de eventos de Spark para cada cuaderno individual.
Cuando la sesión está en curso o en estado completado, puede ver el estado de la sesión; para ello, vaya al menú Ejecutar y seleccione la opción Todas las ejecuciones.
Esto abre el historial de ejecución del cuaderno con la lista de sesiones activas e históricas actuales de Spark.
Al seleccionar una sesión, puede acceder a la vista de detalles de supervisión, en la que se muestra una lista de todos los trabajos de Spark ejecutados en esa sesión.
Para una sesión de simultaneidad alta, puede identificar los trabajos y sus registros asociados de distintos cuadernos mediante la pestaña Cuaderno relacionado, en la que se muestra el cuaderno desde el que se ha ejecutado ese trabajo.
Contenido relacionado
- Para obtener más información sobre el modo de simultaneidad alta en Microsoft Fabric, consulte modo de simultaneidad alta en Apache Spark for Fabric.
- Para empezar a trabajar con el modo de alta concurrencia para notebooks, consulte Configurar el modo de alta concurrencia para notebooks de Fabric.