Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Al ejecutar un cuaderno en Microsoft Fabric, se inicia una sesión de Apache Spark y se usa para ejecutar las consultas enviadas como parte de las ejecuciones de celdas del cuaderno. Con el modo de simultaneidad alto habilitado, no es necesario iniciar nuevas sesiones de Spark cada vez que ejecute un cuaderno.
Si ya tiene una sesión de alta simultaneidad en ejecución, podría adjuntar cuadernos a esta sesión para obtener al instante una sesión de Spark, lo que le permitiría ejecutar las consultas y lograr una mayor tasa de uso de la sesión.
Nota:
El uso compartido de sesiones basado en el modo de simultaneidad alta siempre está dentro de un único límite de usuario. Los cuadernos deben tener configuraciones de Spark coincidentes, deben formar parte de la misma área de trabajo, compartir el mismo lakehouse y las mismas bibliotecas predeterminados para compartir una sola sesión de Spark.
Condiciones para el uso compartido de sesiones
Para que los cuadernos compartan una única sesión de Spark, deben:
- Estar ejecutadas por el mismo usuario.
- Tener la misma instancia de Data Lakehouse predeterminada. Los cuadernos sin una instancia predeterminada de Data Lakehouse pueden compartir sesiones con otros cuadernos que no tienen una instancia predeterminada.
- Tener las mismas configuraciones de proceso de Spark.
- Tener los mismos paquetes de biblioteca. Puede tener instalaciones de biblioteca insertadas diferentes como parte de las celdas del cuaderno y compartir la sesión con cuadernos que tengan dependencias de biblioteca diferentes.
Configuración del modo de simultaneidad alta
De forma predeterminada, todas las áreas de trabajo de Fabric están habilitadas con el modo de simultaneidad alta. Siga estos pasos para configurar la característica de simultaneidad alta:
Haga clic en la opción Configuración del área de trabajo de Fabric.
Ve a la sección Ingeniería/ciencia de datos>Configuración de Spark>Alta simultaneidad.
En la sección Alta simultaneidad , habilite la configuración Para cuadernos . Puede habilitar o deshabilitar la configuración en este panel.
Habilitar la opción de simultaneidad alta permite a los usuarios iniciar una sesión de simultaneidad alta en sus cuadernos o asociarse a la sesión de simultaneidad alta existente.
Al deshabilitar el modo de simultaneidad alta, se oculta la sección para configurar el período de inactividad y también se oculta la opción de iniciar una nueva sesión de simultaneidad alta en el menú del cuaderno.
Ejecutar cuadernos en una sesión de simultaneidad alta
Abra el área de trabajo Fabric.
Cree un cuaderno o abra un cuaderno existente.
Vaya a la pestaña Ejecutar de la cinta de opciones de menú y seleccione la lista desplegable Tipo de sesión que tiene Estándar seleccionado como opción predeterminada.
Seleccione Nueva sesión de simultaneidad alta.
Una vez iniciada la sesión de simultaneidad alta, puede agregar hasta 5 cuadernos en la sesión de simultaneidad alta.
Crea un cuaderno; para ello, ve al menú Ejecutar, tal como se mencionó en los pasos anteriores, en el menú desplegable ahora verás la sesión de simultaneidad alta recién creada.
Al seleccionar la sesión de simultaneidad alta existente, se adjunta el segundo cuaderno a la sesión.
Una vez conectado el cuaderno, puede empezar a ejecutar los pasos del cuaderno al instante.
El estado de la sesión de alta simultaneidad también muestra el número de cuadernos adjuntos a una sesión determinada en cualquier momento dado.
En cualquier momento si cree que el cuaderno asociado a una sesión de alta simultaneidad requiere un proceso más dedicado, puede optar por cambiar el cuaderno a una sesión estándar seleccionando la opción de desasociar el cuaderno de la alta simultaneidad en la pestaña menú Ejecutar.
Puede ver el estado, el tipo y el identificador de la sesión en la barra de estado. Seleccione el identificador de sesión para explorar los trabajos ejecutados en esta sesión de simultaneidad alta y para ver los registros de la sesión de Spark en la página de detalles de supervisión.
También puede configurar el modo de alta concurrencia para cuadernos de notas en las canalizaciones y usar etiquetas de sesión para agrupar sesiones compartidas.
Supervisar y depurar cuadernos que se ejecutan en una sesión de simultaneidad alta
La supervisión y la depuración suelen ser una tarea no trivial cuando se ejecutan varios cuadernos en una sesión compartida. Para el modo de simultaneidad alta en Fabric, se ofrece la separación de registros, lo que permitiría a los usuarios realizar un seguimiento de los registros emitidos por eventos de Spark de diferentes cuadernos.
Cuando la sesión está en curso o en estado completado, puede ver el estado de la sesión; para ello, vaya al menú Ejecutar y seleccione la opción Todas las ejecuciones
Esto abriría el historial de ejecución del cuaderno en el que se muestra la lista de sesiones activas e históricas actuales de Spark
Los usuarios al seleccionar una sesión pueden acceder a la vista de detalles de supervisión, que muestra la lista de todos los trabajos de Spark que se han ejecutado en la sesión.
En el caso de una sesión de simultaneidad alta, los usuarios podrían identificar los trabajos y sus registros asociados de distintos cuadernos mediante la pestaña Cuaderno relacionado, que muestra el cuaderno desde el que se ha ejecutado ese trabajo.
Contenido relacionado
En este documento, obtendrá una comprensión básica de una sesión compartida a través del modo de simultaneidad alta en cuadernos. Pase a los siguientes artículos para aprender a crear y empezar a trabajar con sus propias experiencias de Ingeniería de datos mediante Lakehouse y Notebooks:
- Para iniciar con Lakehouse, consulte Crear un Lakehouse en Microsoft Fabric.
- Para empezar a trabajar con cuadernos, consulte Uso de cuadernos de Microsoft Fabric.