Compartir por


Configurar grupos de inicio en Microsoft Fabric

En este artículo, se explica cómo personalizar grupos de inicio en Microsoft Fabric para las cargas de trabajo de análisis. Los grupos de inicio son una manera rápida y sencilla de usar Spark en la plataforma de Microsoft Fabric en cuestión de segundos. Puede usar las sesiones de Spark de inmediato, en lugar de esperar a que Spark configure los nodos, lo que le ayuda a hacer más con los datos y obtener información más rápido.

Los grupos de inicio tienen clústeres de Spark siempre activados y listos para las solicitudes. Usan nodos de tamaño mediano y se pueden escalar verticalmente en función de los requisitos de carga de trabajo.

Puede especificar los nodos máximos para el escalado automático en función de los requisitos de carga de trabajo de ingeniería de datos o ciencia de datos. En función de los nodos máximos que configure, el sistema adquiere y retira dinámicamente los nodos a medida que cambian los requisitos de proceso del trabajo, lo que da como resultado un escalado eficaz y un rendimiento mejorado.

También puede establecer el límite máximo de ejecutores en grupos de inicio y con la asignación dinámica habilitada, el sistema ajusta el número de ejecutores en función de las necesidades de proceso de nivel de trabajo y volumen de datos. Este proceso le permite centrarse en las cargas de trabajo sin preocuparse por la optimización del rendimiento y la administración de recursos.

Nota:

Para personalizar un grupo de inicio, necesita acceso de administrador al área de trabajo.

Configurar grupos de inicio

Para administrar el grupo de inicio asociado al área de trabajo:

  1. Vaya al área de trabajo y elija la configuración del área de trabajo.

    Captura de pantalla que muestra dónde seleccionar Ingeniería de datos en el menú de configuración del área de trabajo.

  2. A continuación, seleccione la opción Ingeniería de datos/Ciencia para expandir el menú.

    Captura de pantalla que muestra la vista detallada de la configuración de Spark.

  3. Seleccione la opción StarterPool.

    Captura de pantalla en la que se muestran las opciones de configuración del grupo de inicio.

  4. Puede establecer la configuración máxima de nodos para sus grupos de inicio en un número permitido basado en la capacidad adquirida o reducir la configuración máxima de nodos predeterminada a un valor menor cuando ejecute cargas de trabajo más pequeñas.

    Captura de pantalla en la que se muestran las opciones de máximo de grupos de inicio y máximo de ejecutores para el escalado automático y la asignación dinámica.

En la sección siguiente se enumeran varias configuraciones predeterminadas y los límites máximos de nodos admitidos para los grupos de inicio basados en las SKU de capacidad de Microsoft Fabric:

Nombre de SKU Unidades de capacidad Núcleos virtuales de Spark Tamaño del nodo Nodos máximos predeterminados Número máximo de nodos
F2 2 4 Media 1 1
F4 4 8 Media 1 1
F8 8 16 Media 2 2
F16 16 32 Media 3 4
F32 32 64 Media 8 8
F64 64 128 Media 10 16
(Capacidad de prueba) 64 128 Media 10 16
F128 128 256 Media 10 32
F256 256 512 Media 10 64
F512 512 1024 Media 10 128
F1024 1024 2048 Media 10 200
F2048 2048 4096 Media 10 200

Nota:

Para personalizar un grupo de inicio, necesita acceso de administrador al área de trabajo.