Configurar grupos de inicio en Microsoft Fabric
En este artículo, se explica cómo personalizar grupos de inicio en Microsoft Fabric para las cargas de trabajo de análisis. Los grupos de inicio son una manera rápida y sencilla de usar Spark en la plataforma de Microsoft Fabric en cuestión de segundos. Puede usar las sesiones de Spark de inmediato, en lugar de esperar a que Spark configure los nodos, lo que le ayuda a hacer más con los datos y obtener información más rápido.
Los grupos de inicio tienen clústeres de Spark siempre activados y listos para las solicitudes. Usan nodos de tamaño mediano y se pueden escalar verticalmente en función de los requisitos de carga de trabajo.
Puede especificar los nodos máximos para el escalado automático en función de los requisitos de carga de trabajo de ingeniería de datos o ciencia de datos. En función de los nodos máximos que configure, el sistema adquiere y retira dinámicamente los nodos a medida que cambian los requisitos de proceso del trabajo, lo que da como resultado un escalado eficaz y un rendimiento mejorado.
También puede establecer el límite máximo de ejecutores en grupos de inicio y con la asignación dinámica habilitada, el sistema ajusta el número de ejecutores en función de las necesidades de proceso de nivel de trabajo y volumen de datos. Este proceso le permite centrarse en las cargas de trabajo sin preocuparse por la optimización del rendimiento y la administración de recursos.
Nota:
Para personalizar un grupo de inicio, necesita acceso de administrador al área de trabajo.
Configurar grupos de inicio
Para administrar el grupo de inicio asociado al área de trabajo:
Vaya al área de trabajo y elija la configuración del área de trabajo.
A continuación, seleccione la opción Ingeniería de datos/Ciencia para expandir el menú.
Seleccione la opción StarterPool.
Puede establecer la configuración máxima de nodos para sus grupos de inicio en un número permitido basado en la capacidad adquirida o reducir la configuración máxima de nodos predeterminada a un valor menor cuando ejecute cargas de trabajo más pequeñas.
En la sección siguiente se enumeran varias configuraciones predeterminadas y los límites máximos de nodos admitidos para los grupos de inicio basados en las SKU de capacidad de Microsoft Fabric:
Nombre de SKU | Unidades de capacidad | Núcleos virtuales de Spark | Tamaño del nodo | Nodos máximos predeterminados | Número máximo de nodos |
---|---|---|---|---|---|
F2 | 2 | 4 | Media | 1 | 1 |
F4 | 4 | 8 | Media | 1 | 1 |
F8 | 8 | 16 | Media | 2 | 2 |
F16 | 16 | 32 | Media | 3 | 4 |
F32 | 32 | 64 | Media | 8 | 8 |
F64 | 64 | 128 | Media | 10 | 16 |
(Capacidad de prueba) | 64 | 128 | Media | 10 | 16 |
F128 | 128 | 256 | Media | 10 | 32 |
F256 | 256 | 512 | Media | 10 | 64 |
F512 | 512 | 1024 | Media | 10 | 128 |
F1024 | 1024 | 2048 | Media | 10 | 200 |
F2048 | 2048 | 4096 | Media | 10 | 200 |
Nota:
Para personalizar un grupo de inicio, necesita acceso de administrador al área de trabajo.
Contenido relacionado
- Obtenga más información en la documentación pública de Apache Spark.
- Introducción a la configuración de administración del área de trabajo de Spark en Microsoft Fabric.