Configurazione dei pool di avvio in Microsoft Fabric
In questo articolo viene illustrato come personalizzare i pool di avvio in Microsoft Fabric per i carichi di lavoro di analisi. I pool di avvio sono un modo semplice e veloce per usare Spark nella piattaforma Microsoft Fabric in pochi secondi. È possibile usare immediatamente le sessioni Spark, invece di attendere che Spark configuri automaticamente i nodi, che consente di eseguire altre operazioni con i dati e ottenere informazioni più rapide.
I pool di avvio hanno cluster Spark sempre on e pronti per le richieste. Usano nodi di medie dimensioni e possono essere ridimensionati in base ai requisiti del carico di lavoro.
È possibile specificare il numero massimo di nodi per la scalabilità automatica in base ai requisiti del carico di lavoro di data science o ingegneria dei dati. In base ai nodi max configurati, il sistema acquisisce e ritira in modo dinamico i nodi man mano che cambiano i requisiti di calcolo del processo, il che comporta una scalabilità efficiente e prestazioni migliorate.
È anche possibile impostare il limite massimo per gli executor nei pool di avvio e con l'allocazione dinamica abilitata, il sistema regola il numero di executor a seconda del volume di dati e delle esigenze di calcolo a livello di processo. Questo processo consente di concentrarsi sui carichi di lavoro senza doversi preoccupare dell'ottimizzazione delle prestazioni e della gestione delle risorse.
Nota
Per personalizzare un pool di avvio, è necessario l'accesso amministratore all'area di lavoro.
Configurare i pool di avvio
Per gestire il pool di avvio associato all'area di lavoro:
Passare all'area di lavoro e scegliere le impostazioni dell'area di lavoro.
Selezionare quindi l'opzione Ingegneria dei dati/Science per espandere il menu.
Selezionare l'opzione StarterPool .
È possibile impostare la configurazione massima del nodo per i pool di avvio su un numero consentito in base alla capacità acquistata o ridurre la configurazione predefinita del nodo max a un valore inferiore quando si eseguono carichi di lavoro più piccoli.
La sezione seguente elenca varie configurazioni predefinite e i limiti massimi dei nodi supportati per i pool di avvio in base agli SKU di capacità di Microsoft Fabric:
Nome SKU | Unità di capacità | VCore Spark | Dimensioni nodo | Numero massimo di nodi predefiniti | Numero massimo di nodi |
---|---|---|---|---|---|
F2 | 2 | 4 | Medio | 1 | 1 |
F4 | 4 | 8 | Medio | 1 | 1 |
F8 | 8 | 16 | Medio | 2 | 2 |
F16 | 16 | 32 | Medio | 3 | 4 |
F32 | 32 | 64 | Medio | 8 | 8 |
F64 | 64 | 128 | Medio | 10 | 16 |
(Capacità di valutazione) | 64 | 128 | Medio | 10 | 16 |
F128 | 128 | 256 | Medio | 10 | 32 |
F256 | 256 | 512 | Medio | 10 | 64 |
F512 | 512 | 1024 | Medio | 10 | 128 |
F1024 | 1024 | 2048 | Medio | 10 | 200 |
F2048 | 2048 | 4096 | Medio | 10 | 200 |
Nota
Per personalizzare un pool di avvio, è necessario l'accesso amministratore all'area di lavoro.
Contenuto correlato
- Per altre informazioni, vedere la documentazione pubblica di Apache Spark.
- Introduzione alle impostazioni di amministrazione dell'area di lavoro Spark in Microsoft Fabric.