Che cosa sono i pool di Azure Databricks?

I pool di Azure Databricks sono un set di istanze inattive e pronte per l'uso. Quando i nodi del cluster vengono creati usando le istanze inattive, i tempi di avvio e ridimensionamento automatico del cluster vengono ridotti. Se il pool non ha alcuna istanza inattiva, si espande allocando una nuova istanza dal provider di istanze per accogliere la richiesta del cluster.

Quando un cluster rilascia un'istanza, questa viene restituita al pool ed è disponibile per essere usata da un altro cluster. Solo i cluster collegati a un pool possono usare le istanze inattive del pool.

Azure Databricks non addebita unità DBU quando le istanze sono inattive nel pool. Si applica la fatturazione del provider di istanze. Vedere i prezzi.

È possibile gestire i pool usando l'interfaccia utente o chiamando l'API Pool di istanze.

Creare un pool

Per creare un pool, è necessario disporre dell'autorizzazione per creare pool. Per impostazione predefinita, solo gli amministratori dell'area di lavoro dispongono delle autorizzazioni di creazione del pool. Ai gruppi è possibile assegnare il allow-instance-pool-create diritto usando l'API Group.

Per creare un pool usando l'interfaccia utente:

  1. Fare clic su compute iconCalcolo nella barra laterale.
  2. Fare clic sulla scheda Pool .
  3. Fare clic sul pulsante Crea pool .
  4. Specificare la configurazione del pool.
  5. Fare clic sul pulsante Crea.

Associare un cluster a un pool

Per collegare un cluster a un pool usando l'interfaccia utente di creazione del cluster, selezionare il pool dall'elenco a discesa Tipo di driver o Tipo di lavoro quando si configura il cluster. I pool disponibili sono elencati nella parte superiore di ogni elenco a discesa. È possibile usare lo stesso pool o pool diversi per il nodo driver e i nodi di lavoro.

Se si usa l'API Clusters, è necessario specificare driver_instance_pool_id per il nodo driver e instance_pool_id per i nodi di lavoro.

Per altre procedure consigliate correlate ai pool, vedere Procedure consigliate per il pool.

Autorizzazioni del pool

Esistono tre livelli di autorizzazione per un pool: NO PERMISSIONS, CAN ATTACH TO e CAN MANAGE. Nella tabella sono elencate le capacità per ogni autorizzazione.

Abilità NESSUNA AUTORIZZAZIONE PUÒ COLLEGARSI A PUÒ GESTIRE
Collegare un cluster al pool x x
Eliminare il pool x
Modifica pool x
Modify permissions x

Gli amministratori dell'area di lavoro hanno l'autorizzazione CAN MANAGE per tutti i pool nell'area di lavoro. Gli utenti hanno automaticamente l'autorizzazione CAN MANAGE per i pool creati.

Configurare le autorizzazioni del pool

Questa sezione descrive come gestire le autorizzazioni usando l'interfaccia utente dell'area di lavoro. È anche possibile usare l'API Autorizzazioni o il provider Terraform di Databricks.

Per configurare le autorizzazioni, è necessario disporre dell'autorizzazione CAN MANAGE per un pool.

  1. Nella barra laterale fare clic su Calcolo.

  2. Fare clic sulla scheda Pool .

  3. Selezionare il pool da aggiornare.

  4. Fare clic sul pulsante Autorizzazioni .

  5. In Autorizzazione Impostazioni fare clic sul menu a discesa Seleziona utente, gruppo o entità servizio e selezionare un utente, un gruppo o un'entità servizio.

    Set pool permissions

  6. Selezionare un'autorizzazione dal menu a discesa delle autorizzazioni.

  7. Fare clic su Aggiungi, quindi su Salva.

Eliminare un pool

L'eliminazione di un pool termina le istanze inattive del pool e ne rimuove la configurazione. Per eliminare un pool, fare clic Delete Icon sull'icona nelle azioni nella pagina Pool. Se si elimina un pool:

  • L'esecuzione di cluster collegati al pool continua a essere eseguita, ma non può allocare istanze durante il ridimensionamento o il ridimensionamento.
  • L'avvio dei cluster terminati collegati al pool non riuscirà.

Importante

Non è possibile annullare questa azione.