Collegare e gestire un pool di Spark Synapse in Azure Machine Learning

SI APPLICA A:Estensione ML dell'interfaccia della riga di comando di Azure v2 (corrente)Python SDK azure-ai-ml v2 (corrente)

Questo articolo descrive come collegare un pool di Spark Synapse in Azure Machine Learning. È possibile collegare un pool di Spark Synapse in Azure Machine Learning in uno dei modi seguenti:

  • Uso dell'interfaccia utente di studio di Azure Machine Learning
  • Uso dell'interfaccia della riga di comando di Azure Machine Learning
  • Uso di Azure Machine Learning Python SDK

Prerequisiti

Collegare un pool di Spark Synapse in Azure Machine Learning

Azure Machine Learning offre diversi modi per collegare e gestire un pool di Synapse Spark.

Per collegare un pool di Spark Synapse con la scheda Calcolo di Studio:

Screenshot che mostra la creazione di un nuovo pool di Spark synapse.

  1. Nella sezione Gestisci del riquadro sinistro selezionare Calcolo.
  2. Selezionare Calcolo collegato.
  3. Nella schermata Calcolo collegato selezionare Nuovo per visualizzare le opzioni per collegare diversi tipi di calcolo.
  4. Selezionare Pool di Spark synapse.

Il pannello Attach Synapse Spark pool (Collega pool di Spark Synapse) si apre sul lato destro dello schermo. In questo pannello:

  1. Immettere un nome, che fa riferimento al pool di Spark di Synapse collegato all'interno della risorsa di Azure Machine Learning.

  2. Selezionare una sottoscrizione di Azure dal menu a discesa.

  3. Selezionare un'area di lavoro synapse dal menu a discesa.

  4. Selezionare un pool di Spark dal menu a discesa.

  5. Attivare o disattivare l'opzione Assegna un'identità gestita per abilitarla.

  6. Selezionare un tipo di identità gestita da usare con questo pool di Spark synapse collegato.

  7. Selezionare Aggiorna per completare il processo di collegamento del pool di Spark synapse.

Aggiungere assegnazioni di ruolo in Azure Synapse Analytics

Per assicurarsi che il pool di Spark di Synapse collegato funzioni correttamente, assegnarvi il ruolo Amministrazione istrator dall'interfaccia utente di Azure Synapse Analytics Studio. Questi passaggi illustrano come eseguire questa operazione:

  1. Aprire l'area di lavoro di Synapse in portale di Azure.

  2. Nel riquadro sinistro selezionare Panoramica.

    Screenshot che mostra Open Synapse Studio.

  3. Selezionare Apri Synapse Studio.

  4. In Azure Synapse Analytics Studio selezionare Gestisci nel riquadro sinistro.

  5. Selezionare Controllo di accesso nella sezione Sicurezza del riquadro sinistro, seconda a sinistra.

  6. Selezionare Aggiungi.

  7. Il pannello Aggiungi assegnazione di ruolo verrà aperto sul lato destro della schermata. In questo pannello:

    1. Selezionare Elemento area di lavoro per Ambito.

    2. Nel menu a discesa Tipo di elemento selezionare Pool di Apache Spark.

    3. Nel menu a discesa Elemento selezionare il pool di Apache Spark.

    4. Nel menu a discesa Ruolo selezionare Synapse Amministrazione istrator.

    5. Nella casella di ricerca Selezionare l'utente iniziare a digitare il nome dell'area di lavoro di Azure Machine Learning. Viene visualizzato un elenco di pool di Spark synapse collegati. Selezionare il pool di Spark di Synapse desiderato nell'elenco.

    6. Selezionare Applica.

      Screenshot che mostra l'opzione Aggiungi assegnazione di ruolo.

Aggiornare il pool di Spark di Synapse

È possibile gestire il pool di Spark synapse collegato dall'interfaccia utente di studio di Azure Machine Learning. La funzionalità di gestione del pool di Spark include gli aggiornamenti delle identità gestite associati per un pool di Spark Synapse collegato. È possibile assegnare un'identità assegnata dal sistema o assegnata dall'utente durante l'aggiornamento di un pool di Spark synapse. È consigliabile creare un'identità gestita assegnata dall'utente in portale di Azure prima di assegnarla a un pool di Synapse Spark.

Per aggiornare l'identità gestita per il pool di Spark synapse collegato:

Screenshot che mostra l'aggiornamento dell'identità gestita del pool di Spark synapse.

  1. Aprire la pagina Dettagli per il pool di Spark di Synapse nel studio di Azure Machine Learning.

  2. Trovare l'icona di modifica, che si trova sul lato destro della sezione Identità gestita.

  3. Per assegnare un'identità gestita per la prima volta, impostare Assegna un'identità gestita per abilitarla.

  4. Per assegnare un'identità gestita assegnata dal sistema:

    1. Selezionare Assegnata dal sistema come tipo di identità.
    2. Selezionare Aggiorna.
  5. Per assegnare un'identità gestita assegnata dall'utente:

    1. Selezionare Assegnata dall'utente come tipo di identità.
    2. Selezionare una sottoscrizione di Azure dal menu a discesa.
    3. Digitare le prime lettere del nome dell'identità gestita assegnata dall'utente nella casella che mostra il testo Cerca per nome. Viene visualizzato un elenco con nomi di identità gestite assegnati dall'utente corrispondenti. Selezionare l'identità gestita assegnata dall'utente desiderata nell'elenco. È possibile selezionare più identità gestite assegnate dall'utente e assegnarle al pool di Spark synapse collegato.
    4. Selezionare Aggiorna.

Scollegare il pool di Spark di Synapse

Potrebbe essere necessario scollegare un pool di Spark Synapse collegato per pulire un'area di lavoro.


L'interfaccia utente studio di Azure Machine Learning consente anche di scollegare un pool di Spark Synapse collegato. A tale scopo, effettuare i seguenti passaggi:

  1. Aprire la pagina Dettagli per il pool di Spark di Synapse, nella studio di Azure Machine Learning.

  2. Selezionare Scollega per scollegare il pool di Spark synapse collegato.

Calcolo Spark serverless in Azure Machine Learning

Alcuni scenari utente potrebbero richiedere l'accesso a una risorsa di calcolo Spark serverless, durante un invio di processo di Azure Machine Learning, senza dover collegare un pool di Spark. L'integrazione di Azure Synapse Analytics con Azure Machine Learning offre anche un'esperienza di calcolo Spark serverless. In questo modo è possibile accedere a un ambiente di calcolo Spark in un processo, senza dover prima collegare il calcolo a un'area di lavoro. Altre informazioni sull'esperienza di calcolo Spark serverless.

Passaggi successivi