Usare i parametri della pipeline per ripetere il training dei modelli nella finestra di progettazione

Questo articolo illustra come usare la finestra di progettazione di Azure Machine Learning per ripetere il training di un modello di Machine Learning usando i parametri della pipeline. Verranno usate le pipeline pubblicate per automatizzare il flusso di lavoro e impostare i parametri per eseguire il training del modello con i nuovi dati. I parametri della pipeline consentono di riutilizzare le pipeline esistenti per processi diversi.

In questo articolo vengono illustrate le operazioni seguenti:

  • Eseguire il training di un modello di Machine Learning.
  • Creare un parametro della pipeline.
  • Pubblicare la pipeline di training.
  • Ripetere il training del modello con nuovi parametri.

Prerequisiti

Importante

Se gli elementi grafici citati in questo documento non vengono visualizzati, ad esempio i pulsanti di Studio o della finestra di progettazione, è possibile che non si abbia il livello di autorizzazioni appropriato per l'area di lavoro. Contattare l'amministratore della sottoscrizione di Azure per verificare che sia stato concesso il livello di accesso corretto. Per altre informazioni, vedere Gestire utenti e ruoli.

Questo articolo presuppone anche di avere alcune conoscenze sulla creazione di pipeline nella finestra di progettazione. Per un'introduzione guidata, eseguire l'esercitazione.

Pipeline di esempio

La pipeline usata in questo articolo è una versione modificata di una stima del reddito della pipeline di esempio nella home page della finestra di progettazione. La pipeline usa il componente Import Data anziché il set di dati di esempio per illustrare come eseguire il training dei modelli usando i propri dati.

Screenshot that shows the modified sample pipeline with a box highlighting the Import Data component

Creare un parametro della pipeline

I parametri della pipeline vengono usati per creare pipeline versatili che possono essere inviate di nuovo in un secondo momento con valori di parametro variabili. Alcuni scenari comuni sono l'aggiornamento di set di dati o alcuni iper parametri per la ripetizione del training. Creare i parametri della pipeline per impostare dinamicamente le variabili durante il runtime.

I parametri della pipeline possono essere aggiunti ai parametri dell'origine dati o del componente in una pipeline. Quando la pipeline viene riesemessa, è possibile specificare i valori di questi parametri.

Per questo esempio, il percorso dei dati di training verrà modificato da un valore fisso a un parametro in modo che sia possibile ripetere il training del modello con dati diversi. È anche possibile aggiungere altri parametri del componente come parametri della pipeline in base al caso d'uso.

  1. Selezionare il componente Importa dati .

    Nota

    In questo esempio viene usato il componente Importa dati per accedere ai dati in un archivio dati registrato. Tuttavia, se si usano modelli di accesso ai dati alternativi, è possibile seguire una procedura simile.

  2. Nel riquadro dei dettagli del componente, a destra dell'area di disegno, selezionare l'origine dati.

  3. Immettere il percorso dei dati. È anche possibile selezionare Browse path (Sfoglia percorso) per esplorare l'albero dei file.

  4. Passare il mouse sul campo Path (Percorso) e selezionare i tre punti visualizzati sopra il campo Path (Percorso).

  5. Selezionare Add to pipeline parameter (Aggiungi a parametro pipeline).

  6. Specificare un nome di parametro e un valore predefinito.

    Screenshot that shows how to create a pipeline parameter

  7. Seleziona Salva.

    Nota

    È anche possibile scollegare un parametro del componente dal parametro della pipeline nel riquadro dei dettagli del componente, in modo analogo all'aggiunta di parametri della pipeline.

    È possibile esaminare e modificare i parametri della pipeline selezionando l'icona a forma di ingranaggio Settings (Impostazioni) accanto al titolo della bozza della pipeline.

    • Dopo la disconnessione, è possibile eliminare il parametro della pipeline nel riquadro Setings .After detaching, you can delete the pipeline parameter in the Setings pane.
    • È anche possibile aggiungere un parametro della pipeline nel riquadro Impostazioni e quindi applicarlo ad alcuni parametri del componente.
  8. Inviare il processo della pipeline.

Pubblicare una pipeline di training

Pubblicare una pipeline in un endpoint della pipeline per riutilizzare facilmente le pipeline in futuro. Un endpoint della pipeline crea un endpoint REST per richiamare la pipeline in futuro. In questo esempio, l'endpoint della pipeline consente di riutilizzare la pipeline per ripetere il training di un modello con dati diversi.

  1. Selezionare Publish (Pubblica) sopra il canvas della finestra di progettazione.

  2. Selezionare o creare un endpoint della pipeline.

    Nota

    È possibile pubblicare più pipeline in un singolo endpoint. A ogni pipeline di un determinato endpoint viene assegnato un numero di versione che è possibile specificare quando si chiama l'endpoint della pipeline.

  3. Selezionare Pubblica.

Ripetere il training del modello

Ora che è disponibile una pipeline di training pubblicata, è possibile usarla per ripetere il training del modello con i nuovi dati. È possibile inviare processi da un endpoint della pipeline dall'area di lavoro studio o a livello di codice.

Inviare processi usando il portale di Studio

Usare la procedura seguente per inviare un processo dell'endpoint della pipeline con parametri dal portale di Studio:

  1. Passare alla pagina Endpoints (Endpoint) nell'area di lavoro di Studio.
  2. Selezionare la scheda Endpoint pipeline. Selezionare quindi l'endpoint della pipeline.
  3. Selezionare la scheda Pipeline pubblicate. Selezionare quindi la versione della pipeline da eseguire.
  4. Seleziona Invia.
  5. Nella finestra di dialogo di installazione è possibile specificare i valori dei parametri per il processo. Per questo esempio, aggiornare il percorso dei dati per eseguire il training del modello usando un set di dati diverso da US.

Screenshot that shows how to set up a parameterized pipeline job in the designer

Inviare processi usando il codice

L'endpoint REST di una pipeline pubblicata è disponibile nel pannello di panoramica. Chiamando l'endpoint è possibile ripetere il training della pipeline pubblicata.

Per eseguire una chiamata REST è necessaria un'intestazione di autenticazione di tipo bearer token OAuth 2.0. Per informazioni sulla configurazione dell'autenticazione nell'area di lavoro e sull'esecuzione di una chiamata REST con parametri, vedere Usare REST per gestire le risorse.

Passaggi successivi

In questo articolo si è appreso come creare un endpoint della pipeline di training con parametri usando la finestra di progettazione.

Per la procedura dettagliata completa per distribuire un modello per eseguire stime, vedere l'esercitazione con la finestra di progettazione per eseguire il training e la distribuzione di un modello di regressione.

Per informazioni su come pubblicare e inviare un processo all'endpoint della pipeline usando l'SDK v1, vedere Pubblicare pipeline.