Condividi tramite


Eseguire il training del modello di clustering

Questo articolo descrive un componente nella finestra di progettazione di Azure Machine Learning.

Usare questo componente per eseguire il training di un modello di clustering.

Il componente accetta un modello di clustering non sottoposto a training già configurato usando il componente K-Means Clustering e esegue il training del modello usando un set di dati etichettato o senza etichetta. Il componente crea sia un modello sottoposto a training che è possibile usare per la stima sia un set di assegnazioni di cluster per ogni caso nei dati di training.

Nota

Non è possibile eseguire il training di un modello di clustering usando il componente Train Model , ovvero il componente generico per il training dei modelli di Machine Learning. Il motivo è che Train Model funziona solo con algoritmi di apprendimento supervisionati. K-means e altri algoritmi di clustering consentono l'apprendimento non supervisionato, vale a dire che l'algoritmo può apprendere da dati senza etichetta.

Come usare training del modello di clustering

  1. Aggiungere il componente Train Clustering Model alla pipeline nella finestra di progettazione. È possibile trovare il componente in Componenti di Machine Learning nella categoria Train (Esegui training ).

  2. Aggiungere il componente K-Means Clustering o un altro componente personalizzato che crea un modello di clustering compatibile e impostare i parametri del modello di clustering.

  3. Collegare un set di dati di training all'input di destra del training del modello di clustering.

  4. In Set di colonne selezionare le colonne del set di dati da usare nella compilazione di cluster. Assicurarsi di selezionare le colonne che rendono valide le funzionalità, ad esempio evitare di usare ID o altre colonne con valori univoci o colonne con tutti gli stessi valori.

    Se un'etichetta è disponibile, è possibile usarla come funzionalità o lasciarla disattivata.

  5. Selezionare l'opzione Controlla accodamento o deseleziona solo per il risultato, se si desidera restituire i dati di training insieme alla nuova etichetta del cluster.

    Se si deseleziona questa opzione, vengono restituite solo le assegnazioni del cluster.

  6. Inviare la pipeline oppure fare clic sul componente Train Clustering Model (Esegui modello di clustering ) e selezionare Run Selected (Esegui selezionato).

Risultati

Al termine del training:

  • Per salvare uno snapshot del modello sottoposto a training, selezionare la scheda Output nel pannello destro del componente Train model (Esegui training modello). Selezionare l'icona Registra set di dati per salvare il modello come componente riutilizzabile.

  • Per generare punteggi dal modello, usare Assegna dati ai cluster.

Nota

Se è necessario distribuire il modello sottoposto a training nella finestra di progettazione, assicurarsi che Assign Data to Clusters anziché Score Model sia connesso all'input del componente Web Service Output nella pipeline di inferenza.

Passaggi successivi

Vedere il set di componenti disponibili per Azure Machine Learning.