Definire l'apprendimento supervisionato

Completato

Il processo di training di un modello può essere supervisionato o non supervisionato. L'obiettivo in questa sede è quello di mettere a confronto questi approcci, quindi approfondire il processo di apprendimento, con particolare attenzione all'apprendimento supervisionato. Vale la pena ricordare durante questa discussione che l'unica differenza tra l'apprendimento supervisionato e quello non supervisionato è il modo in cui opera la funzione obiettivo.

Che cos'è l'apprendimento non supervisionato?

Nell'apprendimento non supervisionato si esegue il training di un modello per risolvere un problema senza conoscere la risposta corretta. Di fatto, l'apprendimento non supervisionato viene in genere usato per i problemi per i quali non esiste una risposta corretta, ma solo soluzioni migliori e peggiori.

Si immagini di voler creare un modello di Machine Learning che disegna immagini realistiche di cani da valanga. Non c'è un disegno "corretto" da disegnare. Purché l'immagine somigli un po' a un cane, andrà bene. Tuttavia, se l'immagine prodotta è di un gatto, si tratta di una soluzione peggiore.

Ricordare che il training richiede diversi componenti:

Diagram of the model and objective function parts of the machine-learning lifecycle.

Nell'apprendimento non supervisionato la funzione obiettivo formula il proprio giudizio esclusivamente sulla stima del modello, il che significa che spesso deve essere relativamente sofisticata. Ad esempio, la funzione obiettivo potrebbe dover contenere un "rilevatore di cani" per valutare se le immagini disegnate dal modello sembrano realistiche. Gli unici dati necessari per l'apprendimento non supervisionato sono le caratteristiche fornite al modello.

Che cos'è l'apprendimento supervisionato?

Si pensi all'apprendimento supervisionato come apprendimento in base all'esempio. Nell'apprendimento supervisionato, le prestazioni del modello vengono valutate confrontando le stime con la risposta corretta. Anche se è possibile avere funzioni obiettivo semplici, sono necessari entrambi gli elementi seguenti:

  • Caratteristiche fornite come input per il modello
  • Etichette, ovvero le risposte corrette che il modello deve essere in grado di produrre

Diagram of the model and objective function parts of the machine-learning lifecycle, with labels.

Si immagini, ad esempio, di voler prevedere quale sarà la temperatura il 31 gennaio di un determinato anno. Per questa previsione sono necessari dati con due componenti:

  • Caratteristica: data
  • Etichetta: temperatura giornaliera (ad esempio, da dati storici)

Nello scenario viene fornita la caratteristica data per il modello. Il modello prevede la temperatura e la confronta con la temperatura "corretta" dei set di dati. La funzione obiettivo può quindi calcolare l'adeguatezza del modello ed è possibile apportare rettifiche al modello.

Le etichette sono solo per l'apprendimento

È importante ricordare che, indipendentemente dalla modalità di training, i modelli elaborano solo le caratteristiche. Durante l'apprendimento supervisionato la funzione obiettivo è l'unico componente che si basa sull'accesso alle etichette. Dopo il training, non sono necessarie etichette per usare il modello.