Cosa sono i modelli di Machine Learning?

Completato

Il modello è il componente principale del Machine Learning e,fondamentalmente, ciò che si sta provando a creare. Un modello potrebbe stimare l'età di una persona da una foto, prevedere cosa a una persona potrebbe piacere vedere sui social media o decidere dove dovrebbe spostarsi un braccio robotico. In questo scenario si vuole creare un modello in grado di stimare la taglia migliore di stivali per un cane in base alla taglia dell'imbracatura.

È possibile creare modelli in molti modi. Ad esempio, un modello tradizionale che simula come vola un aereo viene creato da persone, usando conoscenze di fisica e ingegneria. I modelli di Machine Learning sono speciali: anziché essere modificati dalle persone in modo che funzionino bene, sono modellati dai dati, ovvero apprendono dall'esperienza.

Come pensare ai modelli

È possibile pensare a un modello come una funzione che accetta dati come input e produce un output. Più specificamente, un modello usa i dati di input per stimare qualcos'altro. In questo scenario, ad esempio, si vuole creare un modello a cui viene fornita la taglia di un'imbracatura, da cui stima la misura degli stivali:

Diagramma che mostra un modello senza parametri.

La taglia dell'imbracatura e la taglia degli stivali del cane sono dati; non fanno parte del modello. La taglia dell'imbracatura è l'input, la taglia degli stivali del cane è l'output.

I modelli sono spesso codice semplice

I modelli spesso non sono così diversi dalle funzioni semplici con cui si ha già familiarità. Analogamente ad altro codice, contengono logica e parametri. Ad esempio, la logica potrebbe essere moltiplicare la taglia dell'imbracatura per il parameter_1:

Diagramma che mostra un modello con un singolo parametro non specificato.

Se il parametro_1 qui fosse 2,5, il modello moltiplicherebbe la taglia dell'imbracatura per 2,5 e restituirebbe il risultato:

Diagramma che mostra un modello con 2,5 come unico parametro.

Seleziona un modello

Esistono molti tipi di modelli, alcuni semplici e altri complessi.

Come tutto il codice, i modelli più semplici sono spesso i più affidabili e facili da comprendere, mentre i modelli complessi possono potenzialmente eseguire prestazioni straordinarie. Il tipo di modello da scegliere dipende dall'obiettivo specifico. Gli scienziati medici ad esempio lavorano spesso con modelli relativamente semplici perché sono affidabili e intuitivi. Al contrario, i robot basati sull'intelligenza artificiale si basano in genere su modelli complessi.

Il primo passaggio dell'apprendimento automatico consiste nel selezionare il tipo di modello che si vuole usare. Quindi verrà scelto un modello in base alla rispettiva logica interna. Ad esempio, è possibile selezionare un modello con due parametri per stimare la taglia degli stivali del cane dalla taglia dell'imbracatura:

Diagramma che mostra un modello con due parametri non specificati.

Si noti che un modello è stato selezionato in base al funzionamento logico e non in base ai valori dei parametri. In realtà, a questo punto i parametri non sono ancora stati impostati su un valore specifico.

I parametri vengono individuati durante il training

Il designer umano non seleziona i valori dei parametri. I valori dei parametri vengono invece impostati su un'ipotesi iniziale e quindi modificati durante un processo di apprendimento automatizzato denominato training.

Data la selezione di un modello con due parametri, si inizia fornendo ipotesi casuali per i parametri:

Diagramma che mostra un modello con 0,2 e 1,2 come parametri.

Questi parametri casuali indicano che il modello non è in grado di stimare la taglia degli stivali, quindi viene eseguito il training. Durante il training, questi parametri vengono modificati automaticamente con due nuovi valori che restituiscono risultati migliori:

Diagramma che mostra un modello con 1,5 e 4 come parametri.

Il funzionamento esatto del processo verrà spiegato in modo progressivo durante il percorso di apprendimento.