Migliorare i modelli con iperparametri

Completato

I modelli semplici con piccoli set di dati possono essere facilmente adattati in un unico passaggio, mentre per l'adattamento di modelli più complessi con set di dati più grandi è possibile che sia necessario eseguire ripetutamente il modello con i dati di training e confrontare l'output con l'etichetta prevista. Se la stima è sufficientemente accurata, il modello può essere considerato "sottoposto a training". In caso contrario, è necessario modificare ulteriormente il modello e ricominciare il ciclo.

Gli iperparametri sono valori che cambiano il modo in cui viene adattato il modello durante questi cicli. La velocità di apprendimento, ad esempio, è un iperparametro che indica quanto deve essere adattato un modello in ogni ciclo di training. Con una velocità di apprendimento più elevata, il training di un modello può essere eseguito più velocemente, ma se la velocità è troppo elevata, è possibile che l'entità delle modifiche sia tale da non consentire una corretta ottimizzazione del modello.

Pre-elaborazione dei dati

Per pre-elaborazione si intendono le modifiche apportate ai dati prima di passarli al modello. In precedenza è stato detto che la pre-elaborazione può comportare la pulizia del set di dati. Sebbene questo sia un aspetto importante, la pre-elaborazione può includere anche la modifica del formato dei dati, in modo che possano essere usati più facilmente dal modello. I dati descritti come "rosso", "arancione", "giallo", "lime" e "verde", ad esempio, possono risultare più utili se vengono convertiti in un formato nativo per i computer, ad esempio in numeri che indicano la quantità di rosso e di verde.

Funzionalità di ridimensionamento

Il passaggio di pre-elaborazione più comune prevede il ridimensionamento delle funzionalità in modo che siano comprese tra zero e uno. Il peso di una bicicletta e la distanza percorsa da una persona su una bicicletta, ad esempio, possono essere due numeri molto diversi, ma ridimensionandoli entrambi a un valore compreso tra zero e uno si consentirà ai modelli di apprendere dai dati in modo più efficace.

Uso di categorie come funzionalità

Nell'apprendimento automatico è anche possibile usare funzionalità categoriche come "bicicletta", "skateboard" o "auto". Queste funzionalità sono rappresentate da valori 0 o 1 in vettori one-hot, ovvero vettori che hanno 0 o 1 per ogni valore possibile. Bicicletta, skateboard e automobile, ad esempio, potrebbero essere rispettivamente (1,0,0), (0,1,0) e (0,0,1).