Améliorer les modèles avec des hyperparamètres

Effectué

Les modèles simples avec de petits jeux de données peuvent souvent être traités en une seule étape, tandis que les jeux de données plus grands et les modèles plus complexes doivent être ajustés en utilisant à plusieurs reprises le modèle avec les données d’apprentissage et en comparant le résultat à l’étiquette attendue. Si la prédiction est suffisamment précise, nous considérons que le modèle est entraîné. Si ce n’est pas le cas, nous ajustons légèrement le modèle et nous repartons dans la boucle.

Les hyperparamètres sont des valeurs qui modifient la façon dont le modèle est ajusté lors de ces boucles. Par exemple, le taux d’apprentissage est un hyperparamètre qui définit le degré d’ajustement d’un modèle lors de chaque cycle d’entraînement. Un taux d’apprentissage élevé signifie qu’un modèle peut être entraîné plus rapidement. Cependant, s’il est trop élevé, les ajustements peuvent être tellement importants que le modèle n’est jamais « subtilement optimisé » et n’est donc pas optimal.

Prétraitement des données

Le prétraitement fait référence aux modifications que vous apportez à vos données avant de les passer au modèle. Nous avons déjà vu que ce prétraitement peut impliquer le nettoyage de votre jeu de données. Ce nettoyage est important, mais le prétraitement peut également inclure un changement du format de vos données pour les rendre plus faciles à utiliser pour le modèle. Par exemple, les données décrites comme « rouge », « orange », « jaune », « vert citron » et « vert » peuvent mieux fonctionner si elles sont converties dans un format convenant davantage aux ordinateurs, par exemple des nombres indiquant la quantité de rouge et la quantité de vert.

Mise à l’échelle des caractéristiques

L’étape de prétraitement la plus courante consiste à mettre à l’échelle les caractéristiques pour les ramener à une grandeur comprise entre zéro et un. Par exemple, le poids d’un vélo et la distance parcourue par une personne sur un vélo peuvent être deux nombres très différents, mais la mise à l’échelle de ces deux nombres à une valeur comprise entre zéro et un permet aux modèles d’apprendre plus efficacement à partir des données.

Utilisation de catégories comme caractéristiques

Dans le Machine Learning, vous pouvez également utiliser des fonctionnalités catégorielles telles que « vélo », « skateboard » ou « voiture ». Ces caractéristiques sont représentées par des valeurs 0 ou 1 dans des vecteurs 1 parmi n. Les vecteurs ayant un 0 ou 1 pour chaque valeur possible. Par exemple, vélo, skateboard et voiture peuvent être respectivement (1,0,0), (0,1,0) et (0,0,1).