Qu’est-ce que les modèles Machine Learning ?

Effectué

Le modèle est le composant principal du Machine Learning, et est au final ce que nous essayons de créer. Un modèle peut estimer l’âge d’une personne sur une photo, prédire ce que vous aimeriez voir sur les réseaux sociaux ou déterminer où le bras d’un robot doit se déplacer. Dans notre scénario, nous voulons créer un modèle qui peut estimer la taille de chaussures la plus appropriée pour un chien en fonction de sa taille de harnais.

Les modèles peuvent être créés de nombreuses façons. Par exemple, un modèle traditionnel qui simule la façon dont un avion vole est construit par des personnes, en utilisant les connaissances de la physique et de l’ingénierie. Les modèles Machine Learning sont spéciaux : au lieu d’être modifiés par des personnes pour bien fonctionner, les modèles Machine Learning sont mis en forme par des données. Ils apprennent de l’expérience.

Comment considérer les modèles

Un modèle peut être considéré comme une fonction qui accepte des données en entrée et qui produit une sortie. Plus précisément, un modèle utilise des données en entrée pour estimer quelque chose d’autre. Par exemple, dans notre scénario, nous voulons créer un modèle auquel nous donnons une taille de harnais et qui estime une taille de botte :

Diagramme montrant un modèle sans paramètres.

La taille de harnais et la taille de bottes pour chiens sont des données. Ces informations ne font pas partie du modèle. La taille de harnais est notre entrée et la taille des couvre-pattes pour chiens est la sortie.

Les modèles sont souvent du code simple

Souvent, les modèles ne diffèrent pas de façon significative des fonctions simples que vous connaissez déjà. À l’instar d’un autre code, ils contiennent de la logique et des paramètres. Par exemple, la logique peut être multiplier la taille du harnais par parameter_1 :

Diagramme montrant un modèle avec un seul paramètre non spécifié.

Si parameter_1 vaut ici 2,5, notre modèle va multiplier la taille de harnais par 2,5 et retourner le résultat :

Diagramme montrant un modèle avec 2,5 comme seul paramètre.

Sélectionnez un modèle

Il existe de nombreux types de modèles, certains étant simples et d’autres complexes.

Comme tout code, les modèles plus simples sont souvent les plus fiables et les plus faciles à comprendre, tandis que les modèles complexes peuvent potentiellement accomplir des prouesses impressionnantes. Le type de modèle à choisir dépend de votre objectif. Par exemple, les scientifiques du domaine médical utilisent souvent des modèles relativement simples, car ils sont fiables et intuitifs. En revanche, les robots basés sur l’IA s’appuient généralement sur des modèles complexes.

La première étape du Machine Learning consiste à sélectionner le type de modèle que vous voulez utiliser. Nous choisissons donc un modèle en fonction de sa logique interne. Par exemple, nous pouvons sélectionner un modèle à deux paramètres pour estimer la taille de chaussures du chien à partir de la taille de son harnais :

Diagramme montrant un modèle avec deux paramètres non spécifiés.

Notez que nous avons sélectionné un modèle sur la base de son fonctionnement logique, mais pas sur celle des valeurs de ses paramètres. En fait, à ce stade, aucune valeur particulière n’a été affectée aux paramètres.

Les paramètres sont découverts pendant l’entraînement

Le concepteur humain ne sélectionne pas les valeurs de paramètre. Au lieu de cela, les valeurs des paramètres sont définies sur une estimation initiale, puis elles sont ajustées au cours d’un processus d’apprentissage automatisé appelé Formation.

Dans la mesure où nous avons sélectionné un modèle à deux paramètres, nous commençons par fournir des hypothèses aléatoires pour nos paramètres :

Diagramme montrant un modèle avec 0,2 et 1,2 comme paramètres.

Ces paramètres aléatoires signifient que le modèle ne sait pas estimer une taille de bottes. Nous devons donc effectuer un entraînement. Pendant l’entraînement, ces paramètres sont changés automatiquement en deux nouvelles valeurs qui donnent de meilleurs résultats :

Diagramme montrant un modèle avec 1,5 et 4 comme paramètres.

Nous expliquons progressivement le fonctionnement exact de ce processus tout au long de votre parcours d’apprentissage.