Qu’est-ce que le machine learning ?

Effectué

Le Machine Learning trouve son origine dans la modélisation statistique et mathématique des données. L’idée fondamentale du Machine Learning est d’utiliser les données des observations passées pour prédire des résultats ou des valeurs inconnus. Par exemple :

  • Le propriétaire d’un magasin de crème glacée peut utiliser une application combinant l’historique des ventes et les enregistrements météorologiques pour prédire le nombre de glaces susceptible d’être vendu un jour donné, en fonction des prévisions météorologiques.
  • Un médecin peut utiliser des données cliniques antérieures des patients pour exécuter des tests automatisés qui prédisent si un nouveau patient risque de développer un diabète en fonction de facteurs tels que le poids, le niveau de glycémie et d’autres mesures.
  • Un chercheur en Antarctique peut utiliser les observations passées pour automatiser l’identification de différentes espèces de manchots (comme Adelie, Gentoo ou À jugulaire) en fonction des dimensions des nageoires, des billes et d’autres attributs physiques d’un oiseau.

Machine Learning en tant que fonction

Le Machine Learning étant basé sur les mathématiques et les statistiques, il est courant de penser aux modèles Machine Learning en termes mathématiques. Fondamentalement, un modèle Machine Learning est une application qui encapsule une fonction pour calculer une valeur de sortie basée sur une ou plusieurs valeurs d’entrée. Le processus pour définir cette fonction est appelé entraînement. Une fois la fonction définie, vous pouvez l’utiliser pour prédire de nouvelles valeurs dans un processus appelé inférence.

Explorons les étapes de la formation et de l’inférence.

Diagramme montrant les phases d’entraînement et d’inférence du Machine Learning.

  1. Les données d’entraînement se composent d’observations passées. Dans la plupart des cas, les observations comprennent les attributs observés ou caractéristiques des éléments observée et la valeur connue des éléments que vous souhaitez entraîner un modèle à prédire (appelée étiquette).

    En termes mathématiques, vous voyez souvent les fonctionnalités référencées à l’aide du nom de variable abrégé x et de l’étiquette y. En général, une observation se compose de plusieurs valeurs de caractéristiques, de sorte que x est en fait un vecteur (un tableau avec plusieurs valeurs). Par exemple : [x1,x2,x3,...].

    Pour plus de clarté, prenons les exemples décrits précédemment :

    • Dans le scénario de vente de crème glacée, notre objectif est de former un modèle pouvant prédire le nombre de ventes de crème glacée en fonction de la météo. Les mesures météorologiques pour la journée (température, pluie, vitesse du vent, etc.) vont être les caractéristiques (x) et le nombre quotidien de glaces vendues va être l’étiquette (y).
    • Dans le scénario médical, l’objectif est de prédire le risque pour un patient de développer un diabète en fonction de ses données cliniques. Les données sur le patient (poids, glycémie, etc.) sont les caractéristiques (x) et la probabilité de développer un diabète (par exemple, 1 pour à risque, 0 pour non à risque) est l’étiquette (y).
    • Dans le scénario de recherche en Antarctique, nous voulons prédire l’espèce d’un manchot en fonction de ses attributs physiques. Les principales mesures du manchot (longueur de ses nageoires, largeur de son bec, etc.) sont les caractéristiques (x) et l’espèce (0 pour Adelie, 1 pour Gentoo ou 2 pour À jugulaire) est l’étiquette (y).
  2. Un algorithme est appliqué aux données pour essayer de déterminer une relation entre les caractéristiques et l’étiquette, puis généraliser cette relation sous la forme d’un calcul à effectuer sur x pour calculer y. L’algorithme spécifique utilisé dépend du type de problème de prédiction que vous essayez de résoudre (plus d’informations à ce sujet plus loin), mais le principe de base est d’essayer d’ajuster une fonction aux données dans lesquelles les valeurs des fonctionnalités peuvent être utilisées pour calculer l’étiquette.

  3. Le résultat de l’algorithme est un modèle qui encapsule le calcul dérivé de l’algorithme en tant que fonction. Appelons-là f. En notation mathématique :

    y = f(x)

  4. La phase d’apprentissage étant terminée, le modèle entraîné peut être utilisé pour l’inférence. Le modèle est essentiellement un programme qui encapsule la fonction générée par le processus d’entraînement. Vous pouvez entrer un ensemble de valeurs de fonctionnalité et recevoir comme sortie une prédiction de l’étiquette correspondante. La sortie du modèle étant une prédiction calculée par la fonction, pas une valeur observée, vous voyez souvent la sortie de la fonction affichée sous la forme ŷ (qui est délicieusement verbalisée comme « y-hat »).