Partager via


Que sont les fonctions de distance ?

Les fonctions de distance sont des formules mathématiques utilisées pour mesurer la similarité ou la dissimilarité entre les vecteurs (voir recherche vectorielle). Les exemples courants incluent la distance de Manhattan, la distance euclidienne, la similarité cosinus et le produit scalaire. Ces mesures sont essentielles pour déterminer la proximité de deux éléments de données.

Distance de Manhattan

Elle mesure la distance entre deux points en ajoutant les différences absolues de leurs coordonnées. Imaginez marcher dans une ville en quadrillage, comme de nombreux quartiers de Manhattan ; c'est le nombre total de pâtés de maisons que vous parcourez du nord au sud et d'est en ouest.

Distance euclidienne

La distance euclidienne mesure la distance en ligne droite entre deux points. Elle porte le nom de l’ancien mathématicien Euclide, qui est souvent appelé le « père de la géométrie ».

Similarité cosinus

La similarité cosinus mesure le cosinus de l'angle entre deux vecteurs projetés dans un espace multidimensionnel. Deux documents peuvent être éloignés en termes de distance euclidienne en raison de la taille des documents, mais ils pourraient néanmoins former un angle faible et donc avoir une similarité cosinus élevée.

Produit scalaire

Deux vecteurs sont multipliés pour retourner un nombre unique. Il combine les magnitudes des deux vecteurs et le cosinus de l’angle qu’ils forment, montrant la similarité de direction entre les deux vecteurs.