Notes
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Les fonctions de distance sont des formules mathématiques utilisées pour mesurer la similarité ou la dissimilarité entre les vecteurs (voir recherche vectorielle). Les exemples courants incluent la distance de Manhattan, la distance euclidienne, la similarité cosinus et le produit scalaire. Ces mesures sont essentielles pour déterminer la proximité de deux éléments de données.
Distance de Manhattan
Elle mesure la distance entre deux points en ajoutant les différences absolues de leurs coordonnées. Imaginez marcher dans une ville en quadrillage, comme de nombreux quartiers de Manhattan ; c'est le nombre total de pâtés de maisons que vous parcourez du nord au sud et d'est en ouest.
Distance euclidienne
La distance euclidienne mesure la distance en ligne droite entre deux points. Elle porte le nom de l’ancien mathématicien Euclide, qui est souvent appelé le « père de la géométrie ».
Similarité cosinus
La similarité cosinus mesure le cosinus de l'angle entre deux vecteurs projetés dans un espace multidimensionnel. Deux documents peuvent être éloignés en termes de distance euclidienne en raison de la taille des documents, mais ils pourraient néanmoins former un angle faible et donc avoir une similarité cosinus élevée.
Produit scalaire
Deux vecteurs sont multipliés pour retourner un nombre unique. Il combine les magnitudes des deux vecteurs et le cosinus de l’angle qu’ils forment, montrant la similarité de direction entre les deux vecteurs.
Contenu connexe
- Fonction système VectorDistance dans Azure Cosmos DB NoSQL
- Qu’est-ce qu’une base de données vectorielle ?
- Génération augmentée de récupération (RAG)
- Base de données vectorielle dans Azure Cosmos DB for NoSQL
- Base de données vectorielle dans Azure Cosmos DB for MongoDB
- Qu’est-ce que la recherche vectorielle ?
- Jetons de LLM
- Incorporations vectorielles
- Algorithmes de recherche vectorielle kNN et ANN