Che cosa sono le funzioni di distanza?
Le funzioni di distanza sono formule matematiche usate per misurare la somiglianza o la differenza tra vettori (vedere ricerca vettoriale). Esempi comuni includono la distanza di Manhattan, la distanza euclidea, la similarità del coseno e il prodotto punto. Queste misurazioni sono fondamentali per determinare quanto sono strettamente correlate due parti di dati.
Distanza di Manhattan
Misura la distanza tra due punti aggiungendo le differenze assolute delle loro coordinate. Si immagini di camminare in una città simile a una griglia, come molti quartieri di Manhattan, è il numero totale di blocchi che si percorrono da nord a sud e da est a ovest.
Distanza euclidea
La distanza euclidea misura la distanza retta tra due punti. Prende il nome dall'antico matematico greco Euclide, che viene spesso definito padre "della geometria".
Somiglianza coseno
La similarità del coseno misura il coseno dell'angolo tra due vettori proiettati in uno spazio multidimensionale. Due documenti possono essere lontani dalla distanza euclidea a causa delle dimensioni del documento, ma potrebbero comunque avere un angolo più piccolo tra i due vettori e quindi una elevata similarità del coseno.
Prodotto punto
Due vettori vengono moltiplicati per restituire un singolo numero. Questo combina le dimensioni dei due vettori, così come il coseno dell'angolo tra di essi, mostrando quanto un vettore va nella direzione di un altro.
Contenuto correlato
- Funzione di sistema VectorDistance in Azure Cosmos DB NoSQL
- Che cos'è un database vettoriale?
- Generazione aumentata di recupero (RAG)
- Database vettoriale in Azure Cosmos DB NoSQL
- Database vettoriale in Azure Cosmos DB for MongoDB
- Che cos'è la ricerca vettoriale?
- Token di LLM
- Incorporamenti vettoriali
- kNN e algoritmi di ricerca vettoriale ANN