什麼是距離函式?
距離函式是數學公式,用來測量向量之間的相似性或相異性 (請參閱向量搜尋)。 常見範例包括曼哈頓距離、歐幾里德距離、餘弦相似性和點乘積。 這些度量對於判斷兩個資料片段的關聯程度至關重要。
曼哈頓距離
這會藉由加總座標的絕對差值來測量兩點之間的距離。 想像一下,在一個類似網格的城市裡行走,比如曼哈頓中的許多街區:它就像是您南北行走和東西行走所經過的街區總數。
歐幾里得距離
歐幾里德距離則會測量兩點之間的直線距離。 它以古希臘數學家歐幾里德的名字命名,他常被稱為「幾何之父」。
餘弦相似性
餘弦相似性測量在多維度空間中投影的兩個向量之間的餘弦值。 兩份文件因文件大小,再歐幾里得距離上可能相距很遠,但兩者間的夾角仍可能較小,因而產生頗高的餘弦相似性。
點乘積
兩個向量相乘後傳回單一數字。 它結合了兩個向量的長度以及它們夾角的餘弦值,顯示一個向量在多大程度上指向另一個向量。
相關內容
- Azure Cosmos DB NoSQL 中的 VectorDistance 系統函式
- 什麼是向量資料庫?
- 擷取擴增產生 (RAG)
- Azure Cosmos DB NoSQL 中的向量資料庫
- Azure Cosmos DB for MongoDB 中的向量資料庫
- 什麼是向量搜尋?
- LLM 權杖
- 向量內嵌
- kNN 與 ANN 向量搜尋演算法