BaseVectorSearchCompression interface
Contient des options de configuration spécifiques à la méthode de compression utilisée lors de l’indexation ou de l’interrogation.
Propriétés
| compression |
Nom à associer à cette configuration particulière. |
| default |
Facteur de surachantillonnage par défaut. Le surachantage demande en interne davantage de documents (spécifiés par ce multiplicateur) dans la recherche initiale. Cela augmente l’ensemble des résultats qui seront reclassés à l’aide de scores de similarité reputés à partir de vecteurs de précision complète. La valeur minimale est 1, ce qui signifie qu’aucun suréchantillonnage (1x). Ce paramètre ne peut être défini que lorsque rerankWithOriginalVectors a la valeur true. Les valeurs plus élevées améliorent le rappel au détriment de la latence. |
| kind | Discriminateur polymorphe, qui spécifie les différents types que cet objet peut être |
| rerank |
Si la valeur est true, une fois que l’ensemble ordonné de résultats calculés à l’aide de vecteurs compressés est obtenu, ils seront reclassés en recalculant les scores de similarité de précision complète. Cela permettra d’améliorer le rappel au détriment de la latence. |
| rescoring |
Contient les options de rescoring. |
| truncation |
Nombre de dimensions à laquelle tronquer les vecteurs. La troncation des vecteurs réduit la taille des vecteurs et la quantité de données qui doivent être transférées pendant la recherche. Cela peut réduire les coûts de stockage et améliorer les performances de recherche au détriment du rappel. Il doit être utilisé uniquement pour les incorporations formées avec Matryoshka Representation Learning (MRL) comme OpenAI text-embedding-3-large (small). La valeur par défaut est Null, ce qui signifie qu’aucune troncation n’est définie. |
Détails de la propriété
compressionName
Nom à associer à cette configuration particulière.
compressionName: string
Valeur de propriété
string
defaultOversampling
Facteur de surachantillonnage par défaut. Le surachantage demande en interne davantage de documents (spécifiés par ce multiplicateur) dans la recherche initiale. Cela augmente l’ensemble des résultats qui seront reclassés à l’aide de scores de similarité reputés à partir de vecteurs de précision complète. La valeur minimale est 1, ce qui signifie qu’aucun suréchantillonnage (1x). Ce paramètre ne peut être défini que lorsque rerankWithOriginalVectors a la valeur true. Les valeurs plus élevées améliorent le rappel au détriment de la latence.
defaultOversampling?: number
Valeur de propriété
number
kind
Discriminateur polymorphe, qui spécifie les différents types que cet objet peut être
kind: "binaryQuantization" | "scalarQuantization"
Valeur de propriété
"binaryQuantization" | "scalarQuantization"
rerankWithOriginalVectors
Si la valeur est true, une fois que l’ensemble ordonné de résultats calculés à l’aide de vecteurs compressés est obtenu, ils seront reclassés en recalculant les scores de similarité de précision complète. Cela permettra d’améliorer le rappel au détriment de la latence.
rerankWithOriginalVectors?: boolean
Valeur de propriété
boolean
rescoringOptions
Contient les options de rescoring.
rescoringOptions?: RescoringOptions
Valeur de propriété
truncationDimension
Nombre de dimensions à laquelle tronquer les vecteurs. La troncation des vecteurs réduit la taille des vecteurs et la quantité de données qui doivent être transférées pendant la recherche. Cela peut réduire les coûts de stockage et améliorer les performances de recherche au détriment du rappel. Il doit être utilisé uniquement pour les incorporations formées avec Matryoshka Representation Learning (MRL) comme OpenAI text-embedding-3-large (small). La valeur par défaut est Null, ce qui signifie qu’aucune troncation n’est définie.
truncationDimension?: number
Valeur de propriété
number