Partager via


BaseVectorSearchCompression interface

Contient des options de configuration spécifiques à la méthode de compression utilisée lors de l’indexation ou de l’interrogation.

Propriétés

compressionName

Nom à associer à cette configuration particulière.

defaultOversampling

Facteur de surachantillonnage par défaut. Le surachantage demande en interne davantage de documents (spécifiés par ce multiplicateur) dans la recherche initiale. Cela augmente l’ensemble des résultats qui seront reclassés à l’aide de scores de similarité reputés à partir de vecteurs de précision complète. La valeur minimale est 1, ce qui signifie qu’aucun suréchantillonnage (1x). Ce paramètre ne peut être défini que lorsque rerankWithOriginalVectors a la valeur true. Les valeurs plus élevées améliorent le rappel au détriment de la latence.

kind

Discriminateur polymorphe, qui spécifie les différents types que cet objet peut être

rerankWithOriginalVectors

Si la valeur est true, une fois que l’ensemble ordonné de résultats calculés à l’aide de vecteurs compressés est obtenu, ils seront reclassés en recalculant les scores de similarité de précision complète. Cela permettra d’améliorer le rappel au détriment de la latence.

rescoringOptions

Contient les options de rescoring.

truncationDimension

Nombre de dimensions à laquelle tronquer les vecteurs. La troncation des vecteurs réduit la taille des vecteurs et la quantité de données qui doivent être transférées pendant la recherche. Cela peut réduire les coûts de stockage et améliorer les performances de recherche au détriment du rappel. Il doit être utilisé uniquement pour les incorporations formées avec Matryoshka Representation Learning (MRL) comme OpenAI text-embedding-3-large (small). La valeur par défaut est Null, ce qui signifie qu’aucune troncation n’est définie.

Détails de la propriété

compressionName

Nom à associer à cette configuration particulière.

compressionName: string

Valeur de propriété

string

defaultOversampling

Facteur de surachantillonnage par défaut. Le surachantage demande en interne davantage de documents (spécifiés par ce multiplicateur) dans la recherche initiale. Cela augmente l’ensemble des résultats qui seront reclassés à l’aide de scores de similarité reputés à partir de vecteurs de précision complète. La valeur minimale est 1, ce qui signifie qu’aucun suréchantillonnage (1x). Ce paramètre ne peut être défini que lorsque rerankWithOriginalVectors a la valeur true. Les valeurs plus élevées améliorent le rappel au détriment de la latence.

defaultOversampling?: number

Valeur de propriété

number

kind

Discriminateur polymorphe, qui spécifie les différents types que cet objet peut être

kind: "binaryQuantization" | "scalarQuantization"

Valeur de propriété

"binaryQuantization" | "scalarQuantization"

rerankWithOriginalVectors

Si la valeur est true, une fois que l’ensemble ordonné de résultats calculés à l’aide de vecteurs compressés est obtenu, ils seront reclassés en recalculant les scores de similarité de précision complète. Cela permettra d’améliorer le rappel au détriment de la latence.

rerankWithOriginalVectors?: boolean

Valeur de propriété

boolean

rescoringOptions

Contient les options de rescoring.

rescoringOptions?: RescoringOptions

Valeur de propriété

truncationDimension

Nombre de dimensions à laquelle tronquer les vecteurs. La troncation des vecteurs réduit la taille des vecteurs et la quantité de données qui doivent être transférées pendant la recherche. Cela peut réduire les coûts de stockage et améliorer les performances de recherche au détriment du rappel. Il doit être utilisé uniquement pour les incorporations formées avec Matryoshka Representation Learning (MRL) comme OpenAI text-embedding-3-large (small). La valeur par défaut est Null, ce qui signifie qu’aucune troncation n’est définie.

truncationDimension?: number

Valeur de propriété

number