BaseVectorSearchCompression interface
Enthält konfigurationsspezifische Optionen für die Komprimierungsmethode, die während der Indizierung oder Abfrage verwendet wird.
Eigenschaften
| compression |
Der Name, der dieser bestimmten Konfiguration zugeordnet werden soll. |
| default |
Standardüberstempelungsfaktor. Oversampling fordert intern weitere Dokumente (angegeben durch diesen Multiplizierer) in der anfänglichen Suche an. Dadurch wird der Satz von Ergebnissen erhöht, die mit neu kompilierten Ähnlichkeitsergebnissen aus Vollpräzisionsvektoren neu bewertet werden. Der Mindestwert ist 1, d. h. kein Übersampling (1x). Dieser Parameter kann nur festgelegt werden, wenn rerankWithOriginalVectors true ist. Höhere Werte verbessern den Rückruf auf Kosten der Latenz. |
| kind | Polymorphe Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann |
| rerank |
Wenn dieser Wert auf "true" festgelegt ist, wird der sortierte Satz von Ergebnissen, die mithilfe komprimierter Vektoren berechnet werden, erneut bewertet, indem die Genauigkeitsbewertungen mit voller Genauigkeit neu berechnet werden. Dadurch wird der Rückruf auf Kosten der Latenz verbessert. |
| rescoring |
Enthält die Optionen für die Korrektur. |
| truncation |
Die Anzahl der Dimensionen, mit der die Vektoren abgeschnitten werden sollen. Durch das Abschneiden der Vektoren wird die Größe der Vektoren und die Datenmenge reduziert, die während der Suche übertragen werden muss. Dies kann Speicherkosten sparen und die Suchleistung auf Kosten des Rückrufs verbessern. Es sollte nur für Einbettungen verwendet werden, die mit Matryoshka Representation Learning (MRL) trainiert wurden, z. B. OpenAI-Text-Embedding-3-large (klein). Der Standardwert ist NULL, was bedeutet, dass keine Abkürzung erfolgt. |
Details zur Eigenschaft
compressionName
Der Name, der dieser bestimmten Konfiguration zugeordnet werden soll.
compressionName: string
Eigenschaftswert
string
defaultOversampling
Standardüberstempelungsfaktor. Oversampling fordert intern weitere Dokumente (angegeben durch diesen Multiplizierer) in der anfänglichen Suche an. Dadurch wird der Satz von Ergebnissen erhöht, die mit neu kompilierten Ähnlichkeitsergebnissen aus Vollpräzisionsvektoren neu bewertet werden. Der Mindestwert ist 1, d. h. kein Übersampling (1x). Dieser Parameter kann nur festgelegt werden, wenn rerankWithOriginalVectors true ist. Höhere Werte verbessern den Rückruf auf Kosten der Latenz.
defaultOversampling?: number
Eigenschaftswert
number
kind
Polymorphe Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann
kind: "binaryQuantization" | "scalarQuantization"
Eigenschaftswert
"binaryQuantization" | "scalarQuantization"
rerankWithOriginalVectors
Wenn dieser Wert auf "true" festgelegt ist, wird der sortierte Satz von Ergebnissen, die mithilfe komprimierter Vektoren berechnet werden, erneut bewertet, indem die Genauigkeitsbewertungen mit voller Genauigkeit neu berechnet werden. Dadurch wird der Rückruf auf Kosten der Latenz verbessert.
rerankWithOriginalVectors?: boolean
Eigenschaftswert
boolean
rescoringOptions
Enthält die Optionen für die Korrektur.
rescoringOptions?: RescoringOptions
Eigenschaftswert
truncationDimension
Die Anzahl der Dimensionen, mit der die Vektoren abgeschnitten werden sollen. Durch das Abschneiden der Vektoren wird die Größe der Vektoren und die Datenmenge reduziert, die während der Suche übertragen werden muss. Dies kann Speicherkosten sparen und die Suchleistung auf Kosten des Rückrufs verbessern. Es sollte nur für Einbettungen verwendet werden, die mit Matryoshka Representation Learning (MRL) trainiert wurden, z. B. OpenAI-Text-Embedding-3-large (klein). Der Standardwert ist NULL, was bedeutet, dass keine Abkürzung erfolgt.
truncationDimension?: number
Eigenschaftswert
number