Freigeben über


BaseVectorSearchCompression interface

Enthält konfigurationsspezifische Optionen für die Komprimierungsmethode, die während der Indizierung oder Abfrage verwendet wird.

Eigenschaften

compressionName

Der Name, der dieser bestimmten Konfiguration zugeordnet werden soll.

defaultOversampling

Standardüberstempelungsfaktor. Oversampling fordert intern weitere Dokumente (angegeben durch diesen Multiplizierer) in der anfänglichen Suche an. Dadurch wird der Satz von Ergebnissen erhöht, die mit neu kompilierten Ähnlichkeitsergebnissen aus Vollpräzisionsvektoren neu bewertet werden. Der Mindestwert ist 1, d. h. kein Übersampling (1x). Dieser Parameter kann nur festgelegt werden, wenn rerankWithOriginalVectors true ist. Höhere Werte verbessern den Rückruf auf Kosten der Latenz.

kind

Polymorphe Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann

rerankWithOriginalVectors

Wenn dieser Wert auf "true" festgelegt ist, wird der sortierte Satz von Ergebnissen, die mithilfe komprimierter Vektoren berechnet werden, erneut bewertet, indem die Genauigkeitsbewertungen mit voller Genauigkeit neu berechnet werden. Dadurch wird der Rückruf auf Kosten der Latenz verbessert.

rescoringOptions

Enthält die Optionen für die Korrektur.

truncationDimension

Die Anzahl der Dimensionen, mit der die Vektoren abgeschnitten werden sollen. Durch das Abschneiden der Vektoren wird die Größe der Vektoren und die Datenmenge reduziert, die während der Suche übertragen werden muss. Dies kann Speicherkosten sparen und die Suchleistung auf Kosten des Rückrufs verbessern. Es sollte nur für Einbettungen verwendet werden, die mit Matryoshka Representation Learning (MRL) trainiert wurden, z. B. OpenAI-Text-Embedding-3-large (klein). Der Standardwert ist NULL, was bedeutet, dass keine Abkürzung erfolgt.

Details zur Eigenschaft

compressionName

Der Name, der dieser bestimmten Konfiguration zugeordnet werden soll.

compressionName: string

Eigenschaftswert

string

defaultOversampling

Standardüberstempelungsfaktor. Oversampling fordert intern weitere Dokumente (angegeben durch diesen Multiplizierer) in der anfänglichen Suche an. Dadurch wird der Satz von Ergebnissen erhöht, die mit neu kompilierten Ähnlichkeitsergebnissen aus Vollpräzisionsvektoren neu bewertet werden. Der Mindestwert ist 1, d. h. kein Übersampling (1x). Dieser Parameter kann nur festgelegt werden, wenn rerankWithOriginalVectors true ist. Höhere Werte verbessern den Rückruf auf Kosten der Latenz.

defaultOversampling?: number

Eigenschaftswert

number

kind

Polymorphe Diskriminator, der die verschiedenen Typen angibt, die dieses Objekt sein kann

kind: "binaryQuantization" | "scalarQuantization"

Eigenschaftswert

"binaryQuantization" | "scalarQuantization"

rerankWithOriginalVectors

Wenn dieser Wert auf "true" festgelegt ist, wird der sortierte Satz von Ergebnissen, die mithilfe komprimierter Vektoren berechnet werden, erneut bewertet, indem die Genauigkeitsbewertungen mit voller Genauigkeit neu berechnet werden. Dadurch wird der Rückruf auf Kosten der Latenz verbessert.

rerankWithOriginalVectors?: boolean

Eigenschaftswert

boolean

rescoringOptions

Enthält die Optionen für die Korrektur.

rescoringOptions?: RescoringOptions

Eigenschaftswert

truncationDimension

Die Anzahl der Dimensionen, mit der die Vektoren abgeschnitten werden sollen. Durch das Abschneiden der Vektoren wird die Größe der Vektoren und die Datenmenge reduziert, die während der Suche übertragen werden muss. Dies kann Speicherkosten sparen und die Suchleistung auf Kosten des Rückrufs verbessern. Es sollte nur für Einbettungen verwendet werden, die mit Matryoshka Representation Learning (MRL) trainiert wurden, z. B. OpenAI-Text-Embedding-3-large (klein). Der Standardwert ist NULL, was bedeutet, dass keine Abkürzung erfolgt.

truncationDimension?: number

Eigenschaftswert

number