Compartir a través de


ScalarQuantizationCompression interface

Contiene opciones de configuración específicas del método de compresión de cuantificación escalar que se usa durante la indexación y la consulta.

Extends

Propiedades

kind

Discriminador polimórfico, que especifica los distintos tipos que puede ser este objeto.

parameters

Contiene los parámetros específicos de la cuantificación escalar.

Propiedades heredadas

compressionName

Nombre que se va a asociar a esta configuración concreta.

defaultOversampling

Factor de sobremuestreo predeterminado. El sobremuestreo solicitará internamente más documentos (especificados por este multiplicador) en la búsqueda inicial. Esto aumenta el conjunto de resultados que se volverán a calcular mediante puntuaciones de similitud recalculadas a partir de vectores de precisión completa. El valor mínimo es 1, lo que significa que no hay sobremuestreo (1x). Este parámetro solo se puede establecer cuando rerankWithOriginalVectors es true. Los valores más altos mejoran la recuperación a costa de la latencia.

rerankWithOriginalVectors

Si se establece en true, una vez obtenido el conjunto ordenado de resultados calculados mediante vectores comprimidos, se volverán a calcular las puntuaciones de similitud de precisión completa. Esto mejorará la recuperación a costa de la latencia.

rescoringOptions

Contiene las opciones de recorción.

truncationDimension

Número de dimensiones en las que se truncan los vectores. Truncar los vectores reduce el tamaño de los vectores y la cantidad de datos que se deben transferir durante la búsqueda. Esto puede ahorrar costos de almacenamiento y mejorar el rendimiento de la búsqueda a costa de la recuperación. Solo se debe usar para incrustaciones entrenadas con Matryoshka Representation Learning (MRL), como OpenAI text-embeding-3-large (small). El valor predeterminado es NULL, lo que significa que no hay truncamiento.

Detalles de las propiedades

kind

Discriminador polimórfico, que especifica los distintos tipos que puede ser este objeto.

kind: "scalarQuantization"

Valor de propiedad

"scalarQuantization"

parameters

Contiene los parámetros específicos de la cuantificación escalar.

parameters?: ScalarQuantizationParameters

Valor de propiedad

Detalles de las propiedades heredadas

compressionName

Nombre que se va a asociar a esta configuración concreta.

compressionName: string

Valor de propiedad

string

Heredado deVectorSearchCompression.compressionName

defaultOversampling

Factor de sobremuestreo predeterminado. El sobremuestreo solicitará internamente más documentos (especificados por este multiplicador) en la búsqueda inicial. Esto aumenta el conjunto de resultados que se volverán a calcular mediante puntuaciones de similitud recalculadas a partir de vectores de precisión completa. El valor mínimo es 1, lo que significa que no hay sobremuestreo (1x). Este parámetro solo se puede establecer cuando rerankWithOriginalVectors es true. Los valores más altos mejoran la recuperación a costa de la latencia.

defaultOversampling?: number

Valor de propiedad

number

Heredado deVectorSearchCompression.defaultOversampling

rerankWithOriginalVectors

Si se establece en true, una vez obtenido el conjunto ordenado de resultados calculados mediante vectores comprimidos, se volverán a calcular las puntuaciones de similitud de precisión completa. Esto mejorará la recuperación a costa de la latencia.

rerankWithOriginalVectors?: boolean

Valor de propiedad

boolean

Heredado deVectorSearchCompression.rerankWithOriginalVectors

rescoringOptions

Contiene las opciones de recorción.

rescoringOptions?: RescoringOptions

Valor de propiedad

Heredado deVectorSearchCompression.rescoringOptions

truncationDimension

Número de dimensiones en las que se truncan los vectores. Truncar los vectores reduce el tamaño de los vectores y la cantidad de datos que se deben transferir durante la búsqueda. Esto puede ahorrar costos de almacenamiento y mejorar el rendimiento de la búsqueda a costa de la recuperación. Solo se debe usar para incrustaciones entrenadas con Matryoshka Representation Learning (MRL), como OpenAI text-embeding-3-large (small). El valor predeterminado es NULL, lo que significa que no hay truncamiento.

truncationDimension?: number

Valor de propiedad

number

Heredado deVectorSearchCompression.truncationDimension