ScalarQuantizationCompression interface
Contiene opciones de configuración específicas del método de compresión de cuantificación escalar que se usa durante la indexación y la consulta.
- Extends
Propiedades
| kind | Discriminador polimórfico, que especifica los distintos tipos que puede ser este objeto. |
| parameters | Contiene los parámetros específicos de la cuantificación escalar. |
Propiedades heredadas
| compression |
Nombre que se va a asociar a esta configuración concreta. |
| default |
Factor de sobremuestreo predeterminado. El sobremuestreo solicitará internamente más documentos (especificados por este multiplicador) en la búsqueda inicial. Esto aumenta el conjunto de resultados que se volverán a calcular mediante puntuaciones de similitud recalculadas a partir de vectores de precisión completa. El valor mínimo es 1, lo que significa que no hay sobremuestreo (1x). Este parámetro solo se puede establecer cuando rerankWithOriginalVectors es true. Los valores más altos mejoran la recuperación a costa de la latencia. |
| rerank |
Si se establece en true, una vez obtenido el conjunto ordenado de resultados calculados mediante vectores comprimidos, se volverán a calcular las puntuaciones de similitud de precisión completa. Esto mejorará la recuperación a costa de la latencia. |
| rescoring |
Contiene las opciones de recorción. |
| truncation |
Número de dimensiones en las que se truncan los vectores. Truncar los vectores reduce el tamaño de los vectores y la cantidad de datos que se deben transferir durante la búsqueda. Esto puede ahorrar costos de almacenamiento y mejorar el rendimiento de la búsqueda a costa de la recuperación. Solo se debe usar para incrustaciones entrenadas con Matryoshka Representation Learning (MRL), como OpenAI text-embeding-3-large (small). El valor predeterminado es NULL, lo que significa que no hay truncamiento. |
Detalles de las propiedades
kind
Discriminador polimórfico, que especifica los distintos tipos que puede ser este objeto.
kind: "scalarQuantization"
Valor de propiedad
"scalarQuantization"
parameters
Contiene los parámetros específicos de la cuantificación escalar.
parameters?: ScalarQuantizationParameters
Valor de propiedad
Detalles de las propiedades heredadas
compressionName
Nombre que se va a asociar a esta configuración concreta.
compressionName: string
Valor de propiedad
string
Heredado deVectorSearchCompression.compressionName
defaultOversampling
Factor de sobremuestreo predeterminado. El sobremuestreo solicitará internamente más documentos (especificados por este multiplicador) en la búsqueda inicial. Esto aumenta el conjunto de resultados que se volverán a calcular mediante puntuaciones de similitud recalculadas a partir de vectores de precisión completa. El valor mínimo es 1, lo que significa que no hay sobremuestreo (1x). Este parámetro solo se puede establecer cuando rerankWithOriginalVectors es true. Los valores más altos mejoran la recuperación a costa de la latencia.
defaultOversampling?: number
Valor de propiedad
number
Heredado deVectorSearchCompression.defaultOversampling
rerankWithOriginalVectors
Si se establece en true, una vez obtenido el conjunto ordenado de resultados calculados mediante vectores comprimidos, se volverán a calcular las puntuaciones de similitud de precisión completa. Esto mejorará la recuperación a costa de la latencia.
rerankWithOriginalVectors?: boolean
Valor de propiedad
boolean
Heredado deVectorSearchCompression.rerankWithOriginalVectors
rescoringOptions
Contiene las opciones de recorción.
rescoringOptions?: RescoringOptions
Valor de propiedad
Heredado deVectorSearchCompression.rescoringOptions
truncationDimension
Número de dimensiones en las que se truncan los vectores. Truncar los vectores reduce el tamaño de los vectores y la cantidad de datos que se deben transferir durante la búsqueda. Esto puede ahorrar costos de almacenamiento y mejorar el rendimiento de la búsqueda a costa de la recuperación. Solo se debe usar para incrustaciones entrenadas con Matryoshka Representation Learning (MRL), como OpenAI text-embeding-3-large (small). El valor predeterminado es NULL, lo que significa que no hay truncamiento.
truncationDimension?: number
Valor de propiedad
number
Heredado deVectorSearchCompression.truncationDimension