ScalarQuantizationCompression interface
Berisi opsi konfigurasi khusus untuk metode kompresi kuantisasi skalar yang digunakan selama pengindeksan dan kueri.
- Memperluas
Properti
| kind | Diskriminator polimorfik, yang menentukan berbagai jenis objek ini dapat |
| parameters | Berisi parameter khusus untuk Kuantisasi Skalar. |
Properti yang Diwariskan
| compression |
Nama yang akan dikaitkan dengan konfigurasi khusus ini. |
| default |
Faktor oversampling default. Pengambilan sampel berlebih akan meminta lebih banyak dokumen secara internal (ditentukan oleh pengali ini) dalam pencarian awal. Ini meningkatkan serangkaian hasil yang akan direrank menggunakan skor kesamaan yang dikomputasi ulang dari vektor presisi penuh. Nilai minimum adalah 1, yang berarti tidak ada oversampling (1x). Parameter ini hanya dapat diatur ketika rerankWithOriginalVectors benar. Nilai yang lebih tinggi meningkatkan pengenalan dengan mengorbankan latensi. |
| rerank |
Jika diatur ke true, setelah kumpulan hasil yang diurutkan yang dihitung menggunakan vektor terkompresi diperoleh, mereka akan dirankit ulang lagi dengan menghitung ulang skor kesamaan presisi penuh. Ini akan meningkatkan pengenalan dengan mengorbankan latensi. |
| rescoring |
Berisi opsi untuk memulihkan. |
| truncation |
Jumlah dimensi untuk memotong vektor. Memotong vektor mengurangi ukuran vektor dan jumlah data yang perlu ditransfer selama pencarian. Ini dapat menghemat biaya penyimpanan dan meningkatkan kinerja pencarian dengan mengorbankan penarikan. Ini hanya boleh digunakan untuk penyematan yang dilatih dengan Matryoshka Representation Learning (MRL) seperti OpenAI text-embedding-3-large (kecil). Nilai defaultnya adalah null, yang berarti tidak ada pemotongan. |
Detail Properti
kind
Diskriminator polimorfik, yang menentukan berbagai jenis objek ini dapat
kind: "scalarQuantization"
Nilai Properti
"scalarQuantization"
parameters
Berisi parameter khusus untuk Kuantisasi Skalar.
parameters?: ScalarQuantizationParameters
Nilai Properti
Detail Properti yang Diwariskan
compressionName
Nama yang akan dikaitkan dengan konfigurasi khusus ini.
compressionName: string
Nilai Properti
string
Diwarisi dariVectorSearchCompression.compressionName
defaultOversampling
Faktor oversampling default. Pengambilan sampel berlebih akan meminta lebih banyak dokumen secara internal (ditentukan oleh pengali ini) dalam pencarian awal. Ini meningkatkan serangkaian hasil yang akan direrank menggunakan skor kesamaan yang dikomputasi ulang dari vektor presisi penuh. Nilai minimum adalah 1, yang berarti tidak ada oversampling (1x). Parameter ini hanya dapat diatur ketika rerankWithOriginalVectors benar. Nilai yang lebih tinggi meningkatkan pengenalan dengan mengorbankan latensi.
defaultOversampling?: number
Nilai Properti
number
Diwarisi dariVectorSearchCompression.defaultOversampling
rerankWithOriginalVectors
Jika diatur ke true, setelah kumpulan hasil yang diurutkan yang dihitung menggunakan vektor terkompresi diperoleh, mereka akan dirankit ulang lagi dengan menghitung ulang skor kesamaan presisi penuh. Ini akan meningkatkan pengenalan dengan mengorbankan latensi.
rerankWithOriginalVectors?: boolean
Nilai Properti
boolean
Diwarisi dariVectorSearchCompression.rerankWithOriginalVectors
rescoringOptions
Berisi opsi untuk memulihkan.
rescoringOptions?: RescoringOptions
Nilai Properti
Diwarisi dariVectorSearchCompression.rescoringOptions
truncationDimension
Jumlah dimensi untuk memotong vektor. Memotong vektor mengurangi ukuran vektor dan jumlah data yang perlu ditransfer selama pencarian. Ini dapat menghemat biaya penyimpanan dan meningkatkan kinerja pencarian dengan mengorbankan penarikan. Ini hanya boleh digunakan untuk penyematan yang dilatih dengan Matryoshka Representation Learning (MRL) seperti OpenAI text-embedding-3-large (kecil). Nilai defaultnya adalah null, yang berarti tidak ada pemotongan.
truncationDimension?: number
Nilai Properti
number
Diwarisi dariVectorSearchCompression.truncationDimension