BinaryQuantizationCompression interface
يحتوي على خيارات التكوين الخاصة بأسلوب ضغط التكميم الثنائي المستخدم أثناء الفهرسة والاستعلام.
الخصائص
| kind | تمييزي متعدد الأشكال، والذي يحدد الأنواع المختلفة التي يمكن أن يكون هذا الكائن |
الخصائص الموروثة
| compression |
الاسم المراد إقرانه بهذا التكوين المعين. |
| default |
عامل الطابع الزائد الافتراضي. سيطلب الطابع الزائد داخليا المزيد من المستندات (المحددة بواسطة هذا المضاعف) في البحث الأولي. وهذا يزيد من مجموعة النتائج التي سيتم إعادة نسخها باستخدام درجات التشابه المعاد حسابها من متجهات الدقة الكاملة. الحد الأدنى للقيمة هو 1، ما يعني عدم وجود طابع زائد (1x). يمكن تعيين هذه المعلمة فقط عندما تكون rerankWithOriginalVectors صحيحة. تعمل القيم الأعلى على تحسين الاستدعاء على حساب زمن الانتقال. |
| rerank |
إذا تم تعيينها إلى true، بمجرد الحصول على المجموعة مرتبة من النتائج المحسوبة باستخدام خطوط متجهة مضغوطة، ستتم إعادة ترتيبها مرة أخرى عن طريق إعادة حساب درجات التشابه كاملة الدقة. سيؤدي ذلك إلى تحسين الاستدعاء على حساب زمن الانتقال. |
| rescoring |
يحتوي على خيارات الإعادة التأهيلية. |
| truncation |
عدد الأبعاد التي يجب اقتطاع المتجهات إليها. يؤدي اقتطاع المتجهات إلى تقليل حجم المتجهات ومقدار البيانات التي يجب نقلها أثناء البحث. يمكن أن يوفر هذا تكلفة التخزين ويحسن أداء البحث على حساب الاستدعاء. يجب استخدامه فقط للتضمينات المدربة باستخدام Matryoshka Representation Learning (MRL) مثل OpenAI text-embedding-3-large (small). القيمة الافتراضية فارغة، مما يعني عدم الاقتطاع. |
تفاصيل الخاصية
kind
تمييزي متعدد الأشكال، والذي يحدد الأنواع المختلفة التي يمكن أن يكون هذا الكائن
kind: "binaryQuantization"
قيمة الخاصية
"binaryQuantization"
تفاصيل الخاصية الموروثة
compressionName
الاسم المراد إقرانه بهذا التكوين المعين.
compressionName: string
قيمة الخاصية
string
defaultOversampling
عامل الطابع الزائد الافتراضي. سيطلب الطابع الزائد داخليا المزيد من المستندات (المحددة بواسطة هذا المضاعف) في البحث الأولي. وهذا يزيد من مجموعة النتائج التي سيتم إعادة نسخها باستخدام درجات التشابه المعاد حسابها من متجهات الدقة الكاملة. الحد الأدنى للقيمة هو 1، ما يعني عدم وجود طابع زائد (1x). يمكن تعيين هذه المعلمة فقط عندما تكون rerankWithOriginalVectors صحيحة. تعمل القيم الأعلى على تحسين الاستدعاء على حساب زمن الانتقال.
defaultOversampling?: number
قيمة الخاصية
number
rerankWithOriginalVectors
إذا تم تعيينها إلى true، بمجرد الحصول على المجموعة مرتبة من النتائج المحسوبة باستخدام خطوط متجهة مضغوطة، ستتم إعادة ترتيبها مرة أخرى عن طريق إعادة حساب درجات التشابه كاملة الدقة. سيؤدي ذلك إلى تحسين الاستدعاء على حساب زمن الانتقال.
rerankWithOriginalVectors?: boolean
قيمة الخاصية
boolean
rescoringOptions
يحتوي على خيارات الإعادة التأهيلية.
rescoringOptions?: RescoringOptions
قيمة الخاصية
truncationDimension
عدد الأبعاد التي يجب اقتطاع المتجهات إليها. يؤدي اقتطاع المتجهات إلى تقليل حجم المتجهات ومقدار البيانات التي يجب نقلها أثناء البحث. يمكن أن يوفر هذا تكلفة التخزين ويحسن أداء البحث على حساب الاستدعاء. يجب استخدامه فقط للتضمينات المدربة باستخدام Matryoshka Representation Learning (MRL) مثل OpenAI text-embedding-3-large (small). القيمة الافتراضية فارغة، مما يعني عدم الاقتطاع.
truncationDimension?: number
قيمة الخاصية
number