مشاركة عبر


BinaryQuantizationCompression interface

يحتوي على خيارات التكوين الخاصة بأسلوب ضغط التكميم الثنائي المستخدم أثناء الفهرسة والاستعلام.

يمتد

الخصائص

kind

تمييزي متعدد الأشكال، والذي يحدد الأنواع المختلفة التي يمكن أن يكون هذا الكائن

الخصائص الموروثة

compressionName

الاسم المراد إقرانه بهذا التكوين المعين.

defaultOversampling

عامل الطابع الزائد الافتراضي. سيطلب الطابع الزائد داخليا المزيد من المستندات (المحددة بواسطة هذا المضاعف) في البحث الأولي. وهذا يزيد من مجموعة النتائج التي سيتم إعادة نسخها باستخدام درجات التشابه المعاد حسابها من متجهات الدقة الكاملة. الحد الأدنى للقيمة هو 1، ما يعني عدم وجود طابع زائد (1x). يمكن تعيين هذه المعلمة فقط عندما تكون rerankWithOriginalVectors صحيحة. تعمل القيم الأعلى على تحسين الاستدعاء على حساب زمن الانتقال.

rerankWithOriginalVectors

إذا تم تعيينها إلى true، بمجرد الحصول على المجموعة مرتبة من النتائج المحسوبة باستخدام خطوط متجهة مضغوطة، ستتم إعادة ترتيبها مرة أخرى عن طريق إعادة حساب درجات التشابه كاملة الدقة. سيؤدي ذلك إلى تحسين الاستدعاء على حساب زمن الانتقال.

rescoringOptions

يحتوي على خيارات الإعادة التأهيلية.

truncationDimension

عدد الأبعاد التي يجب اقتطاع المتجهات إليها. يؤدي اقتطاع المتجهات إلى تقليل حجم المتجهات ومقدار البيانات التي يجب نقلها أثناء البحث. يمكن أن يوفر هذا تكلفة التخزين ويحسن أداء البحث على حساب الاستدعاء. يجب استخدامه فقط للتضمينات المدربة باستخدام Matryoshka Representation Learning (MRL) مثل OpenAI text-embedding-3-large (small). القيمة الافتراضية فارغة، مما يعني عدم الاقتطاع.

تفاصيل الخاصية

kind

تمييزي متعدد الأشكال، والذي يحدد الأنواع المختلفة التي يمكن أن يكون هذا الكائن

kind: "binaryQuantization"

قيمة الخاصية

"binaryQuantization"

تفاصيل الخاصية الموروثة

compressionName

الاسم المراد إقرانه بهذا التكوين المعين.

compressionName: string

قيمة الخاصية

string

موروثة منVectorSearchCompression.compressionName

defaultOversampling

عامل الطابع الزائد الافتراضي. سيطلب الطابع الزائد داخليا المزيد من المستندات (المحددة بواسطة هذا المضاعف) في البحث الأولي. وهذا يزيد من مجموعة النتائج التي سيتم إعادة نسخها باستخدام درجات التشابه المعاد حسابها من متجهات الدقة الكاملة. الحد الأدنى للقيمة هو 1، ما يعني عدم وجود طابع زائد (1x). يمكن تعيين هذه المعلمة فقط عندما تكون rerankWithOriginalVectors صحيحة. تعمل القيم الأعلى على تحسين الاستدعاء على حساب زمن الانتقال.

defaultOversampling?: number

قيمة الخاصية

number

موروثة منVectorSearchCompression.defaultOversampling

rerankWithOriginalVectors

إذا تم تعيينها إلى true، بمجرد الحصول على المجموعة مرتبة من النتائج المحسوبة باستخدام خطوط متجهة مضغوطة، ستتم إعادة ترتيبها مرة أخرى عن طريق إعادة حساب درجات التشابه كاملة الدقة. سيؤدي ذلك إلى تحسين الاستدعاء على حساب زمن الانتقال.

rerankWithOriginalVectors?: boolean

قيمة الخاصية

boolean

موروثة منVectorSearchCompression.rerankWithOriginalVectors

rescoringOptions

يحتوي على خيارات الإعادة التأهيلية.

rescoringOptions?: RescoringOptions

قيمة الخاصية

موروثة منVectorSearchCompression.rescoringOptions

truncationDimension

عدد الأبعاد التي يجب اقتطاع المتجهات إليها. يؤدي اقتطاع المتجهات إلى تقليل حجم المتجهات ومقدار البيانات التي يجب نقلها أثناء البحث. يمكن أن يوفر هذا تكلفة التخزين ويحسن أداء البحث على حساب الاستدعاء. يجب استخدامه فقط للتضمينات المدربة باستخدام Matryoshka Representation Learning (MRL) مثل OpenAI text-embedding-3-large (small). القيمة الافتراضية فارغة، مما يعني عدم الاقتطاع.

truncationDimension?: number

قيمة الخاصية

number

موروثة منVectorSearchCompression.truncationDimension