مشاركة عبر


BaseVectorSearchCompression interface

يحتوي على خيارات التكوين الخاصة بطريقة الضغط المستخدمة أثناء الفهرسة أو الاستعلام.

الخصائص

compressionName

الاسم المراد إقرانه بهذا التكوين المعين.

defaultOversampling

عامل الطابع الزائد الافتراضي. سيطلب الطابع الزائد داخليا المزيد من المستندات (المحددة بواسطة هذا المضاعف) في البحث الأولي. وهذا يزيد من مجموعة النتائج التي سيتم إعادة نسخها باستخدام درجات التشابه المعاد حسابها من متجهات الدقة الكاملة. الحد الأدنى للقيمة هو 1، ما يعني عدم وجود طابع زائد (1x). يمكن تعيين هذه المعلمة فقط عندما تكون rerankWithOriginalVectors صحيحة. تعمل القيم الأعلى على تحسين الاستدعاء على حساب زمن الانتقال.

kind

تمييزي متعدد الأشكال، والذي يحدد الأنواع المختلفة التي يمكن أن يكون هذا الكائن

rerankWithOriginalVectors

إذا تم تعيينها إلى true، بمجرد الحصول على المجموعة مرتبة من النتائج المحسوبة باستخدام خطوط متجهة مضغوطة، ستتم إعادة ترتيبها مرة أخرى عن طريق إعادة حساب درجات التشابه كاملة الدقة. سيؤدي ذلك إلى تحسين الاستدعاء على حساب زمن الانتقال.

rescoringOptions

يحتوي على خيارات الإعادة التأهيلية.

truncationDimension

عدد الأبعاد التي يجب اقتطاع المتجهات إليها. يؤدي اقتطاع المتجهات إلى تقليل حجم المتجهات ومقدار البيانات التي يجب نقلها أثناء البحث. يمكن أن يوفر هذا تكلفة التخزين ويحسن أداء البحث على حساب الاستدعاء. يجب استخدامه فقط للتضمينات المدربة باستخدام Matryoshka Representation Learning (MRL) مثل OpenAI text-embedding-3-large (small). القيمة الافتراضية فارغة، مما يعني عدم الاقتطاع.

تفاصيل الخاصية

compressionName

الاسم المراد إقرانه بهذا التكوين المعين.

compressionName: string

قيمة الخاصية

string

defaultOversampling

عامل الطابع الزائد الافتراضي. سيطلب الطابع الزائد داخليا المزيد من المستندات (المحددة بواسطة هذا المضاعف) في البحث الأولي. وهذا يزيد من مجموعة النتائج التي سيتم إعادة نسخها باستخدام درجات التشابه المعاد حسابها من متجهات الدقة الكاملة. الحد الأدنى للقيمة هو 1، ما يعني عدم وجود طابع زائد (1x). يمكن تعيين هذه المعلمة فقط عندما تكون rerankWithOriginalVectors صحيحة. تعمل القيم الأعلى على تحسين الاستدعاء على حساب زمن الانتقال.

defaultOversampling?: number

قيمة الخاصية

number

kind

تمييزي متعدد الأشكال، والذي يحدد الأنواع المختلفة التي يمكن أن يكون هذا الكائن

kind: "binaryQuantization" | "scalarQuantization"

قيمة الخاصية

"binaryQuantization" | "scalarQuantization"

rerankWithOriginalVectors

إذا تم تعيينها إلى true، بمجرد الحصول على المجموعة مرتبة من النتائج المحسوبة باستخدام خطوط متجهة مضغوطة، ستتم إعادة ترتيبها مرة أخرى عن طريق إعادة حساب درجات التشابه كاملة الدقة. سيؤدي ذلك إلى تحسين الاستدعاء على حساب زمن الانتقال.

rerankWithOriginalVectors?: boolean

قيمة الخاصية

boolean

rescoringOptions

يحتوي على خيارات الإعادة التأهيلية.

rescoringOptions?: RescoringOptions

قيمة الخاصية

truncationDimension

عدد الأبعاد التي يجب اقتطاع المتجهات إليها. يؤدي اقتطاع المتجهات إلى تقليل حجم المتجهات ومقدار البيانات التي يجب نقلها أثناء البحث. يمكن أن يوفر هذا تكلفة التخزين ويحسن أداء البحث على حساب الاستدعاء. يجب استخدامه فقط للتضمينات المدربة باستخدام Matryoshka Representation Learning (MRL) مثل OpenAI text-embedding-3-large (small). القيمة الافتراضية فارغة، مما يعني عدم الاقتطاع.

truncationDimension?: number

قيمة الخاصية

number