ResponseCreateParams interface
أنشئ استجابة جديدة ل VoiceLive باستخدام هذه المعايير
الخصائص
| append |
أدخل عناصر لإضافتها إلى سياق المحادثة قبل توليد الرد. |
| cancel |
هل يجب إلغاء أي جيل مستمر قبل بدء هذا الإصدار. الإعدادات الافتراضية إلى true. |
| commit | هل يجب الالتزام بالرد على المحادثة. الإعدادات الافتراضية إلى true. |
| input |
عناصر إدخال تستخدم كسياق لهذا الرد. المصفوفة الفارغة تمسح السياق السابق. |
| instructions | كانت تعليمات النظام الافتراضية (أي رسالة النظام) تسبق استدعاءات النماذج. يتيح هذا المجال للعميل توجيه النموذج نحو الاستجابات المرغوبة. يمكن توجيه النموذج حول محتوى الاستجابة وصيغته، (مثل "كن موجزة للغاية"، "تصرف ودودا"، "إليك أمثلة على الردود الجيدة") وعلى سلوك الصوت (مثل "تحدث بسرعة"، "حقن المشاعر في صوتك"، "الضحك كثيرا"). التعليمات ليست مضمونة أن يتبعها النموذج، لكنها تقدم إرشادات للنموذج حول السلوك المطلوب. لاحظ أن الخادم يحدد التعليمات الافتراضية التي ستستخدم إذا لم يكن هذا الحقل مضبوطا وكانت مرئية في |
| interim |
تكوين توليد الاستجابة المؤقتة أثناء زمن الاستجابة أو استدعاءات الأدوات. |
| max |
الحد الأقصى لعدد رموز الإخراج لاستجابة مساعد واحد، بما في ذلك استدعاءات الأدوات. توفير عدد صحيح بين 1 و4096 لتحديد رموز الإخراج، أو |
| metadata | مجموعة من ما يصل إلى 16 زوجا من مفاتيح-قيمة يمكن ربطها بكائن. يمكن أن يكون هذا مفيدا لتخزين معلومات إضافية عن الكائن بصيغة منظمة. يمكن أن تكون المفاتيح بحد أقصى 64 حرفا وحتى 512 حرفا. |
| modalities | مجموعة الأنماط التي يمكن للنموذج الاستجابة بها. لتعطيل الصوت، قم بتعيين هذا على ["نص"]. |
| output |
صيغة الصوت المخرج. الخيارات هي |
| pre |
أنشئ الرد برسالة مساعد مولدة مسبقا. يتم إضافة عنصر الرسالة إلى سجل المحادثة ويعاد مع إخراج صوتي مركب في الرد الذي تم إنشاؤه. |
| reasoning |
يقيد الجهد في التفكير في نماذج الاستدلال. تحقق من توثيق النموذج للقيم المدعومة لكل نموذج. تقليل جهد التفكير يمكن أن يؤدي إلى استجابة أسرع واستخدام رموز أقل في الاستدلال. |
| temperature | درجة حرارة أخذ العينة للنموذج، محدودة ب [0.6، 1.2]. الوضع الافتراضي هو 0.8. |
| tool |
كيف يختار النموذج الأدوات. الخيارات هي |
| tools | الأدوات (الدوال) المتاحة للنموذج. |
| voice | يدعم معرفات الصوت والتكوينات. |
تفاصيل الخاصية
appendInputItems
أدخل عناصر لإضافتها إلى سياق المحادثة قبل توليد الرد.
appendInputItems?: ConversationRequestItemUnion[]
قيمة الخاصية
cancelPrevious
هل يجب إلغاء أي جيل مستمر قبل بدء هذا الإصدار. الإعدادات الافتراضية إلى true.
cancelPrevious?: boolean
قيمة الخاصية
boolean
commit
هل يجب الالتزام بالرد على المحادثة. الإعدادات الافتراضية إلى true.
commit?: boolean
قيمة الخاصية
boolean
inputItems
عناصر إدخال تستخدم كسياق لهذا الرد. المصفوفة الفارغة تمسح السياق السابق.
inputItems?: ConversationRequestItemUnion[]
قيمة الخاصية
instructions
كانت تعليمات النظام الافتراضية (أي رسالة النظام) تسبق استدعاءات النماذج. يتيح هذا المجال للعميل توجيه النموذج نحو الاستجابات المرغوبة. يمكن توجيه النموذج حول محتوى الاستجابة وصيغته، (مثل "كن موجزة للغاية"، "تصرف ودودا"، "إليك أمثلة على الردود الجيدة") وعلى سلوك الصوت (مثل "تحدث بسرعة"، "حقن المشاعر في صوتك"، "الضحك كثيرا"). التعليمات ليست مضمونة أن يتبعها النموذج، لكنها تقدم إرشادات للنموذج حول السلوك المطلوب.
لاحظ أن الخادم يحدد التعليمات الافتراضية التي ستستخدم إذا لم يكن هذا الحقل مضبوطا وكانت مرئية في session.created الحدث عند بداية الجلسة.
instructions?: string
قيمة الخاصية
string
interimResponse
تكوين توليد الاستجابة المؤقتة أثناء زمن الاستجابة أو استدعاءات الأدوات.
interimResponse?: InterimResponseConfig
قيمة الخاصية
maxOutputTokens
الحد الأقصى لعدد رموز الإخراج لاستجابة مساعد واحد، بما في ذلك استدعاءات الأدوات. توفير عدد صحيح بين 1 و4096 لتحديد رموز الإخراج، أو inf لأقصى رموز متاحة لنموذج معين. تتغير افتراضيا إلى inf.
maxOutputTokens?: number | "inf"
قيمة الخاصية
number | "inf"
metadata
مجموعة من ما يصل إلى 16 زوجا من مفاتيح-قيمة يمكن ربطها بكائن. يمكن أن يكون هذا مفيدا لتخزين معلومات إضافية عن الكائن بصيغة منظمة. يمكن أن تكون المفاتيح بحد أقصى 64 حرفا وحتى 512 حرفا.
metadata?: Record<string, string>
قيمة الخاصية
Record<string, string>
modalities
مجموعة الأنماط التي يمكن للنموذج الاستجابة بها. لتعطيل الصوت، قم بتعيين هذا على ["نص"].
modalities?: string[]
قيمة الخاصية
string[]
outputAudioFormat
صيغة الصوت المخرج. الخيارات هي pcm16، g711_ulaw، أو g711_alaw.
outputAudioFormat?: string
قيمة الخاصية
string
preGeneratedAssistantMessage
أنشئ الرد برسالة مساعد مولدة مسبقا. يتم إضافة عنصر الرسالة إلى سجل المحادثة ويعاد مع إخراج صوتي مركب في الرد الذي تم إنشاؤه.
preGeneratedAssistantMessage?: AssistantMessageItem
قيمة الخاصية
reasoningEffort
يقيد الجهد في التفكير في نماذج الاستدلال. تحقق من توثيق النموذج للقيم المدعومة لكل نموذج. تقليل جهد التفكير يمكن أن يؤدي إلى استجابة أسرع واستخدام رموز أقل في الاستدلال.
reasoningEffort?: string
قيمة الخاصية
string
temperature
درجة حرارة أخذ العينة للنموذج، محدودة ب [0.6، 1.2]. الوضع الافتراضي هو 0.8.
temperature?: number
قيمة الخاصية
number
toolChoice
كيف يختار النموذج الأدوات. الخيارات هي auto، none، required، أو تحديد دالة مثل {"type": "function", "function": {"name": "my_function"}}.
toolChoice?: string
قيمة الخاصية
string