ResponseSession interface
الأساس لتكوين الجلسة في الرد.
الخصائص
| agent | تكوين الوكيل للجلسة، إذا كان ذلك ممكنا. |
| animation | تكوين الرسوم المتحركة للجلسة. |
| avatar | تكوين البث والسلوك لصورة الأفاتار أثناء الجلسة. |
| id | المعرف الفريد للجلسة. |
| input |
إعداد إلغاء الصدى أثناء معالجة الصوت على جانب الخادم. |
| input |
إدخال صيغة الصوت. الافتراضي هو 'pcm16'. |
| input |
تكوين الحد من ضوضاء صوت الإدخال. |
| input |
معدل أخذ عينات الصوت بالهرتز. القيم المتاحة:
|
| input |
تكوين النسخ الصوتي للإدخل. |
| instructions | تعليمات اختيارية لتوجيه سلوك النموذج طوال الجلسة. |
| interim |
تكوين توليد الاستجابة المؤقتة أثناء زمن الاستجابة أو استدعاءات الأدوات. |
| max |
الحد الأقصى لعدد الرموز التي يجب توليدها في الرد. الافتراضي غير محدود. |
| modalities | الأساليب التي ستستخدم في الجلسة. |
| model | نموذج الجلسة. |
| output |
صيغة الصوت المخرج. الافتراضي هو 'pcm16'. |
| output |
أنواع الطوابع الزمنية التي يجب تضمينها في محتوى الاستجابة الصوتية. |
| reasoning |
يقيد الجهد المبذول في التفكير في نماذج المنطق. تحقق من وثائق النموذج بحثا عن القيم المدعومة لكل نموذج. يمكن أن يؤدي تقليل جهد المنطق إلى استجابات أسرع والرموز المميزة الأقل المستخدمة في التفكير في الاستجابة. |
| temperature | يتحكم في عشوائية مخرجات النموذج. النطاق: 0.0 إلى 1.0. الافتراضي هو 0.7. |
| tool |
يحدد الأدوات التي يسمح للنموذج باستدعاؤها أثناء الجلسة. |
| tools | تكوين الأدوات المستخدمة أثناء الجلسة، إذا كان ذلك ممكنا. |
| turn |
نوع اكتشاف المنعطفات الذي يجب استخدامه. |
| voice | تكوين الصوت للجلسة. |
تفاصيل الخاصية
agent
animation
avatar
id
المعرف الفريد للجلسة.
id?: string
قيمة الخاصية
string
inputAudioEchoCancellation
إعداد إلغاء الصدى أثناء معالجة الصوت على جانب الخادم.
inputAudioEchoCancellation?: AudioEchoCancellation
قيمة الخاصية
inputAudioFormat
إدخال صيغة الصوت. الافتراضي هو 'pcm16'.
inputAudioFormat?: string
قيمة الخاصية
string
inputAudioNoiseReduction
تكوين الحد من ضوضاء صوت الإدخال.
inputAudioNoiseReduction?: AudioNoiseReduction
قيمة الخاصية
inputAudioSamplingRate
معدل أخذ عينات الصوت بالهرتز. القيم المتاحة:
بالنسبة ل pcm16: 8000، 16000، 24000
بالنسبة ل g711_alaw/g711_ulaw: 8000
inputAudioSamplingRate?: number
قيمة الخاصية
number
inputAudioTranscription
تكوين النسخ الصوتي للإدخل.
inputAudioTranscription?: AudioInputTranscriptionOptions
قيمة الخاصية
instructions
تعليمات اختيارية لتوجيه سلوك النموذج طوال الجلسة.
instructions?: string
قيمة الخاصية
string
interimResponse
تكوين توليد الاستجابة المؤقتة أثناء زمن الاستجابة أو استدعاءات الأدوات.
interimResponse?: InterimResponseConfig
قيمة الخاصية
maxResponseOutputTokens
الحد الأقصى لعدد الرموز التي يجب توليدها في الرد. الافتراضي غير محدود.
maxResponseOutputTokens?: number | "inf"
قيمة الخاصية
number | "inf"
modalities
الأساليب التي ستستخدم في الجلسة.
modalities?: string[]
قيمة الخاصية
string[]
model
نموذج الجلسة.
model?: string
قيمة الخاصية
string
outputAudioFormat
صيغة الصوت المخرج. الافتراضي هو 'pcm16'.
outputAudioFormat?: string
قيمة الخاصية
string
outputAudioTimestampTypes
أنواع الطوابع الزمنية التي يجب تضمينها في محتوى الاستجابة الصوتية.
outputAudioTimestampTypes?: string[]
قيمة الخاصية
string[]
reasoningEffort
يقيد الجهد المبذول في التفكير في نماذج المنطق. تحقق من وثائق النموذج بحثا عن القيم المدعومة لكل نموذج. يمكن أن يؤدي تقليل جهد المنطق إلى استجابات أسرع والرموز المميزة الأقل المستخدمة في التفكير في الاستجابة.
reasoningEffort?: string
قيمة الخاصية
string
temperature
يتحكم في عشوائية مخرجات النموذج. النطاق: 0.0 إلى 1.0. الافتراضي هو 0.7.
temperature?: number
قيمة الخاصية
number
toolChoice
يحدد الأدوات التي يسمح للنموذج باستدعاؤها أثناء الجلسة.
toolChoice?: ToolChoice
قيمة الخاصية
tools
تكوين الأدوات المستخدمة أثناء الجلسة، إذا كان ذلك ممكنا.
tools?: ToolUnion[]
قيمة الخاصية
turnDetection
نوع اكتشاف المنعطفات الذي يجب استخدامه.
turnDetection?: TurnDetectionUnion