ملاحظة
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تسجيل الدخول أو تغيير الدلائل.
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تغيير الدلائل.
هام
لا يتم تطبيق نظام تصفية المحتوى على المطالبات والإكمالات التي تتم معالجتها بواسطة نماذج الصوت مثل الهمس في Azure OpenAI.
تتوفر نماذج الصوت في Azure OpenAI عبر realtime
واجهات completions
برمجة التطبيقات و و audio
. تم تصميم نماذج الصوت للتعامل مع مجموعة متنوعة من المهام، بما في ذلك التعرف على الكلام والترجمة والنص إلى كلام.
للحصول على معلومات حول نماذج الصوت المتوفرة لكل منطقة في Azure OpenAI، راجع نماذج الصوتوالنماذج القياسية حسب نقطة النهاية ووثائق توفر النموذج القياسي العالمي .
واجهة برمجة تطبيقات الصوت في الوقت الحقيقي ل GPT-4o
تم تصميم الصوت في الوقت الحقيقي GPT-4o للتعامل مع تفاعلات المحادثة في الوقت الحقيقي، وزمن الانتقال المنخفض، مما يجعله مناسبا تماما لوكلاء الدعم والمساعدين والمترجمين وحالات الاستخدام الأخرى التي تحتاج إلى استجابة عالية مع المستخدم. لمزيد من المعلومات حول كيفية استخدام الصوت في الوقت الحقيقي GPT-4o، راجع التشغيل السريع للصوت في الوقت الحقيقي GPT-4oوكيفية استخدام صوت GPT-4o.
اكتمال الصوت GPT-4o
تم تصميم إكمال الصوت GPT-4o لإنشاء صوت من مطالبات الصوت أو النص، ما يجعله مناسبا تماما لإنشاء الكتب الصوتية والمحتوى الصوتي وحالات الاستخدام الأخرى التي تتطلب إنشاء الصوت. يقدم نموذج إكمال الصوت GPT-4o طريقة الصوت في واجهة برمجة التطبيقات الحالية /chat/completions
. لمزيد من المعلومات حول كيفية استخدام إكمال الصوت GPT-4o، راجع التشغيل السريع لإنشاء الصوت.
واجهة برمجة تطبيقات الصوت
يمكن استخدام نماذج الصوت عبر /audio
واجهة برمجة التطبيقات لتحويل الكلام إلى نص وترجمة ونص إلى كلام. لبدء استخدام واجهة برمجة تطبيقات الصوت، راجع البدء السريع ل الهمس لتحويل الكلام إلى نص.
ملاحظة
لمساعدتك في تحديد ما إذا كنت ستستخدم Azure الذكاء الاصطناعي Speech أو Azure OpenAI، راجع إرشادات النسخ الدفعي ل Azure الذكاء الاصطناعي Speech، وما هو نموذج الهمس؟، ونص OpenAI إلى أصوات الكلام .