قدرات الصوت في Azure OpenAI في نماذج Azure الذكاء الاصطناعي Foundry

2025-07-02

هام

لا يتم تطبيق نظام تصفية المحتوى على المطالبات والإكمالات التي تتم معالجتها بواسطة نماذج الصوت مثل الهمس في Azure OpenAI.

تتوفر نماذج الصوت في Azure OpenAI عبر realtimeواجهات completionsبرمجة التطبيقات و و audio . تم تصميم نماذج الصوت للتعامل مع مجموعة متنوعة من المهام، بما في ذلك التعرف على الكلام والترجمة والنص إلى كلام.

للحصول على معلومات حول نماذج الصوت المتوفرة لكل منطقة في Azure OpenAI، راجع نماذج الصوت والنماذج القياسية حسب نقطة النهاية ووثائق توفر النموذج القياسي العالمي .

واجهة برمجة تطبيقات الصوت في الوقت الحقيقي ل GPT-4o

تم تصميم الصوت في الوقت الحقيقي GPT-4o للتعامل مع تفاعلات المحادثة في الوقت الحقيقي، وزمن الانتقال المنخفض، مما يجعله مناسبا تماما لوكلاء الدعم والمساعدين والمترجمين وحالات الاستخدام الأخرى التي تحتاج إلى استجابة عالية مع المستخدم. لمزيد من المعلومات حول كيفية استخدام الصوت في الوقت الحقيقي GPT-4o، راجع التشغيل السريع للصوت في الوقت الحقيقي GPT-4o وكيفية استخدام صوت GPT-4o.

اكتمال الصوت GPT-4o

تم تصميم إكمال الصوت GPT-4o لإنشاء صوت من مطالبات الصوت أو النص، ما يجعله مناسبا تماما لإنشاء الكتب الصوتية والمحتوى الصوتي وحالات الاستخدام الأخرى التي تتطلب إنشاء الصوت. يقدم نموذج إكمال الصوت GPT-4o طريقة الصوت في واجهة برمجة التطبيقات الحالية /chat/completions . لمزيد من المعلومات حول كيفية استخدام إكمال الصوت GPT-4o، راجع التشغيل السريع لإنشاء الصوت.

واجهة برمجة تطبيقات الصوت

يمكن استخدام نماذج الصوت عبر /audio واجهة برمجة التطبيقات لتحويل الكلام إلى نص وترجمة ونص إلى كلام. لبدء استخدام واجهة برمجة تطبيقات الصوت، راجع البدء السريع ل الهمس لتحويل الكلام إلى نص.

ملاحظة

لمساعدتك في تحديد ما إذا كنت ستستخدم Azure الذكاء الاصطناعي Speech أو Azure OpenAI، راجع إرشادات النسخ الدفعي ل Azure الذكاء الاصطناعي Speech، وما هو نموذج الهمس؟، ونص OpenAI إلى أصوات الكلام .

مشاركة عبر

قدرات الصوت في Azure OpenAI في نماذج Azure الذكاء الاصطناعي Foundry

واجهة برمجة تطبيقات الصوت في الوقت الحقيقي ل GPT-4o

اكتمال الصوت GPT-4o

واجهة برمجة تطبيقات الصوت

المحتويات ذات الصلة

الملاحظات

الموارد الإضافية