مشاركة عبر


قدرات الصوت في Azure OpenAI في نماذج Azure الذكاء الاصطناعي Foundry

هام

لا يتم تطبيق نظام تصفية المحتوى على المطالبات والإكمالات التي تتم معالجتها بواسطة نماذج الصوت مثل الهمس في Azure OpenAI.

تتوفر نماذج الصوت في Azure OpenAI عبر realtimeواجهات completionsبرمجة التطبيقات و و audio . تم تصميم نماذج الصوت للتعامل مع مجموعة متنوعة من المهام، بما في ذلك التعرف على الكلام والترجمة والنص إلى كلام.

للحصول على معلومات حول نماذج الصوت المتوفرة لكل منطقة في Azure OpenAI، راجع نماذج الصوتوالنماذج القياسية حسب نقطة النهاية ووثائق توفر النموذج القياسي العالمي .

واجهة برمجة تطبيقات الصوت في الوقت الحقيقي ل GPT-4o

تم تصميم الصوت في الوقت الحقيقي GPT-4o للتعامل مع تفاعلات المحادثة في الوقت الحقيقي، وزمن الانتقال المنخفض، مما يجعله مناسبا تماما لوكلاء الدعم والمساعدين والمترجمين وحالات الاستخدام الأخرى التي تحتاج إلى استجابة عالية مع المستخدم. لمزيد من المعلومات حول كيفية استخدام الصوت في الوقت الحقيقي GPT-4o، راجع التشغيل السريع للصوت في الوقت الحقيقي GPT-4oوكيفية استخدام صوت GPT-4o.

اكتمال الصوت GPT-4o

تم تصميم إكمال الصوت GPT-4o لإنشاء صوت من مطالبات الصوت أو النص، ما يجعله مناسبا تماما لإنشاء الكتب الصوتية والمحتوى الصوتي وحالات الاستخدام الأخرى التي تتطلب إنشاء الصوت. يقدم نموذج إكمال الصوت GPT-4o طريقة الصوت في واجهة برمجة التطبيقات الحالية /chat/completions . لمزيد من المعلومات حول كيفية استخدام إكمال الصوت GPT-4o، راجع التشغيل السريع لإنشاء الصوت.

واجهة برمجة تطبيقات الصوت

يمكن استخدام نماذج الصوت عبر /audio واجهة برمجة التطبيقات لتحويل الكلام إلى نص وترجمة ونص إلى كلام. لبدء استخدام واجهة برمجة تطبيقات الصوت، راجع البدء السريع ل الهمس لتحويل الكلام إلى نص.

ملاحظة

لمساعدتك في تحديد ما إذا كنت ستستخدم Azure الذكاء الاصطناعي Speech أو Azure OpenAI، راجع إرشادات النسخ الدفعي ل Azure الذكاء الاصطناعي Speech، وما هو نموذج الهمس؟، ونص OpenAI إلى أصوات الكلام .