مشاركة عبر


تطوير الألعاب باستخدام Azure الذكاء الاصطناعي Speech

يمكن استخدام Azure الذكاء الاصطناعي Speech لتحسين سيناريوهات الألعاب المختلفة، سواء داخل اللعبة أو خارجها.

فيما يلي بعض ميزات الكلام التي يجب مراعاتها للحصول على تجارب ألعاب مرنة وتفاعلية:

  • أحضر الجميع إلى المحادثة من خلال تركيب الصوت من النص. أو عن طريق عرض نص من الصوت.
  • اجعل اللعبة أكثر سهولة للاعبين غير القادرين على قراءة النص بلغة معينة، بما في ذلك اللاعبين الشباب الذين لا يقرأون أو يكتبون. يمكن للاعبين الاستماع إلى القصص والتعليمات بلغتهم المفضلة.
  • إنشاء أفاتار اللعبة والأحرف غير القابلة للتشعب (مجلس الشعب) التي يمكن أن تبدأ أو تشارك في محادثة داخل اللعبة.
  • يمكن أن يوفر الصوت القياسي أصواتا طبيعية للغاية خارج الصندوق مع مجموعة متنوعة من الأصوات الرائدة من حيث مجموعة كبيرة من اللغات والأصوات.
  • صوت مخصص لإنشاء صوت يظل على العلامة التجارية بجودة متسقة وأسلوب التحدث. يمكنك إضافة العواطف واللهجات والدقة والضحك وغيرها من الأصوات والتعبيرات اللغوية شبه اللغوية.
  • استخدام النماذج الأولية للحوار اللعبة لتقصير مقدار الوقت والمال الذي تنفقه في المنتج للحصول على اللعبة إلى السوق في وقت أقرب. يمكنك تبديل خطوط الحوار بسرعة والاستماع إلى الاختلافات في الوقت الحقيقي لتكرار محتوى اللعبة.

يمكنك استخدام Speech SDK أو Speech CLI لفترة انتقال منخفضة في الوقت الفعلي لتحويل الكلام إلى نص ونص إلى كلام وتحديد اللغة وترجمة الكلام. يمكنك أيضا استخدام واجهة برمجة تطبيقات النسخ الدفعي لنسخ الكلام المسجل مسبقا إلى نص. لتجميع حجم كبير من إدخال النص (طويل وقصير) إلى كلام، استخدم واجهة برمجة تطبيقات تجميع الدفعات.

للحصول على معلومات حول التوفر المحلي والإقليمي، راجع دعم اللغة والصوتودعم المنطقة.

نص إلى كلام

ساعد في جلب الجميع إلى المحادثة عن طريق تحويل الرسائل النصية إلى صوت باستخدام النص إلى كلام لسيناريوهات، مثل النماذج الأولية للحوار اللعبة، أو إمكانية وصول أكبر، أو أصوات الأحرف غير القابلة للتشعب (مجلس الشعب). يتضمن النص إلى كلام ميزات صوتية وصوتية مخصصةقياسية. يمكن أن يوفر الصوت القياسي أصواتا طبيعية للغاية خارج الصندوق مع مجموعة متنوعة من الأصوات الرائدة من حيث مجموعة كبيرة من اللغات والأصوات. الصوت المخصص هو خدمة ذاتية سهلة الاستخدام لإنشاء صوت مخصص طبيعي للغاية.

عند تمكين هذه الوظيفة في اللعبة، ضع في اعتبارك المزايا التالية:

  • الأصوات واللغات المدعومة - يتم دعم مجموعة كبيرة من اللغات والأصوات . يمكنك أيضا تحديد لغات متعددة لإخراج النص إلى الكلام. بالنسبة للصوت المخصص، يمكنك اختيار إنشاء لغات مختلفة من بيانات تدريب لغة واحدة.
  • الأنماط العاطفية المدعومة - نغمات عاطفية، مثل البهجة، والغاضب، والحزن، والمتحمس، والأمل، والودية، وغير ودية، والرعب، والصراخ، والهمس. يمكنك ضبط نمط التحدث ودرجة النمط والدور على مستوى الجملة.
  • Visemes المدعومة - يمكنك استخدام visemes أثناء التركيب في الوقت الحقيقي للتحكم في حركة نماذج الأفاتار 2D و3D، بحيث تتطابق حركات الفم تماما مع الكلام الاصطناعي. لمزيد من المعلومات، راجع الحصول على موضع الوجه باستخدام viseme.
  • ضبط النص إلى إخراج الكلام باستخدام لغة ترميز تركيب الكلام (SSML) - باستخدام SSML، يمكنك تخصيص النص إلى مخرجات الكلام، مع دعم أكثر ثراء لضبط الصوت. لمزيد من المعلومات، راجع نظرة عامة على لغة ترميز تركيب الكلام (SSML).
  • مخرجات الصوت - يتوفر كل نموذج صوت قياسي بسرعة 24 كيلوهرتز ودقة عالية 48 كيلوهرتز. إذا قمت بتحديد تنسيق إخراج 48 كيلوهرتز، يتم استدعاء نموذج الصوت عالي الدقة مع 48 كيلوهرتز وفقا لذلك. يمكن الحصول على معدلات العينة بخلاف 24 كيلوهرتز و48 كيلوهرتز من خلال رفع الطابع أو تقليله عند التركيب. على سبيل المثال، يتم تقليل 44.1 كيلوهرتز من 48 كيلوهرتز. يتضمن كل تنسيق صوت معدل البت ونوع الترميز. لمزيد من المعلومات، راجع تنسيقات الصوت المعتمدة. لمزيد من المعلومات حول الأصوات عالية الجودة بسرعة 48 كيلوهرتز، راجع مدونة المقدمة هذه.

على سبيل المثال، راجع التشغيل السريع للنص إلى كلام.

الكلام إلى النص

يمكنك استخدام الكلام إلى نص لعرض نص من الصوت المنطوق في اللعبة. على سبيل المثال، راجع التشغيل السريع لتحويل الكلام إلى نص.

تعريف اللغة

باستخدام تعريف اللغة، يمكنك الكشف عن لغة سلسلة الدردشة المرسلة من قبل المشغل.

ترجمة الكلام

ليس من غير المألوف أن يتحدث اللاعبون في نفس جلسة اللعبة لغات مختلفة في الأصل وقد يقدرون تلقي كل من الرسالة الأصلية وترجمتها. يمكنك استخدام ترجمة الكلام لترجمة النص بين اللغات حتى يتمكن اللاعبون في جميع أنحاء العالم من التواصل مع بعضهم البعض بلغتهم الأصلية.

على سبيل المثال، راجع التشغيل السريع لترجمة الكلام.

ملاحظة

بالإضافة إلى خدمة Speech، يمكنك أيضا استخدام خدمة Translator. لتنفيذ الترجمة النصية بين اللغات المصدر والهدف المدعومة في الوقت الحقيقي، راجع ترجمة النص.

الخطوات التالية