ما هو الصوت الشخصي لتحويل النص إلى كلام؟

باستخدام الصوت الشخصي، يمكنك الحصول على النسخ المتماثل الذكاء الاصطناعي الذي تم إنشاؤه لصوتك (أو مستخدمي التطبيق الخاص بك) في ثوان قليلة. يمكنك توفير عينة كلام مدتها دقيقة واحدة كمطالبة صوتية، ثم استخدامها لإنشاء الكلام في أي من أكثر من 90 لغة مدعومة عبر أكثر من 100 لغة.

إشعار

يتوفر الصوت الشخصي في هذه المناطق: غرب أوروبا وشرق الولايات المتحدة وجنوب شرق آسيا. للحصول على اللغات المدعومة، راجع دعم لغة الصوت الشخصية.

يلخص الجدول التالي الفرق بين الصوت الشخصي والصوت العصبي المخصص الاحترافي.

المقارنة صوت شخصي صوت احترافي
السيناريوهات المستهدفة عملاء الأعمال لإنشاء تطبيق للسماح لمستخدميهم بإنشاء واستخدام صوتهم الشخصي في التطبيق. سيناريوهات احترافية مثل أصوات العلامة التجارية والشخصية لروبوتات الدردشة أو قراءة محتوى الصوت.
حالات الاستخدام يقتصر على حالات الاستخدام المحدودة. راجع ملاحظة الشفافية. يجب أن يكون لدى العملاء المعتمدين خطة لدعم أكثر من 1000 صوت شخصي. يقتصر على حالات الاستخدام المحدودة. راجع ملاحظة الشفافية.
بيانات التدريب تأكد من اتباع قواعد السلوك. أحضر بياناتك الخاصة. يوصى بالتسجيل في استوديو احترافي.
حجم البيانات المطلوب دقيقة واحدة من الكلام البشري. 300-2000 الكلمات (حوالي 30 دقيقة إلى 3 ساعات من الكلام البشري).
وقت التدريب أقل من 5 ثوان ما يقرب من 20-40 ساعة حساب.
جودة الصوت الطبيعة طبيعي للغاية
الدعم متعدد اللغات نعم. يمكن للصوت التحدث عن 100 لغة، مع تمكين الكشف التلقائي عن اللغة. نعم. تحتاج إلى تحديد ميزة "العصبية – اللغات التبادلية" لتدريب نموذج يتحدث لغة مختلفة عن بيانات التدريب.
التوافر يتوفر العرض التوضيحي على Speech Studio عند التسجيل. يقتصر الوصول إلى واجهة برمجة التطبيقات على العملاء المؤهلين وحالات الاستخدام المعتمدة. طلب الوصول من خلال نموذج الاستيعاب. يمكنك تدريب نموذج CNV Pro ونشره فقط بعد الموافقة على الوصول. الوصول إلى CNV Pro محدود بناءً على معايير الأهلية والاستخدام. طلب الوصول من خلال نموذج الاستيعاب.
التسعير تحقق من تفاصيل التسعير هنا1. تحقق من تفاصيل الأسعار هنا.
متطلبات الذكاء الاصطناعي المسؤولة البيان اللفظي للمتحدث مطلوب. لا يسمح بحالة استخدام غير معتمدة. البيان اللفظي للمتحدث مطلوب. لا يسمح بحالة استخدام غير معتمدة.

1 لاحظ أن تسعير الصوت الشخصي سيكون مرئيا فقط لمناطق الخدمة التي تتوفر فيها الميزة، بما في ذلك غرب أوروبا وشرق الولايات المتحدة وجنوب شرق آسيا.

تجربة العرض التوضيحي

إذا كان لديك مورد S0، يمكنك الوصول إلى العرض التوضيحي الصوتي الشخصي في Speech Studio. لاستخدام واجهة برمجة التطبيقات الصوتية الشخصية، يمكنك التقدم بطلب للوصول هنا.

  1. انتقل إلى Speech Studio

  2. حدد بطاقة الصوت الشخصية.

  3. يمكنك تسجيل صوتك وتجربة عينات إخراج الصوت بلغات مختلفة. يتضمن العرض التوضيحي مجموعة فرعية من اللغات التي يدعمها الصوت الشخصي.

    لقطة شاشة لتجربة العرض التوضيحي الصوتي الشخصي في Speech Studio.

كيفية إنشاء صوت شخصي

للبدء، إليك ملخصا لخطوات إنشاء صوت شخصي:

  1. إنشاء مشروع .
  2. تحميل ملف الموافقة. باستخدام ميزة الصوت الشخصية، يلزم إنشاء كل صوت بموافقة صريحة من المستخدم. مطلوب بيان مسجل من المستخدم يعترف بأن العميل (مالك مورد الكلام الذكاء الاصطناعي Azure) سيقوم بإنشاء صوته واستخدامه.
  3. احصل على معرف ملف تعريف المتحدث للصوت الشخصي. يمكنك الحصول على معرف ملف تعريف المتحدث استنادا إلى بيان الموافقة اللفظية للمتحدث ومطالبة صوتية. يتم ترميز خصائص صوت المستخدم في الخاصية speakerProfileId المستخدمة لتحويل النص إلى كلام.

بمجرد أن يكون لديك صوت شخصي، يمكنك استخدامه لتجميع الكلام بأي من 91 لغة مدعومة عبر أكثر من 100 لغة. علامة اللغة غير مطلوبة. يستخدم الصوت الشخصي الكشف التلقائي عن اللغة على مستوى الجملة. لمزيد من المعلومات، راجع استخدام الصوت الشخصي في تطبيقك.

تلميح

تحقق من نماذج التعليمات البرمجية في مستودع Speech SDK على GitHub لمعرفة كيفية استخدام الصوت الشخصي في التطبيق الخاص بك.

الوثائق المرجعية

الذكاء الاصطناعي المسؤول

نحن نهتم بالأشخاص الذين يستخدمون الذكاء الاصطناعي والأشخاص الذين سيتأثرون بها بقدر ما نهتم بالتكنولوجيا. لمزيد من المعلومات، راجع ملاحظات الشفافية الذكاء الاصطناعي المسؤولة.

الخطوات التالية