نشر نموذج الصوت الاحترافي الخاص بك كنقطة نهاية

بعد إنشاء نموذج الصوت وتدريبه بنجاح، يمكنك نشره إلى نقطة نهاية صوتية عصبية مخصصة.

إشعار

يمكنك إنشاء ما يصل إلى 50 نقطة نهاية باستخدام مورد الكلام القياسي (S0)، ولكل منها صوت عصبي مخصص خاص بها.

لاستخدام الصوت العصبي المخصص، يجب تحديد اسم نموذج الصوت، واستخدام URI المخصص مباشرة في طلب HTTP، واستخدام نفس مورد الكلام لتمرير مصادقة النص إلى خدمة الكلام.

أضف نقطة نهاية للتوزيع

لإنشاء نقطة النهاية الصوتية عصبية مخصصة:

  1. سجّل الدخول إلـى Speech Studio.

  2. حدد الصوت> المخصص اسم >المشروع نشر نموذج>نشر النموذج.

  3. حدد نموذجًا صوتيًا تريد إقرانه بنقطة النهاية.

  4. أدخل Name وDescription لنقطة النهاية المخصصة.

  5. حدد Endpoint type وفقا للسيناريو الخاص بك. إذا كان المورد الخاص بك في منطقة مدعومة، يكون الإعداد الافتراضي لنوع نقطة النهاية عالي الأداء. وإلا، إذا كان المورد في منطقة غير مدعومة، فإن الخيار الوحيد المتاح هو استئناف سريع.

    • أداء عال: محسن للسيناريوهات مع طلبات تركيب في الوقت الحقيقي ومستوى عال، مثل الذكاء الاصطناعي المحادثة، روبوتات مركز الاتصال. يستغرق نشر نقطة نهاية أو استئنافها حوالي 5 دقائق. للحصول على معلومات حول المناطق التي يتم فيها دعم نوع نقطة النهاية عالية الأداء ، راجع الحواشي السفلية في جدول المناطق .
    • استئناف سريع: محسن لسيناريوهات إنشاء محتوى الصوت مع طلبات تركيب أقل تكرارا. من السهل والسريع نشر نقطة نهاية أو استئنافها في أقل من دقيقة. يتم اعتماد نوع نقطة نهاية السيرة الذاتية السريعة في جميع المناطق التي يتوفر فيها النص إلى كلام.
  6. حدد Deploy لإنشاء نقطة النهاية خاصتك.

بعد توزيع نقطة النهاية، يظهر اسم نقطة النهاية كارتباط. حدد الارتباط لعرض المعلومات الخاصة بنقطة النهاية، مثل مفتاح نقطة النهاية وعنوان URL لنقطة النهاية ونموذج التعليمات البرمجية. عندما تكون حالة التوزيعناجحة، تكون نقطة النهاية جاهزة للاستخدام.

إعدادات التطبيق

تتوفر إعدادات التطبيق التي تستخدمها كمعلمات طلب REST API في علامة التبويب Deploy model في Speech Studio.

Screenshot of custom endpoint app settings in Speech Studio.

  • يعرض مفتاح نقطة النهاية مفتاح مورد الكلام المقترن بنقطة النهاية. استخدم مفتاح نقطة النهاية كقيمة لعنوان الطلب Ocp-Apim-Subscription-Key.
  • يظهر عنوان URL لنقطة النهاية منطقة الخدمة الخاصة بك. استخدم القيمة التي تسبق voice.speech.microsoft.com كمعلمة الطلب لمنطقة الخدمة. على سبيل المثال، استخدم eastus إذا كان عنوان URL لنقطة النهاية https://eastus.voice.speech.microsoft.com/cognitiveservices/v1.
  • يظهرعنوان URL لنقطة النهاية معرف نقطة النهاية. استخدم القيمة الملحقة بالمعلمة ?deploymentId=الخاصة بالاستعلام كقيمة لمعلمة طلب معرف نقطة النهاية.

استخدم صوتك المخصص

نقطة النهاية المخصصة مطابقة وظيفيا لنقطة النهاية القياسية المستخدمة لطلبات النص إلى الكلام.

أحد الاختلافات هو أنه EndpointId يجب تحديد لاستخدام الصوت المخصص عبر Speech SDK. يمكنك البدء بالنص إلى التشغيل السريع للكلام ثم تحديث التعليمات البرمجية باستخدام EndpointId و SpeechSynthesisVoiceName. لمزيد من المعلومات، راجع استخدام نقطة نهاية مخصصة.

لاستخدام صوت مخصص عبر Speech Synthesis Markup Language (SSML)، حدد اسم النموذج كاسم صوتي. يستخدم هذا المثال الصوت YourCustomVoiceName.

<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xml:lang="en-US">
    <voice name="YourCustomVoiceName">
        This is the text that is spoken. 
    </voice>
</speak>

التبديل إلى نموذج صوت جديد في المنتج الخاص بك

بمجرد تحديث النموذج الصوتي الخاص بك إلى أحدث إصدار للمحرك، أو إذا كنت تريد التبديل إلى صوت جديد في منتجك، فأنت بحاجة إلى إعادة توزيع النموذج الصوتي الجديد إلى نقطة نهاية جديدة. إعادة توزيع النموذج صوت جديد على نقطة النهاية الحالية غير مدعومة. بعد التوزيع، بدل نسبة استخدام الشبكة إلى نقطة النهاية التي أنشئت حديثًا. نحن نوصي بنقل نسبة استخدام الشبكة إلى نقطة النهاية الجديدة في بيئة اختبار أولاً للتأكد من أن نسبة استخدام الشبكة تعمل بشكل جيد، ثم نقلها إلى نقطة النهاية الجديدة في بيئة الإنتاج. تحتاج إلى الاحتفاظ بنقطة النهاية القديمة أثناء الانتقال. إذا كانت هناك بعض المشاكل الخاصة بنقطة النهاية الجديدة أثناء الانتقال، يمكنك التبديل مرة أخرى إلى نقطة النهاية القديمة. إذا كانت نسبة استخدام الشبكة تعمل بشكل جيد على نقطة النهاية الجديدة لمدة 24 ساعة تقريبًا (القيمة الموصى بها)، يمكنك مسح نقطة النهاية القديمة.

إشعار

إذا تغير اسم صوتك وكنت تستخدم لغة ترميز تركيب الكلام (SSML)، فتأكد من استخدام اسم الصوت الجديد في SSML.

تعليق نقطة النهاية واستئنافها

يمكنك تعليق نقطة النهاية أو استئنافها، للحد من الإنفاق والحفاظ على الموارد غير المستخدمة. لن تحصل الرسوم منك أثناء تعليق نقطة النهاية. عند استئناف نقطة نهاية، يمكنك الاستمرار في استخدام نفس عنوان URL لنقطة النهاية في التطبيق الخاص بك لتجميع الكلام.

إشعار

سوف تكتمل عملية الإيقاف المؤقت على الفور تقريبًا. تكتمل عملية السيرة الذاتية في نفس مقدار الوقت تقريبًا مثل عملية توزيع جديدة.

يصف القسم كيفية تعليق نقطة النهاية الصوتية العصبية المخصصة أو استئنافها في مدخل Speech Studio.

نقطة النهاية للإيقاف المؤقت

  1. لوقف نقطة النهاية مؤقتًا وإلغاء تنشيطها، حدد Suspend من علامة التبويب Deploy model في Speech Studio.

    Screenshot of the select suspend endpoint option.

  2. في مربع الحوار الذي يظهر، حدد ⁧⁩ Submit⁧⁩. بعد تعليق نقطة النهاية، سوف يعرض Speech Studio إعلام نقطة النهاية المعلقة بنجاح.

استكمال نقطة النهاية

  1. لاستكمال نقطة النهاية وتنشيطها، حدد Resume من علامة التبويب وزع نموذج في Speech Studio.

    Screenshot of the select resume endpoint option.

  2. في مربع الحوار الذي يظهر، حدد ⁧⁩ Submit⁧⁩. بعد إعادة تنشيط نقطة النهاية بنجاح، سوف تتغير الحالة من معلق إلى ناجح.

الخطوات التالية

  • تعرف على المزيد حول الصوت العصبي المخصص في النظرة العامة.
  • تعرف على المزيد حول Speech Studio في النظرة العامة.

بعد إنشاء نموذج الصوت وتدريبه بنجاح، يمكنك نشره إلى نقطة نهاية صوتية عصبية مخصصة.

إشعار

يمكنك إنشاء ما يصل إلى 50 نقطة نهاية باستخدام مورد الكلام القياسي (S0)، ولكل منها صوت عصبي مخصص خاص بها.

أضف نقطة نهاية للتوزيع

لإنشاء نقطة نهاية، استخدم عملية Endpoints_Create لواجهة برمجة التطبيقات الصوتية المخصصة. إنشاء نص الطلب وفقًا للإرشادات التالية:

  • عيّن الخاصية projectId المطلوبة. راجع إنشاء مشروع.
  • عيّن الخاصية modelId المطلوبة. راجع تدريب نموذج صوتي.
  • عيّن الخاصية description المطلوبة. يمكن تغيير الوصف لاحقا.

قم بإجراء طلب HTTP PUT باستخدام URI كما هو موضح في المثال Endpoints_Create التالي.

  • استبدل YourResourceKey بمفتاح مورد الكلام.
  • استبدل YourResourceRegion بمنطقة مورد Speech.
  • استبدل EndpointId بمعرف نقطة نهاية من اختيارك. يجب أن يكون المعرف GUID ويجب أن يكون فريدا داخل مورد Speech. سيتم استخدام المعرف في URI الخاص بالمشروع ولا يمكن تغييره لاحقا.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Endpoint for Jessica voice",
  "projectId": "ProjectId",
  "modelId": "JessicaModelId",
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/endpoints/EndpointId?api-version=2023-12-01-preview"

يجب أن تتلقى نص الاستجابة بالتنسيق التالي:

{
  "id": "9f50c644-2121-40e9-9ea7-544e48bfe3cb",
  "description": "Endpoint for Jessica voice",
  "projectId": "ProjectId",
  "modelId": "JessicaModelId",
  "properties": {
    "kind": "HighPerformance"
  },
  "status": "NotStarted",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

يحتوي عنوان الاستجابة على الخاصية Operation-Location . استخدم URI هذا للحصول على تفاصيل حول عملية Endpoints_Create . فيما يلي مثال على رأس الاستجابة:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/284b7e37-f42d-4054-8fa9-08523c3de345?api-version=2023-12-01-preview
Operation-Id: 284b7e37-f42d-4054-8fa9-08523c3de345

يمكنك استخدام نقطة Operation-Location النهاية في طلبات واجهة برمجة التطبيقات اللاحقة لتعليق نقطة نهاية واستئنافها وحذف نقطة نهاية.

استخدم صوتك المخصص

لاستخدام الصوت العصبي المخصص، يجب تحديد اسم نموذج الصوت، واستخدام URI المخصص مباشرة في طلب HTTP، واستخدام نفس مورد الكلام لتمرير مصادقة النص إلى خدمة الكلام.

نقطة النهاية المخصصة مطابقة وظيفيا لنقطة النهاية القياسية المستخدمة لطلبات النص إلى الكلام.

أحد الاختلافات هو أنه EndpointId يجب تحديد لاستخدام الصوت المخصص عبر Speech SDK. يمكنك البدء بالنص إلى التشغيل السريع للكلام ثم تحديث التعليمات البرمجية باستخدام EndpointId و SpeechSynthesisVoiceName. لمزيد من المعلومات، راجع استخدام نقطة نهاية مخصصة.

لاستخدام صوت مخصص عبر Speech Synthesis Markup Language (SSML)، حدد اسم النموذج كاسم صوتي. يستخدم هذا المثال الصوت YourCustomVoiceName.

<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xml:lang="en-US">
    <voice name="YourCustomVoiceName">
        This is the text that is spoken. 
    </voice>
</speak>

تعليق نقطة نهاية

يمكنك تعليق نقطة النهاية أو استئنافها، للحد من الإنفاق والحفاظ على الموارد غير المستخدمة. لن تحصل الرسوم منك أثناء تعليق نقطة النهاية. عند استئناف نقطة نهاية، يمكنك الاستمرار في استخدام نفس عنوان URL لنقطة النهاية في التطبيق الخاص بك لتجميع الكلام.

لإيقاف نقطة نهاية مؤقتا، استخدم عملية Endpoints_Suspend لواجهة برمجة التطبيقات الصوتية المخصصة.

قم بإجراء طلب HTTP POST باستخدام URI كما هو موضح في المثال Endpoints_Suspend التالي.

  • استبدل YourResourceKey بمفتاح مورد الكلام.
  • استبدل YourResourceRegion بمنطقة مورد Speech.
  • استبدل YourEndpointId بمعرف نقطة النهاية الذي تلقيته عند إنشاء نقطة النهاية.
curl -v -X POST "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/endpoints/YourEndpointId:suspend?api-version=2023-12-01-preview" -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "content-type: application/json" -H "content-length: 0"

يجب أن تتلقى نص الاستجابة بالتنسيق التالي:

{
  "id": "9f50c644-2121-40e9-9ea7-544e48bfe3cb",
  "description": "Endpoint for Jessica voice",
  "projectId": "ProjectId",
  "modelId": "JessicaModelId",
  "properties": {
    "kind": "HighPerformance"
  },
  "status": "Disabling",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

استئناف نقطة نهاية

لإيقاف نقطة نهاية مؤقتا، استخدم عملية Endpoints_Resume لواجهة برمجة التطبيقات الصوتية المخصصة.

قم بإجراء طلب HTTP POST باستخدام URI كما هو موضح في المثال Endpoints_Resume التالي.

  • استبدل YourResourceKey بمفتاح مورد الكلام.
  • استبدل YourResourceRegion بمنطقة مورد Speech.
  • استبدل YourEndpointId بمعرف نقطة النهاية الذي تلقيته عند إنشاء نقطة النهاية.
curl -v -X POST "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/endpoints/YourEndpointId:resume?api-version=2023-12-01-preview" -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "content-type: application/json" -H "content-length: 0"

يجب أن تتلقى نص الاستجابة بالتنسيق التالي:

{
  "id": "9f50c644-2121-40e9-9ea7-544e48bfe3cb",
  "description": "Endpoint for Jessica voice",
  "projectId": "ProjectId",
  "modelId": "JessicaModelId",
  "properties": {
    "kind": "HighPerformance"
  },
  "status": "Running",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

حذف نقطة نهاية

لحذف نقطة نهاية، استخدم عملية Endpoints_Delete لواجهة برمجة التطبيقات الصوتية المخصصة.

قم بإجراء طلب HTTP DELETE باستخدام URI كما هو موضح في مثال Endpoints_Delete التالي.

  • استبدل YourResourceKey بمفتاح مورد الكلام.
  • استبدل YourResourceRegion بمنطقة مورد Speech.
  • استبدل YourEndpointId بمعرف نقطة النهاية الذي تلقيته عند إنشاء نقطة النهاية.
curl -v -X DELETE "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/endpoints/YourEndpointId?api-version=2023-12-01-preview" -H "Ocp-Apim-Subscription-Key: YourResourceKey"

يجب أن تتلقى عنوان استجابة مع رمز الحالة 204.

التبديل إلى نموذج صوت جديد في المنتج الخاص بك

بمجرد تحديث النموذج الصوتي الخاص بك إلى أحدث إصدار للمحرك، أو إذا كنت تريد التبديل إلى صوت جديد في منتجك، فأنت بحاجة إلى إعادة توزيع النموذج الصوتي الجديد إلى نقطة نهاية جديدة. إعادة توزيع النموذج صوت جديد على نقطة النهاية الحالية غير مدعومة. بعد التوزيع، بدل نسبة استخدام الشبكة إلى نقطة النهاية التي أنشئت حديثًا. نحن نوصي بنقل نسبة استخدام الشبكة إلى نقطة النهاية الجديدة في بيئة اختبار أولاً للتأكد من أن نسبة استخدام الشبكة تعمل بشكل جيد، ثم نقلها إلى نقطة النهاية الجديدة في بيئة الإنتاج. تحتاج إلى الاحتفاظ بنقطة النهاية القديمة أثناء الانتقال. إذا كانت هناك بعض المشاكل الخاصة بنقطة النهاية الجديدة أثناء الانتقال، يمكنك التبديل مرة أخرى إلى نقطة النهاية القديمة. إذا كانت نسبة استخدام الشبكة تعمل بشكل جيد على نقطة النهاية الجديدة لمدة 24 ساعة تقريبًا (القيمة الموصى بها)، يمكنك مسح نقطة النهاية القديمة.

إشعار

إذا تغير اسم صوتك وكنت تستخدم لغة ترميز تركيب الكلام (SSML)، فتأكد من استخدام اسم الصوت الجديد في SSML.

الخطوات التالية

  • تعرف على المزيد حول الصوت العصبي المخصص في النظرة العامة.
  • تعرف على المزيد حول Speech Studio في النظرة العامة.