الحصول على معرف ملف تعريف المتحدث للصوت الشخصي

لاستخدام الصوت الشخصي في التطبيق الخاص بك، تحتاج إلى الحصول على معرف ملف تعريف المتحدث. يتم استخدام معرف ملف تعريف المتحدث لإنشاء صوت مركب مع إدخال النص المقدم.

يمكنك إنشاء معرف ملف تعريف المتحدث استنادا إلى بيان الموافقة اللفظية للمتحدث ومطالبة صوتية (عينة صوت بشرية نظيفة بين 5 -90 ثانية). يتم ترميز خصائص صوت المستخدم في الخاصية speakerProfileId المستخدمة لتحويل النص إلى كلام. لمزيد من المعلومات، راجع استخدام الصوت الشخصي في تطبيقك.

إشعار

معرف الصوت الشخصي ومعرف ملف تعريف المتحدث غير متطابقين. يمكنك اختيار معرف الصوت الشخصي، ولكن يتم إنشاء معرف ملف تعريف المتحدث بواسطة الخدمة. يتم استخدام معرف الصوت الشخصي لإدارة الصوت الشخصي. يتم استخدام معرف ملف تعريف المتحدث لتحويل النص إلى كلام.

يمكنك توفير الملفات الصوتية من عنوان URL يمكن الوصول إليه بشكل عام (PersonalVoices_Create) أو تحميل الملفات الصوتية (PersonalVoices_Post).

إنشاء صوت شخصي من ملف

في هذا السيناريو، يجب أن تكون الملفات الصوتية متوفرة محليا.

لإنشاء صوت شخصي والحصول على معرف ملف تعريف المتحدث، استخدم تشغيل PersonalVoices_Post لواجهة برمجة التطبيقات الصوتية المخصصة. إنشاء نص الطلب وفقًا للإرشادات التالية:

  • عيّن الخاصية projectId المطلوبة. راجع إنشاء مشروع.
  • عيّن الخاصية consentId المطلوبة. راجع إضافة موافقة المستخدم.
  • عيّن الخاصية audiodata المطلوبة. يمكنك تحديد ملف صوت واحد أو أكثر في نفس الطلب.

قم بإجراء طلب HTTP POST باستخدام URI كما هو موضح في المثال PersonalVoices_Post التالي.

  • استبدل YourResourceKey بمفتاح مورد الكلام.
  • استبدل YourResourceRegion بمنطقة مورد Speech.
  • استبدل JessicaPersonalVoiceId بمعرف صوتي شخصي من اختيارك. سيتم استخدام المعرف الحساس لحالة الأحرف في URI الخاص بالصوت الشخصي ولا يمكن تغييره لاحقا.
curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourResourceKey" -F 'projectId="ProjectId"' -F 'consentId="JessicaConsentId"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample001.wav"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample002.wav"' "
https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2023-12-01-preview"

يجب أن تتلقى نص الاستجابة بالتنسيق التالي:

{
  "id": "JessicaPersonalVoiceId",
  "speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
  "projectId": "ProjectId",
  "consentId": "JessicaConsentId",
  "status": "NotStarted",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

استخدم الخاصية speakerProfileId لدمج الصوت الشخصي في تطبيق النص إلى الكلام. لمزيد من المعلومات، راجع استخدام الصوت الشخصي في تطبيقك.

يحتوي عنوان الاستجابة على الخاصية Operation-Location . استخدم URI هذا للحصول على تفاصيل حول عملية PersonalVoices_Post . فيما يلي مثال على رأس الاستجابة:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2023-12-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f

إنشاء صوت شخصي من عنوان URL

في هذا السيناريو، يجب تخزين ملفات الصوت بالفعل في حاوية Azure Blob Storage.

لإنشاء صوت شخصي والحصول على معرف ملف تعريف المتحدث، استخدم تشغيل PersonalVoices_Create لواجهة برمجة التطبيقات الصوتية المخصصة. إنشاء نص الطلب وفقًا للإرشادات التالية:

  • عيّن الخاصية projectId المطلوبة. راجع إنشاء مشروع.
  • عيّن الخاصية consentId المطلوبة. راجع إضافة موافقة المستخدم.
  • عيّن الخاصية audios المطلوبة. ضمن الخاصية audios ، قم بتعيين الخصائص التالية:
    • قم بتعيين الخاصية المطلوبة containerUrl إلى عنوان URL لحاوية Azure Blob Storage التي تحتوي على ملفات الصوت. استخدم توقيعات الوصول المشترك (SAS) SAS لحاوية بأذونات القراءة والقائمة.
    • تعيين الخاصية المطلوبة extensions إلى ملحقات الملفات الصوتية.
    • اختياريا، قم بتعيين الخاصية prefix لتعيين بادئة لاسم الكائن الثنائي كبير الحجم.

قم بإجراء طلب HTTP PUT باستخدام URI كما هو موضح في المثال PersonalVoices_Create التالي.

  • استبدل YourResourceKey بمفتاح مورد الكلام.
  • استبدل YourResourceRegion بمنطقة مورد Speech.
  • استبدل JessicaPersonalVoiceId بمعرف صوتي شخصي من اختيارك. سيتم استخدام المعرف الحساس لحالة الأحرف في URI الخاص بالصوت الشخصي ولا يمكن تغييره لاحقا.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "projectId": "ProjectId",
  "consentId": "JessicaConsentId",
  "audios": {
    "containerUrl": "https://contoso.blob.core.windows.net/voicecontainer?mySasToken",
    "prefix": "jessica/",
    "extensions": [
      ".wav"
    ]
  }
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2023-12-01-preview"

يجب أن تتلقى نص الاستجابة بالتنسيق التالي:

{
  "id": "JessicaPersonalVoiceId",
  "speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
  "projectId": "ProjectId",
  "consentId": "JessicaConsentId",
  "status": "NotStarted",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

استخدم الخاصية speakerProfileId لدمج الصوت الشخصي في تطبيق النص إلى الكلام. لمزيد من المعلومات، راجع استخدام الصوت الشخصي في تطبيقك.

يحتوي عنوان الاستجابة على الخاصية Operation-Location . استخدم URI هذا للحصول على تفاصيل حول عملية PersonalVoices_Create . فيما يلي مثال على رأس الاستجابة:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2023-12-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f

الخطوات التالية