الحصول على معرف ملف تعريف المتحدث للصوت الشخصي
لاستخدام الصوت الشخصي في التطبيق الخاص بك، تحتاج إلى الحصول على معرف ملف تعريف المتحدث. يتم استخدام معرف ملف تعريف المتحدث لإنشاء صوت مركب مع إدخال النص المقدم.
يمكنك إنشاء معرف ملف تعريف المتحدث استنادا إلى بيان الموافقة اللفظية للمتحدث ومطالبة صوتية (عينة صوت بشرية نظيفة بين 5 -90 ثانية). يتم ترميز خصائص صوت المستخدم في الخاصية speakerProfileId
المستخدمة لتحويل النص إلى كلام. لمزيد من المعلومات، راجع استخدام الصوت الشخصي في تطبيقك.
إشعار
معرف الصوت الشخصي ومعرف ملف تعريف المتحدث غير متطابقين. يمكنك اختيار معرف الصوت الشخصي، ولكن يتم إنشاء معرف ملف تعريف المتحدث بواسطة الخدمة. يتم استخدام معرف الصوت الشخصي لإدارة الصوت الشخصي. يتم استخدام معرف ملف تعريف المتحدث لتحويل النص إلى كلام.
يمكنك توفير الملفات الصوتية من عنوان URL يمكن الوصول إليه بشكل عام (PersonalVoices_Create) أو تحميل الملفات الصوتية (PersonalVoices_Post).
إنشاء صوت شخصي من ملف
في هذا السيناريو، يجب أن تكون الملفات الصوتية متوفرة محليا.
لإنشاء صوت شخصي والحصول على معرف ملف تعريف المتحدث، استخدم تشغيل PersonalVoices_Post لواجهة برمجة التطبيقات الصوتية المخصصة. إنشاء نص الطلب وفقًا للإرشادات التالية:
- عيّن الخاصية
projectId
المطلوبة. راجع إنشاء مشروع. - عيّن الخاصية
consentId
المطلوبة. راجع إضافة موافقة المستخدم. - عيّن الخاصية
audiodata
المطلوبة. يمكنك تحديد ملف صوت واحد أو أكثر في نفس الطلب.
قم بإجراء طلب HTTP POST باستخدام URI كما هو موضح في المثال PersonalVoices_Post التالي.
- استبدل
YourResourceKey
بمفتاح مورد الكلام. - استبدل
YourResourceRegion
بمنطقة مورد Speech. - استبدل
JessicaPersonalVoiceId
بمعرف صوتي شخصي من اختيارك. سيتم استخدام المعرف الحساس لحالة الأحرف في URI الخاص بالصوت الشخصي ولا يمكن تغييره لاحقا.
curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourResourceKey" -F 'projectId="ProjectId"' -F 'consentId="JessicaConsentId"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample001.wav"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample002.wav"' "
https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2023-12-01-preview"
يجب أن تتلقى نص الاستجابة بالتنسيق التالي:
{
"id": "JessicaPersonalVoiceId",
"speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
"projectId": "ProjectId",
"consentId": "JessicaConsentId",
"status": "NotStarted",
"createdDateTime": "2023-04-01T05:30:00.000Z",
"lastActionDateTime": "2023-04-02T10:15:30.000Z"
}
استخدم الخاصية speakerProfileId
لدمج الصوت الشخصي في تطبيق النص إلى الكلام. لمزيد من المعلومات، راجع استخدام الصوت الشخصي في تطبيقك.
يحتوي عنوان الاستجابة على الخاصية Operation-Location
. استخدم URI هذا للحصول على تفاصيل حول عملية PersonalVoices_Post . فيما يلي مثال على رأس الاستجابة:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2023-12-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f
إنشاء صوت شخصي من عنوان URL
في هذا السيناريو، يجب تخزين ملفات الصوت بالفعل في حاوية Azure Blob Storage.
لإنشاء صوت شخصي والحصول على معرف ملف تعريف المتحدث، استخدم تشغيل PersonalVoices_Create لواجهة برمجة التطبيقات الصوتية المخصصة. إنشاء نص الطلب وفقًا للإرشادات التالية:
- عيّن الخاصية
projectId
المطلوبة. راجع إنشاء مشروع. - عيّن الخاصية
consentId
المطلوبة. راجع إضافة موافقة المستخدم. - عيّن الخاصية
audios
المطلوبة. ضمن الخاصيةaudios
، قم بتعيين الخصائص التالية:- قم بتعيين الخاصية المطلوبة
containerUrl
إلى عنوان URL لحاوية Azure Blob Storage التي تحتوي على ملفات الصوت. استخدم توقيعات الوصول المشترك (SAS) SAS لحاوية بأذونات القراءة والقائمة. - تعيين الخاصية المطلوبة
extensions
إلى ملحقات الملفات الصوتية. - اختياريا، قم بتعيين الخاصية
prefix
لتعيين بادئة لاسم الكائن الثنائي كبير الحجم.
- قم بتعيين الخاصية المطلوبة
قم بإجراء طلب HTTP PUT باستخدام URI كما هو موضح في المثال PersonalVoices_Create التالي.
- استبدل
YourResourceKey
بمفتاح مورد الكلام. - استبدل
YourResourceRegion
بمنطقة مورد Speech. - استبدل
JessicaPersonalVoiceId
بمعرف صوتي شخصي من اختيارك. سيتم استخدام المعرف الحساس لحالة الأحرف في URI الخاص بالصوت الشخصي ولا يمكن تغييره لاحقا.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"projectId": "ProjectId",
"consentId": "JessicaConsentId",
"audios": {
"containerUrl": "https://contoso.blob.core.windows.net/voicecontainer?mySasToken",
"prefix": "jessica/",
"extensions": [
".wav"
]
}
} ' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2023-12-01-preview"
يجب أن تتلقى نص الاستجابة بالتنسيق التالي:
{
"id": "JessicaPersonalVoiceId",
"speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
"projectId": "ProjectId",
"consentId": "JessicaConsentId",
"status": "NotStarted",
"createdDateTime": "2023-04-01T05:30:00.000Z",
"lastActionDateTime": "2023-04-02T10:15:30.000Z"
}
استخدم الخاصية speakerProfileId
لدمج الصوت الشخصي في تطبيق النص إلى الكلام. لمزيد من المعلومات، راجع استخدام الصوت الشخصي في تطبيقك.
يحتوي عنوان الاستجابة على الخاصية Operation-Location
. استخدم URI هذا للحصول على تفاصيل حول عملية PersonalVoices_Create . فيما يلي مثال على رأس الاستجابة:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2023-12-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f
الخطوات التالية
الملاحظات
https://aka.ms/ContentUserFeedback.
قريبًا: خلال عام 2024، سنتخلص تدريجيًا من GitHub Issues بوصفها آلية إرسال ملاحظات للمحتوى ونستبدلها بنظام ملاحظات جديد. لمزيد من المعلومات، راجعإرسال الملاحظات وعرضها المتعلقة بـ