Kişisel ses için konuşmacı profili kimliği alma
Uygulamanızda kişisel sesi kullanmak için bir konuşmacı profili kimliği almanız gerekir. Konuşmacı profili kimliği, sağlanan metin girişiyle sentezlenmiş ses oluşturmak için kullanılır.
Konuşmacının sözlü onay bildirimine ve bir ses istemine (5 ila 90 saniye arasında temiz bir insan sesi örneği) dayalı bir konuşmacı profili kimliği oluşturursunuz. Kullanıcının ses özellikleri, metin okuma için kullanılan özelliğinde speakerProfileId
kodlanır. Daha fazla bilgi için bkz . Uygulamanızda kişisel sesi kullanma.
Not
Kişisel ses kimliği ve konuşmacı profili kimliği aynı değildir. Kişisel ses kimliğini seçebilirsiniz, ancak konuşmacı profili kimliği hizmet tarafından oluşturulur. Kişisel ses kimliği, kişisel sesi yönetmek için kullanılır. Konuşmacı profili kimliği metin okuma için kullanılır.
Ses dosyalarını genel olarak erişilebilen bir URL'den (PersonalVoices_Create) sağlar veya ses dosyalarını (PersonalVoices_Post) karşıya yüklersiniz.
Dosyadan kişisel ses oluşturma
Bu senaryoda ses dosyalarının yerel olarak kullanılabilir olması gerekir.
Kişisel ses oluşturmak ve konuşmacı profili kimliğini almak için özel ses API'sinin PersonalVoices_Post işlemini kullanın. İstek gövdesini aşağıdaki yönergelere göre oluşturun:
- Gerekli
projectId
özelliği ayarlayın. Bkz . proje oluşturma. - Gerekli
consentId
özelliği ayarlayın. Bkz . Kullanıcı onayı ekleme. - Gerekli
audiodata
özelliği ayarlayın. Aynı istekte bir veya daha fazla ses dosyası belirtebilirsiniz.
Aşağıdaki PersonalVoices_Post örnekte gösterildiği gibi URI'yi kullanarak bir HTTP POST isteği oluşturun.
- değerini Konuşma kaynak anahtarınız ile değiştirin
YourResourceKey
. - değerini Konuşma kaynak bölgenizle değiştirin
YourResourceRegion
. - yerine kendi seçtiğiniz bir kişisel ses kimliği girin
JessicaPersonalVoiceId
. Büyük/küçük harfe duyarlı kimlik, kişisel sesin URI'sinde kullanılır ve daha sonra değiştirilemez.
curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourResourceKey" -F 'projectId="ProjectId"' -F 'consentId="JessicaConsentId"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample001.wav"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample002.wav"' "
https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2024-02-01-preview"
Aşağıdaki biçimde bir yanıt gövdesi almanız gerekir:
{
"id": "JessicaPersonalVoiceId",
"speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
"projectId": "ProjectId",
"consentId": "JessicaConsentId",
"status": "NotStarted",
"createdDateTime": "2023-04-01T05:30:00.000Z",
"lastActionDateTime": "2023-04-02T10:15:30.000Z"
}
Metinden speakerProfileId
konuşmaya uygulamanızda kişisel sesi tümleştirmek için özelliğini kullanın. Daha fazla bilgi için bkz . Uygulamanızda kişisel sesi kullanma.
Yanıt üst bilgisi özelliğini içerir Operation-Location
. PersonalVoices_Post işlemiyle ilgili ayrıntıları almak için bu URI'yi kullanın. Yanıt üst bilgisinin bir örneği aşağıda verilmişti:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2024-02-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f
URL'den kişisel ses oluşturma
Bu senaryoda, ses dosyalarının zaten bir Azure Blob Depolama kapsayıcısında depolanması gerekir.
Kişisel ses oluşturmak ve konuşmacı profili kimliğini almak için özel ses API'sinin PersonalVoices_Create işlemini kullanın. İstek gövdesini aşağıdaki yönergelere göre oluşturun:
- Gerekli
projectId
özelliği ayarlayın. Bkz . proje oluşturma. - Gerekli
consentId
özelliği ayarlayın. Bkz . Kullanıcı onayı ekleme. - Gerekli
audios
özelliği ayarlayın. özelliğindeaudios
aşağıdaki özellikleri ayarlayın:- Gerekli
containerUrl
özelliği, ses dosyalarını içeren Azure Blob Depolama kapsayıcısının URL'sine ayarlayın. Hem okuma hem de liste izinlerine sahip bir kapsayıcı için paylaşılan erişim imzaları (SAS) SAS kullanın. - Gerekli
extensions
özelliği ses dosyalarının uzantılarına ayarlayın. - İsteğe bağlı olarak, blob adı için bir ön ek ayarlamak için özelliğini ayarlayın
prefix
.
- Gerekli
Aşağıdaki PersonalVoices_Create örnekte gösterildiği gibi URI'yi kullanarak bir HTTP PUT isteği oluşturun.
- değerini Konuşma kaynak anahtarınız ile değiştirin
YourResourceKey
. - değerini Konuşma kaynak bölgenizle değiştirin
YourResourceRegion
. - yerine kendi seçtiğiniz bir kişisel ses kimliği girin
JessicaPersonalVoiceId
. Büyük/küçük harfe duyarlı kimlik, kişisel sesin URI'sinde kullanılır ve daha sonra değiştirilemez.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"projectId": "ProjectId",
"consentId": "JessicaConsentId",
"audios": {
"containerUrl": "https://contoso.blob.core.windows.net/voicecontainer?mySasToken",
"prefix": "jessica/",
"extensions": [
".wav"
]
}
} ' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2024-02-01-preview"
Aşağıdaki biçimde bir yanıt gövdesi almanız gerekir:
{
"id": "JessicaPersonalVoiceId",
"speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
"projectId": "ProjectId",
"consentId": "JessicaConsentId",
"status": "NotStarted",
"createdDateTime": "2023-04-01T05:30:00.000Z",
"lastActionDateTime": "2023-04-02T10:15:30.000Z"
}
Metinden speakerProfileId
konuşmaya uygulamanızda kişisel sesi tümleştirmek için özelliğini kullanın. Daha fazla bilgi için bkz . Uygulamanızda kişisel sesi kullanma.
Yanıt üst bilgisi özelliğini içerir Operation-Location
. PersonalVoices_Create işlemiyle ilgili ayrıntıları almak için bu URI'yi kullanın. Yanıt üst bilgisinin bir örneği aşağıda verilmişti:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2024-02-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f