Aracılığıyla paylaş


Kişisel ses için konuşmacı profili kimliği alma

Uygulamanızda kişisel sesi kullanmak için bir konuşmacı profili kimliği almanız gerekir. Konuşmacı profili kimliği, sağlanan metin girişiyle sentezlenmiş ses oluşturmak için kullanılır.

Konuşmacının sözlü onay bildirimine ve bir ses istemine (5 ila 90 saniye arasında temiz bir insan sesi örneği) dayalı bir konuşmacı profili kimliği oluşturursunuz. Kullanıcının ses özellikleri, metin okuma için kullanılan özelliğinde speakerProfileId kodlanır. Daha fazla bilgi için bkz . Uygulamanızda kişisel sesi kullanma.

Not

Kişisel ses kimliği ve konuşmacı profili kimliği aynı değildir. Kişisel ses kimliğini seçebilirsiniz, ancak konuşmacı profili kimliği hizmet tarafından oluşturulur. Kişisel ses kimliği, kişisel sesi yönetmek için kullanılır. Konuşmacı profili kimliği metin okuma için kullanılır.

Ses dosyalarını genel olarak erişilebilen bir URL'den (PersonalVoices_Create) sağlar veya ses dosyalarını (PersonalVoices_Post) karşıya yüklersiniz.

Dosyadan kişisel ses oluşturma

Bu senaryoda ses dosyalarının yerel olarak kullanılabilir olması gerekir.

Kişisel ses oluşturmak ve konuşmacı profili kimliğini almak için özel ses API'sinin PersonalVoices_Post işlemini kullanın. İstek gövdesini aşağıdaki yönergelere göre oluşturun:

  • Gerekli projectId özelliği ayarlayın. Bkz . proje oluşturma.
  • Gerekli consentId özelliği ayarlayın. Bkz . Kullanıcı onayı ekleme.
  • Gerekli audiodata özelliği ayarlayın. Aynı istekte bir veya daha fazla ses dosyası belirtebilirsiniz.

Aşağıdaki PersonalVoices_Post örnekte gösterildiği gibi URI'yi kullanarak bir HTTP POST isteği oluşturun.

  • değerini Konuşma kaynak anahtarınız ile değiştirin YourResourceKey .
  • değerini Konuşma kaynak bölgenizle değiştirin YourResourceRegion .
  • yerine kendi seçtiğiniz bir kişisel ses kimliği girin JessicaPersonalVoiceId . Büyük/küçük harfe duyarlı kimlik, kişisel sesin URI'sinde kullanılır ve daha sonra değiştirilemez.
curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourResourceKey" -F 'projectId="ProjectId"' -F 'consentId="JessicaConsentId"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample001.wav"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample002.wav"' "
https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2023-12-01-preview"

Aşağıdaki biçimde bir yanıt gövdesi almanız gerekir:

{
  "id": "JessicaPersonalVoiceId",
  "speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
  "projectId": "ProjectId",
  "consentId": "JessicaConsentId",
  "status": "NotStarted",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

Metinden speakerProfileId konuşmaya uygulamanızda kişisel sesi tümleştirmek için özelliğini kullanın. Daha fazla bilgi için bkz . Uygulamanızda kişisel sesi kullanma.

Yanıt üst bilgisi özelliğini içerir Operation-Location . PersonalVoices_Post işlemiyle ilgili ayrıntıları almak için bu URI'yi kullanın. Yanıt üst bilgisinin bir örneği aşağıda verilmişti:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2023-12-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f

URL'den kişisel ses oluşturma

Bu senaryoda, ses dosyalarının zaten bir Azure Blob Depolama kapsayıcısında depolanması gerekir.

Kişisel ses oluşturmak ve konuşmacı profili kimliğini almak için özel ses API'sinin PersonalVoices_Create işlemini kullanın. İstek gövdesini aşağıdaki yönergelere göre oluşturun:

  • Gerekli projectId özelliği ayarlayın. Bkz . proje oluşturma.
  • Gerekli consentId özelliği ayarlayın. Bkz . Kullanıcı onayı ekleme.
  • Gerekli audios özelliği ayarlayın. özelliğinde audios aşağıdaki özellikleri ayarlayın:
    • Gerekli containerUrl özelliği, ses dosyalarını içeren Azure Blob Depolama kapsayıcısının URL'sine ayarlayın. Hem okuma hem de liste izinlerine sahip bir kapsayıcı için paylaşılan erişim imzaları (SAS) SAS kullanın.
    • Gerekli extensions özelliği ses dosyalarının uzantılarına ayarlayın.
    • İsteğe bağlı olarak, blob adı için bir ön ek ayarlamak için özelliğini ayarlayın prefix .

Aşağıdaki PersonalVoices_Create örnekte gösterildiği gibi URI'yi kullanarak bir HTTP PUT isteği oluşturun.

  • değerini Konuşma kaynak anahtarınız ile değiştirin YourResourceKey .
  • değerini Konuşma kaynak bölgenizle değiştirin YourResourceRegion .
  • yerine kendi seçtiğiniz bir kişisel ses kimliği girin JessicaPersonalVoiceId . Büyük/küçük harfe duyarlı kimlik, kişisel sesin URI'sinde kullanılır ve daha sonra değiştirilemez.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "projectId": "ProjectId",
  "consentId": "JessicaConsentId",
  "audios": {
    "containerUrl": "https://contoso.blob.core.windows.net/voicecontainer?mySasToken",
    "prefix": "jessica/",
    "extensions": [
      ".wav"
    ]
  }
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2023-12-01-preview"

Aşağıdaki biçimde bir yanıt gövdesi almanız gerekir:

{
  "id": "JessicaPersonalVoiceId",
  "speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
  "projectId": "ProjectId",
  "consentId": "JessicaConsentId",
  "status": "NotStarted",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

Metinden speakerProfileId konuşmaya uygulamanızda kişisel sesi tümleştirmek için özelliğini kullanın. Daha fazla bilgi için bkz . Uygulamanızda kişisel sesi kullanma.

Yanıt üst bilgisi özelliğini içerir Operation-Location . PersonalVoices_Create işlemiyle ilgili ayrıntıları almak için bu URI'yi kullanın. Yanıt üst bilgisinin bir örneği aşağıda verilmişti:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2023-12-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f

Sonraki adımlar