Bagikan melalui


Mendapatkan ID profil pembicara untuk suara pribadi

Untuk menggunakan suara pribadi dalam aplikasi, Anda perlu mendapatkan ID profil pembicara. ID profil pembicara digunakan untuk menghasilkan audio yang disintesis dengan input teks yang disediakan.

Anda membuat ID profil pembicara berdasarkan pernyataan persetujuan verbal pembicara dan perintah audio (sampel suara manusia yang bersih antara 5 - 90 detik). Karakteristik suara pengguna dikodekan dalam speakerProfileId properti yang digunakan untuk teks ke ucapan. Untuk informasi selengkapnya, lihat menggunakan suara pribadi di aplikasi Anda.

Catatan

ID suara pribadi dan ID profil pembicara tidak sama. Anda dapat memilih ID suara pribadi, tetapi ID profil pembicara dihasilkan oleh layanan. ID suara pribadi digunakan untuk mengelola suara pribadi. ID profil pembicara digunakan untuk teks ke ucapan.

Anda menyediakan file audio dari URL yang dapat diakses publik (PersonalVoices_Create) atau mengunggah file audio (PersonalVoices_Post).

Membuat suara pribadi dari file

Dalam skenario ini, file audio harus tersedia secara lokal.

Untuk membuat suara pribadi dan mendapatkan ID profil pembicara, gunakan operasi PersonalVoices_Post API suara kustom. Buat isi permintaan sesuai dengan instruksi berikut:

  • Atur properti projectId yang diperlukan. Lihat membuat proyek.
  • Atur properti consentId yang diperlukan. Lihat menambahkan persetujuan pengguna.
  • Atur properti audiodata yang diperlukan. Anda dapat menentukan satu atau beberapa file audio dalam permintaan yang sama.

Buat permintaan HTTP POST menggunakan URI seperti yang ditunjukkan dalam contoh PersonalVoices_Post berikut.

  • Ganti YourResourceKey dengan kunci sumber daya Ucapan Anda.
  • Ganti YourResourceRegion dengan wilayah sumber daya Ucapan Anda.
  • Ganti JessicaPersonalVoiceId dengan ID suara pribadi pilihan Anda. ID peka huruf besar/kecil akan digunakan dalam URI suara pribadi dan tidak dapat diubah nanti.
curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourResourceKey" -F 'projectId="ProjectId"' -F 'consentId="JessicaConsentId"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample001.wav"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample002.wav"' "
https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2023-12-01-preview"

Anda akan menerima isi respons dalam format berikut:

{
  "id": "JessicaPersonalVoiceId",
  "speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
  "projectId": "ProjectId",
  "consentId": "JessicaConsentId",
  "status": "NotStarted",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

speakerProfileId Gunakan properti untuk mengintegrasikan suara pribadi dalam aplikasi teks ke ucapan Anda. Untuk informasi selengkapnya, lihat menggunakan suara pribadi di aplikasi Anda.

Header respons berisi Operation-Location properti . Gunakan URI ini untuk mendapatkan detail tentang operasi PersonalVoices_Post . Berikut adalah contoh header respons:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2023-12-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f

Membuat suara pribadi dari URL

Dalam skenario ini, file audio harus sudah disimpan dalam kontainer Azure Blob Storage.

Untuk membuat suara pribadi dan mendapatkan ID profil pembicara, gunakan operasi PersonalVoices_Create API suara kustom. Buat isi permintaan sesuai dengan instruksi berikut:

  • Atur properti projectId yang diperlukan. Lihat membuat proyek.
  • Atur properti consentId yang diperlukan. Lihat menambahkan persetujuan pengguna.
  • Atur properti audios yang diperlukan. audios Di dalam properti , atur properti berikut:
    • Atur properti yang diperlukan containerUrl ke URL kontainer Azure Blob Storage yang berisi file audio. Gunakan SAS tanda tangan akses bersama (SAS) untuk kontainer dengan izin baca dan daftar.
    • Atur properti yang diperlukan extensions ke ekstensi file audio.
    • Secara opsional, atur prefix properti untuk mengatur awalan untuk nama blob.

Buat permintaan HTTP PUT menggunakan URI seperti yang ditunjukkan dalam contoh PersonalVoices_Create berikut.

  • Ganti YourResourceKey dengan kunci sumber daya Ucapan Anda.
  • Ganti YourResourceRegion dengan wilayah sumber daya Ucapan Anda.
  • Ganti JessicaPersonalVoiceId dengan ID suara pribadi pilihan Anda. ID peka huruf besar/kecil akan digunakan dalam URI suara pribadi dan tidak dapat diubah nanti.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "projectId": "ProjectId",
  "consentId": "JessicaConsentId",
  "audios": {
    "containerUrl": "https://contoso.blob.core.windows.net/voicecontainer?mySasToken",
    "prefix": "jessica/",
    "extensions": [
      ".wav"
    ]
  }
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2023-12-01-preview"

Anda akan menerima isi respons dalam format berikut:

{
  "id": "JessicaPersonalVoiceId",
  "speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
  "projectId": "ProjectId",
  "consentId": "JessicaConsentId",
  "status": "NotStarted",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

speakerProfileId Gunakan properti untuk mengintegrasikan suara pribadi dalam aplikasi teks ke ucapan Anda. Untuk informasi selengkapnya, lihat menggunakan suara pribadi di aplikasi Anda.

Header respons berisi Operation-Location properti . Gunakan URI ini untuk mendapatkan detail tentang operasi PersonalVoices_Create . Berikut adalah contoh header respons:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2023-12-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f

Langkah berikutnya