Mendapatkan ID profil pembicara untuk suara pribadi
Untuk menggunakan suara pribadi dalam aplikasi, Anda perlu mendapatkan ID profil pembicara. ID profil pembicara digunakan untuk menghasilkan audio yang disintesis dengan input teks yang disediakan.
Anda membuat ID profil pembicara berdasarkan pernyataan persetujuan verbal pembicara dan perintah audio (sampel suara manusia yang bersih antara 5 - 90 detik). Karakteristik suara pengguna dikodekan dalam speakerProfileId
properti yang digunakan untuk teks ke ucapan. Untuk informasi selengkapnya, lihat menggunakan suara pribadi di aplikasi Anda.
Catatan
ID suara pribadi dan ID profil pembicara tidak sama. Anda dapat memilih ID suara pribadi, tetapi ID profil pembicara dihasilkan oleh layanan. ID suara pribadi digunakan untuk mengelola suara pribadi. ID profil pembicara digunakan untuk teks ke ucapan.
Anda menyediakan file audio dari URL yang dapat diakses publik (PersonalVoices_Create) atau mengunggah file audio (PersonalVoices_Post).
Membuat suara pribadi dari file
Dalam skenario ini, file audio harus tersedia secara lokal.
Untuk membuat suara pribadi dan mendapatkan ID profil pembicara, gunakan operasi PersonalVoices_Post API suara kustom. Buat isi permintaan sesuai dengan instruksi berikut:
- Atur properti
projectId
yang diperlukan. Lihat membuat proyek. - Atur properti
consentId
yang diperlukan. Lihat menambahkan persetujuan pengguna. - Atur properti
audiodata
yang diperlukan. Anda dapat menentukan satu atau beberapa file audio dalam permintaan yang sama.
Buat permintaan HTTP POST menggunakan URI seperti yang ditunjukkan dalam contoh PersonalVoices_Post berikut.
- Ganti
YourResourceKey
dengan kunci sumber daya Ucapan Anda. - Ganti
YourResourceRegion
dengan wilayah sumber daya Ucapan Anda. - Ganti
JessicaPersonalVoiceId
dengan ID suara pribadi pilihan Anda. ID peka huruf besar/kecil akan digunakan dalam URI suara pribadi dan tidak dapat diubah nanti.
curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourResourceKey" -F 'projectId="ProjectId"' -F 'consentId="JessicaConsentId"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample001.wav"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample002.wav"' "
https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2023-12-01-preview"
Anda akan menerima isi respons dalam format berikut:
{
"id": "JessicaPersonalVoiceId",
"speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
"projectId": "ProjectId",
"consentId": "JessicaConsentId",
"status": "NotStarted",
"createdDateTime": "2023-04-01T05:30:00.000Z",
"lastActionDateTime": "2023-04-02T10:15:30.000Z"
}
speakerProfileId
Gunakan properti untuk mengintegrasikan suara pribadi dalam aplikasi teks ke ucapan Anda. Untuk informasi selengkapnya, lihat menggunakan suara pribadi di aplikasi Anda.
Header respons berisi Operation-Location
properti . Gunakan URI ini untuk mendapatkan detail tentang operasi PersonalVoices_Post . Berikut adalah contoh header respons:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2023-12-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f
Membuat suara pribadi dari URL
Dalam skenario ini, file audio harus sudah disimpan dalam kontainer Azure Blob Storage.
Untuk membuat suara pribadi dan mendapatkan ID profil pembicara, gunakan operasi PersonalVoices_Create API suara kustom. Buat isi permintaan sesuai dengan instruksi berikut:
- Atur properti
projectId
yang diperlukan. Lihat membuat proyek. - Atur properti
consentId
yang diperlukan. Lihat menambahkan persetujuan pengguna. - Atur properti
audios
yang diperlukan.audios
Di dalam properti , atur properti berikut:- Atur properti yang diperlukan
containerUrl
ke URL kontainer Azure Blob Storage yang berisi file audio. Gunakan SAS tanda tangan akses bersama (SAS) untuk kontainer dengan izin baca dan daftar. - Atur properti yang diperlukan
extensions
ke ekstensi file audio. - Secara opsional, atur
prefix
properti untuk mengatur awalan untuk nama blob.
- Atur properti yang diperlukan
Buat permintaan HTTP PUT menggunakan URI seperti yang ditunjukkan dalam contoh PersonalVoices_Create berikut.
- Ganti
YourResourceKey
dengan kunci sumber daya Ucapan Anda. - Ganti
YourResourceRegion
dengan wilayah sumber daya Ucapan Anda. - Ganti
JessicaPersonalVoiceId
dengan ID suara pribadi pilihan Anda. ID peka huruf besar/kecil akan digunakan dalam URI suara pribadi dan tidak dapat diubah nanti.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"projectId": "ProjectId",
"consentId": "JessicaConsentId",
"audios": {
"containerUrl": "https://contoso.blob.core.windows.net/voicecontainer?mySasToken",
"prefix": "jessica/",
"extensions": [
".wav"
]
}
} ' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2023-12-01-preview"
Anda akan menerima isi respons dalam format berikut:
{
"id": "JessicaPersonalVoiceId",
"speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
"projectId": "ProjectId",
"consentId": "JessicaConsentId",
"status": "NotStarted",
"createdDateTime": "2023-04-01T05:30:00.000Z",
"lastActionDateTime": "2023-04-02T10:15:30.000Z"
}
speakerProfileId
Gunakan properti untuk mengintegrasikan suara pribadi dalam aplikasi teks ke ucapan Anda. Untuk informasi selengkapnya, lihat menggunakan suara pribadi di aplikasi Anda.
Header respons berisi Operation-Location
properti . Gunakan URI ini untuk mendapatkan detail tentang operasi PersonalVoices_Create . Berikut adalah contoh header respons:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2023-12-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f