Apa itu suara pribadi untuk teks ke ucapan?

Artikel
09/20/2024

Dengan suara pribadi, Anda dapat memungkinkan pengguna untuk mendapatkan replikasi suara mereka sendiri yang dihasilkan AI dalam beberapa detik. Dengan pernyataan verbal dan sampel ucapan singkat sebagai perintah audio, Anda dapat membuat suara pribadi untuk pengguna Anda dan memungkinkan mereka menghasilkan ucapan dalam salah satu dari lebih dari 90 bahasa yang didukung di lebih dari 100 lokal.

Catatan

Suara pribadi tersedia di wilayah ini: Eropa Barat, AS Timur, dan Asia Tenggara. Untuk lokal yang didukung, lihat dukungan bahasa suara pribadi.

Tabel berikut ini meringkas perbedaan antara suara pribadi dan suara neural kustom profesional.

Perbandingan	Suara pribadi	Suara profesional
Skenario target	Pelanggan bisnis membuat aplikasi untuk memungkinkan pengguna mereka membuat dan menggunakan suara pribadi mereka sendiri di aplikasi.	Skenario profesional seperti suara merek dan karakter untuk bot obrolan, atau pembacaan konten audio.
Kasus penggunaan	Dibatasi untuk kasus penggunaan terbatas. Lihat catatan transparansi. Pelanggan yang disetujui harus memiliki rencana untuk mendukung lebih dari 1.000 suara pribadi.	Dibatasi untuk kasus penggunaan terbatas. Lihat catatan transparansi.
Data pelatihan	Pastikan Anda mengikuti kode etik.	Bawa data Anda. Perekaman di studio profesional disarankan.
Ukuran data yang diperlukan	Satu menit pidato manusia.	300-2000 ucapan (sekitar 30 menit hingga 3 jam ucapan manusia).
Waktu Pelatihan	Kurang dari 5 detik	Sekitar 20-40 jam komputasi.
Kualitas suara	Natural	Sangat alami
Dukungan multibahasa	Ya. Suara ini dapat berbicara tentang 100 bahasa, dengan deteksi bahasa otomatis diaktifkan.	Ya. Anda perlu memilih fitur "Neural – lintas bahasa" untuk melatih model yang berbicara bahasa yang berbeda dari data pelatihan.
Ketersediaan	Demo di Speech Studio tersedia saat pendaftaran. Akses ke API dibatasi untuk pelanggan yang memenuhi syarat dan kasus penggunaan yang disetujui. Minta akses melalui formulir asupan.	Anda hanya dapat melatih dan menyebarkan model CNV Pro setelah akses disetujui. Akses CNV Pro dibatasi berdasarkan kriteria kelayakan dan penggunaan. Minta akses melalui formulir asupan.
Harga	Periksa detail harga di sini¹.	Periksa detail harganya di sini.
Persyaratan AI yang bertanggung jawab	Pernyataan verbal pembicara diperlukan. Tidak ada kasus penggunaan yang tidak disetujui yang diizinkan.	Pernyataan verbal pembicara diperlukan. Tidak ada kasus penggunaan yang tidak disetujui yang diizinkan.

¹ Perhatikan bahwa harga suara pribadi hanya akan terlihat untuk wilayah layanan tempat fitur tersedia, termasuk Eropa Barat, US Timur, dan Asia Tenggara.

Mencoba demo

Jika Anda memiliki sumber daya S0, Anda dapat mengakses demo suara pribadi di Speech Studio. Untuk menggunakan API suara pribadi, Anda dapat mengajukan permohonan akses di sini.

Buka Studio Ucapan
Pilih kartu Suara Pribadi.
Anda dapat merekam suara Anda sendiri dan mencoba sampel output suara dalam bahasa yang berbeda. Demo mencakup subset bahasa yang didukung oleh suara pribadi.

Cara membuat suara pribadi

Untuk memulai, berikut adalah ringkasan langkah-langkah untuk membuat suara pribadi:

Buat proyek.
Unggah file persetujuan. Dengan fitur suara pribadi, diperlukan agar setiap suara dibuat dengan persetujuan eksplisit dari pengguna. Pernyataan yang direkam dari pengguna diperlukan untuk mengakui bahwa pelanggan (pemilik sumber daya Azure AI Speech) akan membuat dan menggunakan suara mereka.
Dapatkan ID profil pembicara untuk suara pribadi. Anda mendapatkan ID profil pembicara berdasarkan pernyataan persetujuan verbal pembicara dan perintah audio. Karakteristik suara pengguna dikodekan dalam speakerProfileId properti yang digunakan untuk teks ke ucapan.

Setelah memiliki suara pribadi, Anda dapat menggunakannya untuk mensintesis ucapan dalam salah satu dari 91 bahasa yang didukung di 100+ lokal. Tag lokal tidak diperlukan. Suara pribadi menggunakan deteksi bahasa otomatis pada tingkat kalimat. Untuk informasi selengkapnya, lihat menggunakan suara pribadi di aplikasi Anda.

Tip

Lihat sampel kode di repositori Speech SDK di GitHub untuk melihat cara menggunakan suara pribadi di aplikasi Anda.

Dokumentasi rujukan

Dokumentasi referensi REST API suara kustom

AI yang Bertanggung Jawab

Kami peduli dengan orang-orang yang menggunakan AI dan orang-orang yang akan terpengaruh olehnya sebanyak kami peduli dengan teknologi. Untuk informasi selengkapnya, lihat catatan transparansi AI yang bertanggung jawab.

Langkah berikutnya

Buat proyek.
Pelajari selengkapnya tentang suara neural kustom di gambaran umum.
Pelajari selengkapnya tentang Speech Studio di gambaran umum.

Bagikan melalui