Bagikan melalui


Apa itu suara pribadi untuk teks ke ucapan?

Dengan suara pribadi, Anda dapat memungkinkan pengguna untuk mendapatkan replikasi suara mereka sendiri yang dihasilkan AI dalam beberapa detik. Dengan pernyataan verbal dan sampel ucapan singkat sebagai perintah audio, Anda dapat membuat suara pribadi untuk pengguna Anda dan memungkinkan mereka menghasilkan ucapan dalam salah satu dari lebih dari 90 bahasa yang didukung di lebih dari 100 lokal.

Catatan

Suara pribadi tersedia di wilayah ini: Eropa Barat, AS Timur, dan Asia Tenggara. Untuk lokal yang didukung, lihat dukungan bahasa suara pribadi.

Tabel berikut ini meringkas perbedaan antara suara pribadi dan suara neural kustom profesional.

Perbandingan Suara pribadi Suara profesional
Skenario target Pelanggan bisnis membuat aplikasi untuk memungkinkan pengguna mereka membuat dan menggunakan suara pribadi mereka sendiri di aplikasi. Skenario profesional seperti suara merek dan karakter untuk bot obrolan, atau pembacaan konten audio.
Kasus penggunaan Dibatasi untuk kasus penggunaan terbatas. Lihat catatan transparansi. Pelanggan yang disetujui harus memiliki rencana untuk mendukung lebih dari 1.000 suara pribadi. Dibatasi untuk kasus penggunaan terbatas. Lihat catatan transparansi.
Data pelatihan Pastikan Anda mengikuti kode etik. Bawa data Anda. Perekaman di studio profesional disarankan.
Ukuran data yang diperlukan Satu menit pidato manusia. 300-2000 ucapan (sekitar 30 menit hingga 3 jam ucapan manusia).
Waktu Pelatihan Kurang dari 5 detik Sekitar 20-40 jam komputasi.
Kualitas suara Natural Sangat alami
Dukungan multibahasa Ya. Suara ini dapat berbicara tentang 100 bahasa, dengan deteksi bahasa otomatis diaktifkan. Ya. Anda perlu memilih fitur "Neural – lintas bahasa" untuk melatih model yang berbicara bahasa yang berbeda dari data pelatihan.
Ketersediaan Demo di Speech Studio tersedia saat pendaftaran. Akses ke API dibatasi untuk pelanggan yang memenuhi syarat dan kasus penggunaan yang disetujui. Minta akses melalui formulir asupan. Anda hanya dapat melatih dan menyebarkan model CNV Pro setelah akses disetujui. Akses CNV Pro dibatasi berdasarkan kriteria kelayakan dan penggunaan. Minta akses melalui formulir asupan.
Harga Periksa detail harga di sini1. Periksa detail harganya di sini.
Persyaratan AI yang bertanggung jawab Pernyataan verbal pembicara diperlukan. Tidak ada kasus penggunaan yang tidak disetujui yang diizinkan. Pernyataan verbal pembicara diperlukan. Tidak ada kasus penggunaan yang tidak disetujui yang diizinkan.

1 Perhatikan bahwa harga suara pribadi hanya akan terlihat untuk wilayah layanan tempat fitur tersedia, termasuk Eropa Barat, US Timur, dan Asia Tenggara.

Mencoba demo

Jika Anda memiliki sumber daya S0, Anda dapat mengakses demo suara pribadi di Speech Studio. Untuk menggunakan API suara pribadi, Anda dapat mengajukan permohonan akses di sini.

  1. Buka Studio Ucapan

  2. Pilih kartu Suara Pribadi.

  3. Anda dapat merekam suara Anda sendiri dan mencoba sampel output suara dalam bahasa yang berbeda. Demo mencakup subset bahasa yang didukung oleh suara pribadi.

    Cuplikan layar pengalaman demo suara pribadi di Speech Studio.

Cara membuat suara pribadi

Untuk memulai, berikut adalah ringkasan langkah-langkah untuk membuat suara pribadi:

  1. Buat proyek.
  2. Unggah file persetujuan. Dengan fitur suara pribadi, diperlukan agar setiap suara dibuat dengan persetujuan eksplisit dari pengguna. Pernyataan yang direkam dari pengguna diperlukan untuk mengakui bahwa pelanggan (pemilik sumber daya Azure AI Speech) akan membuat dan menggunakan suara mereka.
  3. Dapatkan ID profil pembicara untuk suara pribadi. Anda mendapatkan ID profil pembicara berdasarkan pernyataan persetujuan verbal pembicara dan perintah audio. Karakteristik suara pengguna dikodekan dalam speakerProfileId properti yang digunakan untuk teks ke ucapan.

Setelah memiliki suara pribadi, Anda dapat menggunakannya untuk mensintesis ucapan dalam salah satu dari 91 bahasa yang didukung di 100+ lokal. Tag lokal tidak diperlukan. Suara pribadi menggunakan deteksi bahasa otomatis pada tingkat kalimat. Untuk informasi selengkapnya, lihat menggunakan suara pribadi di aplikasi Anda.

Tip

Lihat sampel kode di repositori Speech SDK di GitHub untuk melihat cara menggunakan suara pribadi di aplikasi Anda.

Dokumentasi rujukan

AI yang Bertanggung Jawab

Kami peduli dengan orang-orang yang menggunakan AI dan orang-orang yang akan terpengaruh olehnya sebanyak kami peduli dengan teknologi. Untuk informasi selengkapnya, lihat catatan transparansi AI yang bertanggung jawab.

Langkah berikutnya