Suara khusus ringan

2025-06-02

Suara kustom lite adalah jenis proyek di mana Anda dapat mendemonstrasikan dan mengevaluasi suara kustom sebelum berinvestasi dalam rekaman profesional untuk mendapatkan suara yang berkualitas lebih tinggi. Tidak ada aplikasi yang diperlukan untuk tujuan demo dan evaluasi. Namun, Microsoft membatasi dan memilih sampel perekaman dan pengujian untuk digunakan dengan versi ringan suara khusus. Anda harus memohon akses penuh untuk penyetelan suara profesional agar dapat menyebarkan dan menggunakan model suara kustom ringan untuk tujuan bisnis. Dalam hal ini, minta akses pada formulir asupan.

Catatan

Suara kustom lite hanya tersedia di Speech Studio. Ini tidak tersedia melalui portal Azure AI Foundry, REST API, atau SDK.

Dengan proyek suara kustom lite, Anda merekam suara Anda secara online dengan membaca 20-50 skrip yang sudah ditentukan yang disediakan oleh Microsoft. Setelah Anda merekam setidaknya 20 sampel, Anda dapat mulai melatih model. Setelah model berhasil dilatih, Anda dapat meninjau model dan memeriksa 20 sampel output yang dihasilkan dengan set skrip yang telah ditentukan sebelumnya.

Lihat bahasa yang didukung untuk suara kustom.

Membandingkan jenis proyek

Tabel berikut meringkas perbedaan utama antara suara kustom lite dan penyempurnaan suara profesional.

Item	Lite	Profesional
Skenario target	Demonstrasi atau evaluasi	Skenario profesional seperti suara merek dan karakter untuk bot obrolan, atau pembacaan konten audio.
Data pelatihan	Rekam secara online menggunakan Speech Studio	Bawa data Anda. Perekaman di studio profesional disarankan.
Skrip untuk perekaman	Disediakan di Speech Studio	Gunakan skrip Anda sendiri yang sesuai dengan skenario kasus penggunaan. Microsoft menyediakan skrip contoh untuk referensi.
Ukuran data yang diperlukan	20-50 ucapan	300-2000 ucapan
Waktu Pelatihan	Kurang dari satu jam komputasi	Sekitar 20-40 jam komputasi
Kualitas suara	Kualitas sedang	Kualitas tinggi
Ketersediaan	Siapa pun dapat merekam sampel secara online dan melatih model untuk tujuan demo dan evaluasi. Akses penuh ke suara kustom diperlukan jika Anda ingin menggunakan model suara kustom versi ringan untuk bisnis.	Unggahan data tidak dibatasi, tetapi Anda hanya dapat menyempurnakan suara profesional setelah akses disetujui. Penyempurnaan suara profesional terbatas berdasarkan kriteria kelayakan dan penggunaan. Minta akses pada formulir intake.
Harga	Harga per unit berlaku sama untuk suara lite kustom dan penyempurnaan suara profesional. Periksa detail harganya di sini.	Harga per unit berlaku sama untuk Custom Voice Lite dan Pemolesan Suara Profesional. Periksa detail harganya di sini.

Membuat proyek suara kustom ringan

Untuk membuat proyek lite suara kustom, ikuti langkah-langkah berikut:

Masuk ke Speech Studio.
Pilih langganan dan sumber Ucapan untuk digunakan.
Pilih Suara>kustom Buat proyek.
Pilih Suara neural kustom bohong>Berikutnya. Sebagai gantinya, untuk membuat proyek suara profesional kustom, lihat dokumentasi penyempurnaan suara profesional.
Ikuti instruksi yang diberikan oleh wizard untuk membuat proyek Anda.

Penting

Proyek suara kustom lite kedaluwarsa setelah 90 hari kecuali pernyataan verbal yang direkam oleh pengisi suara dikirimkan.
Pilih proyek baru berdasarkan nama atau pilih Buka proyek. Anda melihat item menu ini di panel kiri: Rekam dan bangun, Tinjau model, dan Sebarkan model.

Rekam dan bangun model suara kustom lite

Rekam setidaknya 20 sampel suara (hingga 50) dengan skrip yang disediakan secara online. Sampel suara yang direkam di sini digunakan untuk membuat versi sintetis suara Anda.

Catatan

Pelatihan suara kustom saat ini hanya tersedia di beberapa wilayah. Lihat catatan kaki di tabel wilayah untuk informasi selengkapnya.

Berikut adalah beberapa tips untuk membantu Anda merekam sampel suara Anda:

Gunakan mikrofon yang baik. Tingkatkan kejelasan sampel Anda dengan menggunakan mikrofon berkualitas tinggi. Bicaralah sekitar 8 inci jauhnya dari mikrofon untuk menghindari suara mulut.
Hindari kebisingan latar belakang. Rekam di ruangan yang tenang tanpa kebisingan latar belakang atau gema.
Santai dan bicaralah secara alami. Izinkan diri Anda untuk mengekspresikan emosi saat Anda membaca kalimat.
Rekor dalam sekali ambil. Untuk menjaga tingkat energi yang konsisten, rekam semua kalimat dalam satu sesi.
Ucapkan setiap kata dengan benar, dan ucapkan dengan jelas.

Untuk merekam dan membangun model lite suara kustom, ikuti langkah-langkah berikut di Speech Studio:

Pilih Suara> kustom Nama >proyek Anda Rekam dan bangun.
Pilih Mulai.
Baca ketentuan penggunaan talenta Voice dengan hati-hati. Pilih kotak centang untuk mengakui ketentuan penggunaan.
Pilih Terima
Tekan ikon mikrofon untuk memulai pemeriksaan kebisingan. Pemeriksaan kebisingan ini hanya membutuhkan waktu beberapa detik, dan Anda tidak perlu berbicara selama itu.
Jika kebisingan terdeteksi, Anda dapat memilih Periksa lagi untuk mengulangi pemeriksaan kebisingan. Jika tidak ada kebisingan yang terdeteksi, Anda dapat memilih Selesai untuk melanjutkan ke langkah berikutnya.
Tinjau tips perekaman dan pilih Dapatkan. Untuk hasil terbaik, buka area tenang tanpa kebisingan latar belakang sebelum merekam sampel suara Anda.
Tekan ikon mikrofon untuk mulai merekam.
Tekan ikon berhenti untuk menghentikan perekaman.
Tinjau metrik kualitas. Setelah merekam setiap sampel, periksa metrik kualitasnya sebelum melanjutkan ke sampel berikutnya.
Rekam lebih banyak sampel. Meskipun Anda dapat membuat model hanya dengan 20 sampel, disarankan agar Anda merekam hingga 50 untuk mendapatkan kualitas yang lebih baik.
Pilih Latih model untuk memulai proses pelatihan.

Proses pelatihan membutuhkan waktu sekitar satu jam komputasi. Anda dapat memeriksa kemajuan proses pelatihan di halaman Tinjau model .

Meninjau model

Untuk meninjau model suara kustom yang lebih ringan dan mendengar suara sintetis Anda sendiri, ikuti langkah-langkah berikut:

Pilih Suara> kustom Nama >proyek Anda Tinjau model. Di sini Anda dapat meninjau nama model suara, bahasa model, ukuran data sampel, dan kemajuan pelatihan. Nama suara terdiri dari kata "Neural" ditambahkan ke nama proyek Anda.
Pilih nama model suara untuk meninjau detail model dan mendengarkan teks sampel ke hasil ucapan.
Pilih ikon putar untuk mendengar suara Anda mengucapkan setiap skrip.

Kirim pernyataan verbal

Pernyataan verbal yang direkam oleh bakat suara diperlukan sebelum Anda dapat menyebarkan model untuk penggunaan bisnis Anda.

Untuk mengirimkan pernyataan verbal talenta suara, ikuti langkah-langkah berikut di Speech Studio:

Pilih Suara> kustom Nama>Kelola bakat suara Anda.
Pilih model.
Masukkan nama bakat suara dan nama perusahaan.
Membaca dan merekam pernyataan. Pilih ikon mikrofon untuk mulai merekam. Pilih ikon berhenti untuk menghentikan perekaman.
Pilih Kirim untuk mengirimkan pernyataan.
Periksa status pemrosesan dalam tabel skrip di bagian bawah dasbor. Setelah status Berhasil, Anda dapat menyebarkan model.

Menyebarkan model

Untuk menyebarkan model lite suara kustom dan menggunakannya di aplikasi, Anda harus mendapatkan akses penuh ke suara kustom. Minta akses pada formulir intake. Dalam waktu sekitar 10 hari kerja, Anda menerima email dengan status persetujuan. Pernyataan verbal yang direkam oleh bakat suara juga diperlukan sebelum Anda dapat menyebarkan model untuk penggunaan bisnis Anda.

Untuk menyebarkan model lite suara kustom, ikuti langkah-langkah berikut di Speech Studio:

Pilih kustom Nama>>.
Pilih nama model suara lalu pilih Berikutnya.
Masukkan nama dan deskripsi untuk titik akhir Anda lalu pilih Berikutnya.
Pilih kotak centang untuk menyetujui ketentuan penggunaan lalu pilih Berikutnya.
Pilih Sebarkan untuk menyebarkan model.

Dari sini, Anda dapat menggunakan model suara kustom lite dengan cara yang sama seperti menggunakan model suara profesional. Misalnya, Anda dapat menangguhkan atau melanjutkan titik akhir setelah dibuat, untuk membatasi pengeluaran dan menghemat sumber daya yang tidak digunakan. Anda juga dapat mengakses suara di alat Pembuatan Konten Audio di Speech Studio.

Bagikan melalui