Gambaran umum Speech Synthesis Markup Language (SSML)

Speech Synthesis Markup Language (SSML) adalah bahasa markup berbasis XML yang dapat Anda gunakan untuk menyempurnakan atribut output teks ke ucapan seperti pitch, pengucapan, laju bicara, volume, dan banyak lagi. Ini memberi Anda lebih banyak kontrol dan fleksibilitas daripada input teks biasa.

Tip

Anda dapat mendengar suara dalam gaya dan nada yang berbeda membaca teks contoh dengan menggunakan Galeri Suara.

Menggunakan skenario kasus

SSML dirancang untuk memberi Anda fleksibilitas dalam bagaimana Anda ingin output ucapan Anda terdengar, dan menyediakan properti yang berbeda untuk bagaimana Anda dapat menyesuaikan output tersebut. Anda dapat menggunakan SSML untuk:

  • Tentukan struktur teks input yang menentukan struktur, konten, dan karakteristik lain dari teks Anda ke output ucapan. Misalnya, Anda dapat menggunakan SSML untuk menentukan paragraf, kalimat, jeda atau jeda, atau keheningan. Anda dapat membungkus teks dengan tag peristiwa, seperti bookmark atau viseme, yang dapat diproses aplikasi Anda nanti. Viseme adalah deskripsi visual dari fonem, suara ucapan individu, dalam bahasa lisan.
  • Pilih suara, bahasa, nama, gaya, dan peran. Anda dapat menggunakan beberapa suara dalam satu dokumen SSML. Anda juga dapat menyesuaikan penekanan, tingkat bicara, nada, dan volume. SSML juga dapat menyisipkan audio yang telah direkam sebelumnya, seperti efek suara atau catatan musik.
  • Mengontrol pengucapan audio output. Misalnya, Anda dapat menggunakan SSML dengan fonem dan leksikon kustom untuk meningkatkan pengucapan. Anda juga dapat menggunakan SSML untuk menentukan bagaimana kata atau ekspresi matematika diucapkan.

Cara bekerja dengan SSML

Fungsionalitas SSML tersedia di berbagai alat yang mungkin sesuai dengan kasus penggunaan Anda.

Penting

Anda ditagih untuk setiap karakter yang dikonversi menjadi ucapan, termasuk tanda baca. Meskipun dokumen SSML itu sendiri tidak dapat ditagih, layanan menghitung elemen opsional yang Anda gunakan untuk menyesuaikan bagaimana teks dikonversi ke ucapan, seperti fonem dan nada, sebagai karakter yang dapat ditagih. Untuk informasi selengkapnya, lihat catatan harga.

Anda dapat menggunakan SSML dengan cara berikut:

  • Alat pembuatan konten audio memungkinkan Anda menulis teks biasa dan SSML di Speech Studio. Anda dapat mendengarkan audio output dan menyesuaikan SSML untuk meningkatkan sintesis ucapan. Untuk informasi selengkapnya, lihat Sintesis ucapan dengan alat Pembuatan Konten Audio.
  • API sintesis batch menerima SSML melalui inputs properti .
  • Speech CLI menerima SSML melalui spx synthesize --ssml SSML argumen baris perintah.
  • Speech SDK menerima SSML melalui metode SSML "berbicara" di berbagai bahasa yang didukung.

Langkah berikutnya