Sintesis ucapan dengan alat Pembuatan Konten Audio

Anda dapat menggunakan alat Pembuatan Konten Audio di Speech Studio untuk sintesis Teks ke ucapan tanpa menulis kode apa pun. Anda dapat menggunakan audio output apa adanya, atau sebagai titik awal untuk penyesuaian lebih lanjut.

Bangun konten audio yang sangat alami untuk berbagai skenario, seperti buku audio, siaran berita, narasi video, dan bot obrolan. Dengan Pembuatan Konten Audio, Anda dapat menyempurnakan teks ke suara ucapan secara efisien dan merancang pengalaman audio yang disesuaikan.

Alat ini didasarkan pada Speech Synthesis Markup Language (SSML). Ini memungkinkan Anda untuk menyesuaikan atribut output Teks ke ucapan secara real-time atau sintesis batch, seperti karakter suara, gaya suara, kecepatan berbicara, pengucapan, dan prosodi.

  • Pendekatan tanpa kode: Anda dapat menggunakan alat Pembuatan Konten Audio untuk sintesis Teks ke ucapan tanpa menulis kode apa pun. Audio output mungkin menjadi hasil akhir yang Anda inginkan. Misalnya, Anda dapat menggunakan audio output untuk podcast atau narasi video.
  • Ramah pengembang: Anda dapat mendengarkan audio output dan menyesuaikan SSML untuk meningkatkan sintesis ucapan. Kemudian Anda dapat menggunakan Speech SDK atau Speech CLI untuk mengintegrasikan SSML ke dalam aplikasi Anda. Misalnya, Anda dapat menggunakan SSML untuk membangun bot obrolan.

Anda memperoleh akses mudah ke sejumlah besar portofolio bahasa dan suara. Suara-suara ini termasuk suara saraf bawaan state-of-the-art dan suara saraf kustom Anda, jika Anda membuatnya.

Untuk mempelajari lebih lanjut, lihat video tutorial Pembuatan Konten Audio di YouTube.

Mulai

Alat Pembuatan Konten Audio di Speech Studio gratis diakses, tetapi Anda membayar penggunaan layanan Ucapan. Untuk menggunakan alat ini, Anda harus masuk dengan akun Azure dan membuat sumber daya Ucapan. Untuk setiap akun Azure, Anda memiliki kuota ucapan bulanan gratis, yang mencakup 0,5 juta karakter untuk suara neural bawaan (disebut sebagai Neural di halaman harga). Biasanya, jumlah yang dialokasikan bulanan cukup untuk tim konten kecil sekitar 3-5 orang.

Bagian berikutnya membahas cara membuat akun Azure dan mendapatkan sumber daya Ucapan.

Langkah 1: Buat akun Azure

Untuk menggunakan Pembuatan Konten Audio, Anda harus memiliki akun Microsoft dan akun Azure.

Portal Azure adalah tempat terpusat untuk mengelola akun Azure Anda. Anda dapat membuat sumber daya Ucapan, mengelola akses produk, dan memantau semuanya, mulai dari aplikasi web sederhana hingga penyebaran cloud yang kompleks.

Langkah 2: Buat sumber daya Ucapan

Setelah mendaftar untuk akun Azure, Anda perlu membuat sumber daya Ucapan di akun Azure untuk mengakses layanan Azure Cognitive Service untuk Ucapan. Buat sumber daya Ucapan di portal Azure. Untuk informasi selengkapnya, lihat Membuat sumber daya multi-layanan.

Perlu beberapa saat untuk menyebarkan sumber daya Ucapan baru Anda. Setelah penyebaran selesai, Anda dapat mulai menggunakan alat Pembuatan Konten Audio.

Catatan

Jika Anda berencana menggunakan suara saraf, pastikan Anda membuat sumber daya di wilayah yang mendukung suara saraf.

Langkah 3: Masuk ke Pembuatan Konten Audio dengan akun Azure dan sumber daya Ucapan

  1. Setelah Anda memperoleh akun Azure dan sumber daya Ucapan, masuk ke Speech Studio, kemudian pilih Pembuatan Konten Audio.

  2. Pilih langganan Azure dan sumber daya Ucapan yang ingin Anda gunakan, lalu pilih Gunakan sumber daya.

    Jika masuk ke Pembuatan Konten Audio lagi nanti, Anda langsung dihubungkan ke file pekerjaan audio di bagian sumber daya Ucapan saat ini. Anda dapat memeriksa detail dan status langganan Azure di portal Azure.

    Jika Anda tidak memiliki sumber ucapan yang tersedia dan Anda adalah pemilik atau admin langganan Azure, Anda juga dapat membuat sumber daya Ucapan di Speech Studio dengan memilih Buat sumber daya baru.

    Jika memiliki peran pengguna untuk langganan Azure tertentu, Anda mungkin tidak memiliki izin untuk membuat sumber daya Ucapan baru. Untuk mendapatkan akses, hubungi admin Anda.

    Untuk mengubah sumber daya Ucapan Anda kapan saja, harap pilih Pengaturan di bagian atas halaman.

    Untuk beralih direktori, pilih Pengaturan atau buka profil Anda.

Menggunakan alat

Diagram berikut menampilkan proses untuk menyempurnakan output Teks ke ucapan.

Diagram of the sequence of steps for fine-tuning text to speech outputs.

Setiap langkah dalam diagram sebelumnya dijelaskan di sini:

  1. Pilih sumber daya Ucapan yang ingin Anda gunakan.

  2. Buat file penyetelan audio menggunakan teks biasa atau skrip SSML. Ketik atau unggah konten Anda pada Pembuatan Konten Audio.

  3. Pilih suara dan bahasa untuk konten skrip Anda. Pembuatan Konten Audio mencakup semua teks bawaan ke suara ucapan. Anda dapat menggunakan suara neural bawaan atau suara neural kustom.

    Catatan

    Akses terjaga tersedia untuk suara saraf kustom, yang memungkinkan Anda membuat suara definisi tinggi yang mirip dengan ucapan yang terdengar alami. Untuk informasi selengkapnya, lihat Proses pembatasan.

  4. Pilih konten yang ingin Anda lihat pratinjaunya dan klik ikon Putar (ikon segitiga) untuk melihat pratinjau output sintesis default.

    Jika Anda melakukan perubahan pada teks, pilih ikon Hentikan, lalu pilih Putar lagi untuk membuat ulang audio dengan skrip yang diubah.

    Tingkatkan output dengan menyesuaikan pengucapan, jeda, nada, laju, intonasi, gaya suara, dan banyak lagi. Untuk daftar opsi yang lengkap, lihat Bahasa Markup Sintesis Ucapan.

    Untuk informasi selengkapnya tentang menyempurnakan output ucapan, lihat video Cara mengonversi Teks ke ucapan menggunakan suara Microsoft Azure AI.

  5. Simpan dan ekspor audio Anda yang sudah diatur.

    Saat Anda menyimpan trek penyetelan di sistem, Anda dapat terus bekerja dan mengulangi output. Jika Anda puas dengan hasilnya, Anda dapat membuat tugas pembuatan audio dengan fitur ekspor. Anda dapat mengamati status tugas ekspor dan mengunduh output untuk digunakan dengan aplikasi dan produk Anda.

Membuat file penyetelan audio

Anda dapat memasukkan konten Anda ke alat Pembuatan Konten Audio dengan salah satu dari dua cara:

  • Opsi 1

    1. Pilih Teks file>Baru untuk membuat file penyetelan audio yang baru.

    2. Ketik atau tempelkan konten Anda pada jendela pengeditan. Jumlah karakter yang diizinkan untuk setiap file adalah 20.000 atau kurang. Jika skrip Anda berisi lebih dari 20.000 karakter, Anda dapat menggunakan Opsi 2 untuk otomatis membagi konten Anda menjadi beberapa file.

    3. Pilih Simpan.

  • Opsi 2

    1. Pilih Unggah>File teks untuk mengimpor satu atau lebih file teks. Baik teks biasa maupun SSML didukung.

      Jika file skrip Anda lebih dari 20.000 karakter, pisahkan konten berdasarkan paragraf, karakter, atau regex.

    2. Saat Anda mengunggah file teks, pastikan file tersebut memenuhi persyaratan ini:

      Properti Deskripsi
      Format file Teks biasa (.txt)*
      Teks SSML (.txt)**
      File Zip tidak didukung.
      Format pengodean UTF-8
      Nama file Setiap file harus memiliki nama berbeda. File duplikat tidak didukung.
      Panjang teks Batas karakter adalah 20.000. Jika file Anda melebihi batas tersebut, pisahkan sesuai dengan instruksi di alat ini.
      Pembatasan SSML Setiap file SSML hanya dapat berisi satu bagian dari SSML.

      * Contoh teks biasa:

      Welcome to use Audio Content Creation to customize audio output for your products.
      

      ** Contoh teks SSML:

      <speak xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="http://www.w3.org/2001/mstts" version="1.0" xml:lang="en-US">
          <voice name="en-US-AvaMultilingualNeural">
          Welcome to use Audio Content Creation <break time="10ms" />to customize audio output for your products.
          </voice>
      </speak>
      

Ekspor audio yang disetel

Setelah meninjau output audio dan puas dengan penyetelan dan penyesuaian, Anda dapat mengekspor audio.

  1. Pilih Ekspor untuk membuat tugas pembuatan audio.

    Kami merekomendasikan Ekspor ke pustaka Audio untuk menyimpan, menemukan, dan mencari output audio secara mudah di cloud. Anda bisa berintegrasi dengan lebih baik dengan aplikasi Anda melalui penyimpanan blob Azure. Anda juga dapat mengunduh audio ke disk lokal secara langsung.

  2. Pilih format output untuk audio yang Anda setel. Format audio dan tingkat sampel dicantumkan dalam tabel berikut:

    Format Laju sampel 8 kHz Laju sampel 16 kHz Laju sampel 24 kHz Laju sampel 48 kHz
    wav riff-8khz-16bit-mono-pcm riff-16khz-16bit-mono-pcm riff-24khz-16bit-mono-pcm riff-48khz-16bit-mono-pcm
    mp3 T/A audio-16khz-128kbitrate-mono-mp3 audio-24khz-160kbitrate-mono-mp3 audio-48khz-192kbitrate-mono-mp3
  3. Untuk melihat status tugas, harap pilih tab Ekspor tugas.

    Jika tugas gagal, lihat halaman informasi mendetail untuk laporan lengkap.

  4. Setelah tugas selesai, audio Anda bisa diunduh di panel Pustaka Audio.

  5. Pilih file yang ingin diunduh dan Unduh.

    Sekarang Anda siap untuk menggunakan audio kustom yang disetel di aplikasi atau produk Anda.

Mengonfigurasi BYOS dan akses baca publik anonim untuk blob

Jika Anda kehilangan izin akses ke Bring Your Own Storage (BYOS), Anda tidak dapat melihat, membuat, mengedit, atau menghapus file. Untuk melanjutkan akses, Anda perlu menghapus penyimpanan saat ini dan mengonfigurasi ulang BYOS di portal Azure. Untuk mempelajari selengkapnya tentang cara mengonfigurasi BYOS, lihat Memasang Azure Storage sebagai berbagi lokal di App Service.

Setelah mengonfigurasi izin BYOS, Anda perlu mengonfigurasi akses baca publik anonim untuk kontainer dan blob terkait. Jika tidak, data blob tidak tersedia untuk akses publik dan file leksikon Anda dalam blob tidak dapat diakses. Secara default, pengaturan akses publik kontainer dinonaktifkan. Untuk memberikan pengguna anonim akses baca ke kontainer dan blobnya, pertama-tama atur Izinkan akses publik Blob ke Diaktifkan untuk memungkinkan akses publik untuk akun penyimpanan, lalu atur tingkat akses publik kontainer (bernama acc-public-files) (akses baca anonim hanya untuk blob). Untuk mempelajari selengkapnya tentang cara mengonfigurasi akses baca publik anonim, lihat Mengonfigurasi akses baca publik anonim untuk kontainer dan blob.

Menambahkan atau menghapus pengguna Pembuatan Konten Audio

Jika lebih dari satu pengguna yang ingin menggunakan Pembuatan Konten Audio, Anda dapat memberi pengguna tersebut akses ke langganan Azure dan sumber daya Ucapan. Jika Anda menambahkan pengguna ke langganan Azure, pengguna tersebut dapat mengakses semua sumber daya pada langganan Azure. Tetapi jika Anda menambahkan pengguna ke sumber daya Ucapan saja, mereka hanya memiliki akses ke sumber daya Ucapan dan bukan ke sumber daya lain di bawah langganan Azure ini. Pengguna yang memiliki akses ke sumber daya Ucapan dapat menggunakan alat Pembuatan Konten Audio.

Pengguna yang Anda berikan akses harus menyiapkan akun Microsoft. Jika tidak memiliki akun Microsoft, mereka dapat membuatnya hanya dalam beberapa menit. Mereka dapat menggunakan email lama dan menautkannya ke akun Microsoft, atau mereka dapat membuat dan menggunakan alamat email Outlook sebagai akun Microsoft.

Menambahkan pengguna ke sumber daya Ucapan

Untuk menambahkan pengguna ke sumber daya Ucapan sehingga mereka dapat menggunakan Pembuatan Konten Audio, lakukan hal berikut:

  1. Di portal Azure, pilih Semua layanan.
  2. Lalu pilih layanan Azure AI, dan navigasikan ke sumber daya Ucapan spesifik Anda.

    Catatan

    Anda juga dapat menyiapkan Azure RBAC untuk seluruh grup sumber daya, langganan, atau grup manajemen. Lakukan ini dengan memilih tingkat cakupan yang diinginkan lalu menavigasi ke item yang diinginkan (misalnya, memilih Grup sumber daya, lalu mengeklik ke grup sumber daya yang Anda inginkan).

  3. Pilih Kontrol akses (IAM) di panel navigasi kiri.
  4. Pilih Tambahkan ->Tambahkan penetapan peran.
  5. Di tab Peran pada layar berikutnya, pilih peran yang ingin Anda tambahkan (dalam kasus ini, Pemilik).
  6. Pada tab Anggota, masukkan alamat email pengguna dan pilih nama pengguna di direktori. Alamat email harus ditautkan ke akun Microsoft yang dipercaya oleh ID Microsoft Entra. Pengguna dapat dengan mudah mendaftarkan akun Microsoft dengan menggunakan alamat email pribadinya.
  7. Di tab Tinjau + tetapkan, pilih Tinjau + tetapkan untuk menetapkan peran.

Berikut adalah apa yang terjadi selanjutnya:

Undangan email otomatis dikirimkan kepada pengguna. Mereka dapat menerimanya dengan memilih Terima undangan>Terima untuk bergabung ke Azure di emailnya. Lalu, mereka diarahkan ke portal Azure. Pengguna tidak perlu mengambil tindakan lebih lanjut di portal Azure. Setelah beberapa saat, pengguna diberi peran di cakupan sumber daya Ucapan, yang memberi mereka akses ke sumber daya Ucapan ini. Jika pengguna tidak menerima email undangan, Anda dapat mencari akun mereka di Penetapan peran dan masuk ke profil mereka. Cari Identitas>Undangan yang diterima, lalu pilih (kelola) untuk mengirim kembali undangan email. Anda juga dapat menyalin dan mengirimkan tautan undangan kepada mereka.

Pengguna kini membuka atau me-refresh halaman produk Pembuatan Konten Audio, dan masuk dengan akun Microsoft. Mereka memilih blok Pembuatan Konten Audio di antara semua produk ucapan. Mereka memilih sumber daya Ucapan di jendela pop-up atau di pengaturan di pojok kanan atas.

Jika tidak dapat menemukan sumber daya Ucapan yang tersedia, mereka dapat memeriksa untuk memastikan bahwa mereka berada di direktori yang tepat. Untuk melakukannya, mereka memilih profil akun di pojok kanan atas, lalu memilih Beralih di sebelah Direktori saat ini. Jika ada lebih dari satu direktori yang tersedia, artinya Anda memiliki akses ke beberapa direktori. Mereka dapat beralih ke berbagai direktori dan membuka Pengaturan untuk mengetahui apakah sumber daya Ucapan yang tepat tersedia.

Pengguna yang berada dalam sumber daya Ucapan yang sama melihat pekerjaan satu sama lain di alat Pembuatan Konten Audio. Jika Anda ingin setiap pengguna individu memiliki tempat kerja yang unik dan pribadi dalam Pembuatan Konten Audio, buat sumber daya Ucapan baru untuk setiap pengguna dan berikan setiap pengguna akses unik ke sumber pidato.

Menghapus pengguna dari sumber daya Ucapan

  1. Cari layanan Azure AI di portal Azure, pilih sumber daya Ucapan yang ingin Anda hapus penggunanya.

  2. Pilih Kontrol akses (IAM), lalu pilih tab Penetapan peran untuk melihat semua penetapan peran untuk sumber daya Ucapan ini.

  3. Pilih pengguna yang ingin Anda hapus, pilih Hapus, lalu pilih OK.

    Screenshot of the 'Remove' button on the 'Remove role assignments' pane.

Memungkinkan pengguna memberikan akses kepada pengguna lain

Jika ingin mengizinkan pengguna memberikan akses kepada pengguna lain, Anda perlu menetapkan mereka ke peran pemilik untuk sumber daya Ucapan dan mengatur pengguna tersebut sebagai pembaca direktori Azure.

  1. Tambahkan pengguna tersebut sebagai pemilik sumber daya Ucapan. Untuk informasi selengkapnya, lihat Menambahkan pengguna ke sumber daya Ucapan.

    Screenshot showing the 'Owner' role on the 'Add role assignment' pane.

  2. Di portal Azure, pilih menu yang diciutkan di kiri atas, pilih ID Microsoft Entra, lalu pilih Pengguna.

  3. Cari akun Microsoft pengguna, buka halaman detailnya, lalu pilih Peran yang ditetapkan.

  4. Pilih Tambahkan penetapan>Pembaca Direktori. Jika tombol Tambahkan penetapan tidak tersedia, artinya Anda tidak memiliki akses. Hanya administrator global direktori ini yang dapat menambahkan penetapan kepada pengguna.

Langkah berikutnya