Apa itu ucapan kustom?

Dengan ucapan kustom, Anda dapat mengevaluasi dan meningkatkan akurasi pengenalan ucapan untuk aplikasi dan produk Anda. Model ucapan kustom dapat digunakan untuk ucapan real time ke teks, terjemahan ucapan, dan transkripsi batch.

Di luar kotak, pengenalan ucapan menggunakan Model Bahasa Universal sebagai model dasar yang dilatih dengan data milik Microsoft dan mencerminkan bahasa lisan yang umum digunakan. Model dasar telah dilatih sebelumnya dengan dialek dan fonetik yang mewakili berbagai domain umum. Saat Anda membuat permintaan pengenalan ucapan, model dasar terbaru untuk setiap bahasa yang didukung digunakan secara default. Model dasar bekerja dengan baik dalam sebagian besar skenario pengenalan ucapan.

Model kustom dapat digunakan untuk menambah model dasar untuk meningkatkan pengenalan kosakata khusus domain khusus untuk aplikasi dengan menyediakan data teks untuk melatih model. Model ini juga dapat digunakan untuk meningkatkan pengenalan berdasarkan kondisi audio tertentu dari aplikasi dengan menyediakan data audio dengan transkripsi referensi.

Anda juga dapat melatih model dengan teks terstruktur saat data mengikuti pola, untuk menentukan pengucapan kustom, dan untuk menyesuaikan pemformatan teks tampilan dengan normalisasi teks terbalik kustom, penulisan ulang kustom, dan pemfilteran kata-kata kokoh kustom.

Bagaimana cara kerjanya?

Dengan ucapan kustom, Anda dapat mengunggah data Anda sendiri, menguji dan melatih model kustom, membandingkan akurasi antar model, dan menyebarkan model ke titik akhir kustom.

Diagram that highlights the components that make up the custom speech area of the Speech Studio.

Berikut informasi selengkapnya tentang urutan langkah-langkah yang ditunjukkan diagram:

  1. Buat proyek dan pilih model. Gunakan sumber daya Ucapan yang Anda buat di portal Azure. Jika Anda melatih model kustom dengan data audio, pilih wilayah sumber daya Ucapan dengan perangkat keras khusus untuk melatih data audio. Untuk informasi selengkapnya, lihat catatan kaki dalam tabel wilayah .
  2. Mengunggah data pengujian. Unggah data pengujian untuk mengevaluasi penawaran ucapan ke teks untuk aplikasi, alat, dan produk Anda.
  3. Menguji kualitas pengenalan. Gunakan Speech Studio untuk memutar ulang audio yang diunggah dan memeriksa kualitas pengenalan suara dari data pengujian Anda.
  4. Menguji model secara kuantitatif. Mengevaluasi dan meningkatkan akurasi model ucapan ke teks. Layanan Ucapan menyediakan tingkat kesalahan kata kuantitatif (WER), yang dapat Anda gunakan untuk menentukan apakah diperlukan lebih banyak pelatihan.
  5. Melatih model. Berikan transkrip tertulis dan teks terkait, bersama dengan data audio yang sesuai. Menguji model sebelum dan sesudah pelatihan bersifat opsional tetapi direkomendasikan.

    Catatan

    Anda membayar penggunaan model ucapan kustom dan hosting titik akhir. Anda juga akan dikenakan biaya untuk pelatihan model ucapan kustom jika model dasar dibuat pada 1 Oktober 2023 dan yang lebih baru. Anda tidak dikenakan biaya untuk pelatihan jika model dasar dibuat sebelum Oktober 2023. Untuk informasi selengkapnya, lihat Harga Azure AI Speech dan bagian Biaya untuk adaptasi dalam panduan migrasi ucapan ke teks 3.2.

  6. Menyebarkan model. Setelah Anda puas dengan hasil pengujian, sebarkan model ke titik akhir kustom. Kecuali untuk transkripsi batch, Anda harus menyebarkan titik akhir kustom untuk menggunakan model ucapan kustom.

    Tip

    Titik akhir penyebaran yang dihosting tidak diperlukan untuk menggunakan ucapan kustom dengan API transkripsi Batch. Anda dapat menghemat sumber daya jika model ucapan kustom hanya digunakan untuk transkripsi batch. Untuk informasi selengkapnya, lihat Harga layanan Azure Cognitive Service untuk Ucapan.

AI yang Bertanggung Jawab

Sistem AI tidak hanya mencakup teknologi, tetapi juga orang-orang yang menggunakannya, orang-orang yang terpengaruh olehnya, dan lingkungan tempatnya disebarkan. Baca catatan transparansi untuk mempelajari tentang penggunaan dan penyebaran AI yang bertanggung jawab di sistem Anda.

Langkah berikutnya