Apa itu Speech Studio?
Speech Studio adalah sekumpulan alat berbasis UI untuk membangun dan mengintegrasikan fitur dari layanan Azure AI Speech di aplikasi Anda. Buat proyek di Speech Studio menggunakan pendekatan tanpa kode, lalu referensikan aset tersebut di aplikasi Anda menggunakan Speech SDK, Speech CLI, atau REST API.
Tip
Anda juga dapat mencoba ucapan ke teks dan teks ke ucapan di AI Studio tanpa mendaftar atau menulis kode apa pun.
Skenario Speech Studio
Jelajahi, coba, dan lihat kode sampel untuk beberapa kasus penggunaan umum.
Keterangan: Pilih contoh klip video untuk melihat hasil keterangan yang diproses secara real time atau offline. Pelajari cara menyinkronkan keterangan dengan audio input Anda, menerapkan filter kata-kata kocek, mendapatkan hasil parsial, menerapkan penyesuaian, dan mengidentifikasi bahasa lisan untuk skenario multibahasa. Untuk informasi selengkapnya, lihat mulai cepat keterangan.
Pusat Panggilan: Menampilkan demonstrasi tentang cara menggunakan layanan Bahasa dan Ucapan untuk menganalisis percakapan pusat panggilan. Mentranskripsikan panggilan secara real time atau proses batch panggilan, redaksi informasi identifikasi pribadi, dan ekstrak wawasan seperti sentimen untuk membantu kasus penggunaan pusat panggilan Anda. Untuk informasi selengkapnya, lihat mulai cepat pusat panggilan.
Untuk demonstrasi skenario ini di Speech Studio, lihat video pengantar ini.
Fitur Speech Studio
Di Speech Studio, fitur layanan Ucapan berikut ini tersedia sebagai jenis proyek:
Ucapan real time ke teks: Uji ucapan ke teks dengan cepat dengan menyeret file audio ke sini tanpa harus menggunakan kode apa pun. Speech Studio memiliki alat demo untuk melihat cara kerja ucapan ke teks pada sampel audio Anda. Untuk menjelajahi fungsionalitas lengkap, lihat Apa itu ucapan ke teks.
Ucapan batch ke teks: Menguji kemampuan transkripsi batch dengan cepat untuk mentranskripsi sejumlah besar audio dalam penyimpanan dan menerima hasil secara asinkron, Untuk mempelajari selengkapnya tentang Ucapan ke teks Batch, lihat Ringkasan ucapan ke teks Batch.
Ucapan kustom: Membuat model pengenalan ucapan yang disesuaikan dengan kumpulan kosakata dan gaya berbicara tertentu. Berbeda dengan model pengenalan ucapan dasar, Model ucapan kustom menjadi bagian dari keunggulan kompetitif unik Anda karena tidak dapat diakses secara publik. Untuk mulai mengunggah audio sampel untuk membuat model ucapan kustom, lihat Mengunggah himpunan data pelatihan dan pengujian.
Penilaian pengucapan: Mengevaluasi pengucapan ucapan dan memberikan tanggapan kepada pembicara tentang keakuratan dan kefasihan audio lisan. Speech Studio menyediakan kotak pasir untuk menguji fitur ini dengan cepat, tanpa kode. Untuk menggunakan fitur ini dengan Speech SDK di aplikasi Anda, lihat artikel Penilaian pengucapan.
Terjemahan Ucapan: Uji dan terjemahkan ucapan dengan cepat ke bahasa lain pilihan Anda dengan latensi rendah. Untuk menjelajahi fungsionalitas lengkap, lihat Apa itu terjemahan ucapan.
Galeri Voice: Buat aplikasi dan layanan yang berbicara secara alami. Pilih dari sejumlah besar portofolio bahasa, suara, dan varian. Hidupkan skenario Anda dengan suara neural yang sangat ekspresif dan mirip manusia.
Suara kustom: Buat suara kustom yang unik untuk teks ke ucapan. Anda menyediakan file audio dan membuat transkripsi yang cocok di Speech Studio, lalu menggunakan suara kustom di aplikasi Anda. Untuk membuat dan menggunakan suara kustom melalui titik akhir, lihat Membuat dan menggunakan model suara Anda.
Pembuatan Konten Audio: Pendekatan tanpa kode untuk sintesis teks ke ucapan. Anda dapat menggunakan audio output apa adanya, atau sebagai titik awal untuk penyesuaian lebih lanjut. Anda dapat membangun konten audio yang sangat alami untuk berbagai skenario, seperti buku audio, siaran berita, narasi video, dan bot obrolan. Untuk informasi selengkapnya, lihat dokumentasi Pembuatan Konten Audio.
Kata Kunci Kustom: Kata Kunci Kustom adalah kata atau frasa pendek yang dapat Anda gunakan untuk mengaktifkan produk dengan suara. Buat kata kunci kustom di Speech Studio, lalu buat file biner untuk digunakan dengan Speech SDK di aplikasi Anda.