Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
REST API ucapan ke teks digunakan untuk transkripsi cepat, transkripsi batch , dan ucapan kustom.
Penting
Versi 2025-10-15 REST API ucapan ke teks adalah versi terbaru yang tersedia secara umum.
-
Versi REST API
2024-05-15-previewucapan ke teks akan dihentikan pada tanggal yang akan diumumkan. - UCAPAN ke teks REST API
v3.0,v3.1,v3.2,3.2-preview.1, dan3.2-preview.2akan dihentikan pada 31 Maret 2026.
Untuk informasi selengkapnya tentang peningkatan, lihat panduan migrasi Ucapan ke teks REST API v3.0 ke v3.1, v3.1 ke v3.2, v3.2 ke 2024-11-15 dan 2024-11-15 hingga 2025-10-15 .
Gunakan REST API Ucapan ke teks untuk melakukan hal berikut:
- Transkripsi cepat: Mentranskripsikan file audio dengan mengembalikan hasil secara sinkron dan jauh lebih cepat daripada audio real-time. Gunakan API transkripsi cepat (/speechtotext/transcriptions:transcribes) dalam skenario yang Anda perlukan transkrip rekaman audio secepat mungkin dengan latensi yang dapat diprediksi, seperti transkripsi audio atau video cepat atau terjemahan video.
- Transkripsi batch: Mentranskripsikan file audio sebagai batch dari beberapa URL atau kontainer Azure. Gunakan API transkripsi batch (/speechtotext/transcriptions:submit) dalam skenario yang perlu Anda mentranskripsikan sejumlah besar audio dalam penyimpanan, seperti sejumlah besar file atau file audio panjang.
- Ucapan kustom: Unggah data Anda sendiri, uji dan latih model kustom, bandingkan akurasi antar model, dan sebarkan model ke titik akhir kustom. Salin model ke langganan lain jika Anda ingin rekan kerja memiliki akses ke model yang Anda buat, atau jika Anda ingin menyebarkan model ke lebih dari satu wilayah.
REST API ucapan ke teks mencakup fitur seperti:
- Meminta log untuk setiap endpoint.
- Mintalah manifes model yang Anda buat, untuk menyiapkan kontainer lokal.
- Unggah data dari akun penyimpanan Azure dengan menggunakan URI tanda tangan akses bersama (SAS).
- Bawa penyimpanan Anda sendiri. Gunakan akun penyimpanan Anda sendiri untuk log, file transkripsi, dan data lainnya.
- Beberapa operasi mendukung pemberitahuan webhook. Anda dapat mendaftarkan webhook Tempat pemberitahuan dikirim.
Transkripsi cepat
Grup operasi berikut berlaku untuk transkripsi cepat.
| Grup operasi | Deskripsi |
|---|---|
| Transkripsi | Gunakan Transkripsi - Mentranskripsikan untuk mentranskripsikan file audio. Saat Anda menggunakan transkripsi cepat , Anda mengirim satu file per permintaan. Lihat Membuat transkripsi untuk contoh cara membuat transkripsi dari satu file audio. |
Transkripsi batch
Grup operasi berikut berlaku untuk transkripsi batch.
| Grup operasi | Deskripsi |
|---|---|
| Model | Gunakan model dasar atau model kustom untuk mentranskripsikan file audio. Anda dapat menggunakan model dengan ucapan kustom dan transkripsi batch. Misalnya, Anda dapat menggunakan model yang dilatih dengan himpunan data tertentu untuk mentranskripsikan file audio. Lihat Melatih model dan siklus hidup model ucapan kustom untuk contoh cara melatih dan mengelola model ucapan kustom. |
| Transkripsi | Gunakan Transkripsi - Kirim untuk menyalin sejumlah besar audio yang ada di penyimpanan. Saat Anda menggunakan transkripsi batch, Anda mengirim beberapa file per permintaan atau menunjuk ke kontainer Azure Blob Storage dengan file audio untuk ditranskripsikan. Lihat Membuat transkripsi untuk contoh cara membuat transkripsi dari beberapa file audio. |
| Web hook | Gunakan webhook untuk menerima pemberitahuan tentang peristiwa pembuatan, pemrosesan, penyelesaian, dan penghapusan. Anda dapat menggunakan webhook dengan ucapan kustom dan transkripsi batch. Webhook berlaku untuk himpunan data, titik akhir, evaluasi, model, dan transkripsi. |
Ucapan kustom
Grup operasi berikut berlaku untuk ucapan kustom.
| Grup operasi | Deskripsi |
|---|---|
| Himpunan data | Gunakan himpunan data untuk melatih dan menguji model ucapan kustom. Misalnya, Anda dapat membandingkan performa ucapan kustom yang dilatih dengan himpunan data tertentu dengan performa model dasar atau model ucapan kustom yang dilatih dengan himpunan data yang berbeda. Lihat Mengunggah himpunan data pelatihan dan pengujian untuk contoh cara mengunggah himpunan data. |
| Titik Akhir | Menyebarkan model ucapan kustom ke titik akhir. Anda harus menyebarkan titik akhir kustom untuk menggunakan model ucapan kustom. Lihat Menyebarkan model untuk contoh cara mengelola titik akhir penyebaran. |
| Evaluasi | Gunakan evaluasi untuk membandingkan performa model yang berbeda. Misalnya, Anda dapat membandingkan performa model ucapan kustom yang dilatih dengan himpunan data tertentu dengan performa model dasar atau model kustom yang dilatih dengan himpunan data yang berbeda. Lihat kualitas pengenalan pengujian dan akurasi pengujian untuk contoh cara menguji dan mengevaluasi model ucapan kustom. |
| Model | Gunakan model dasar atau model kustom untuk mentranskripsikan file audio. Anda dapat menggunakan model dengan ucapan kustom dan transkripsi batch. Misalnya, Anda dapat menggunakan model yang dilatih dengan himpunan data tertentu untuk mentranskripsikan file audio. Lihat Melatih model dan siklus hidup model ucapan kustom untuk contoh cara melatih dan mengelola model ucapan kustom. |
| Proyek | Gunakan proyek untuk mengelola model ucapan kustom, melatih dan menguji himpunan data, dan titik akhir penyebaran. Proyek ucapan kustom berisi model, himpunan data pelatihan dan pengujian, dan titik akhir penyebaran. Setiap proyek khusus untuk lokal. Misalnya, Anda dapat membuat proyek untuk bahasa Inggris di Amerika Serikat. Lihat Membuat proyek untuk contoh cara membuat proyek. |
| Web hook | Gunakan webhook untuk menerima pemberitahuan tentang peristiwa pembuatan, pemrosesan, penyelesaian, dan penghapusan. Anda dapat menggunakan webhook dengan ucapan kustom dan transkripsi batch. Webhook berlaku untuk himpunan data, titik akhir, evaluasi, model, dan transkripsi. |