Bagikan melalui


REST API ucapan ke teks

REST API ucapan ke teks digunakan untuk transkripsi batch dan ucapan kustom.

Penting

REST API ucapan ke teks v3.2 adalah versi terbaru yang tersedia secara umum. Pratinjau versi 3.2-preview.1 dan 3.2-preview.2* akan dihapus pada bulan September 2024. REST API ucapan ke teks v3.1 akan dihentikan pada tanggal yang akan diumumkan. Untuk informasi selengkapnya tentang peningkatan, lihat panduan migrasi Ucapan ke teks REST API v3.1 ke v3.2 . REST API ucapan ke teks v3.0 akan dihentikan pada 1 April 2026. Untuk informasi selengkapnya tentang peningkatan, lihat panduan migrasi Ucapan ke teks REST API v3.0 ke v3.1 dan v3.1 ke v3.2 .

Gunakan REST API Ucapan ke teks untuk:

  • Transkripsi cepat: Mentranskripsikan file audio dengan mengembalikan hasil secara sinkron dan jauh lebih cepat daripada audio real-time. Gunakan API transkripsi cepat (/speechtotext/transcriptions:transcribes) dalam skenario yang Anda perlukan transkrip rekaman audio secepat mungkin dengan latensi yang dapat diprediksi, seperti transkripsi audio atau video cepat atau terjemahan video.
  • Ucapan kustom: Unggah data Anda sendiri, uji dan latih model kustom, bandingkan akurasi antar model, dan sebarkan model ke titik akhir kustom. Salin model ke langganan lain jika Anda ingin rekan kerja memiliki akses ke model yang Anda buat, atau jika Anda ingin menyebarkan model ke lebih dari satu wilayah.
  • Transkripsi batch: Mentranskripsikan file audio sebagai batch dari beberapa URL atau kontainer Azure.

REST API ucapan ke teks mencakup fitur seperti:

  • Dapatkan log untuk setiap titik akhir jika log diminta untuk titik akhir tersebut.
  • Mintalah manifes model yang Anda buat, untuk menyiapkan kontainer lokal.
  • Unggah data dari akun penyimpanan Azure dengan menggunakan URI tanda tangan akses bersama (SAS).
  • Bawa penyimpanan Anda sendiri. Gunakan akun penyimpanan Anda sendiri untuk log, file transkripsi, dan data lainnya.
  • Beberapa operasi mendukung pemberitahuan webhook. Anda dapat mendaftarkan webhook Tempat pemberitahuan dikirim.

Transkripsi batch

Grup operasi berikut berlaku untuk transkripsi batch.

Grup operasi Deskripsi
Model Gunakan model dasar atau model kustom untuk mentranskripsikan file audio.

Anda dapat menggunakan model dengan ucapan kustom dan transkripsi batch. Misalnya, Anda dapat menggunakan model yang dilatih dengan himpunan data tertentu untuk mentranskripsikan file audio. Lihat Melatih model dan siklus hidup model ucapan kustom untuk contoh cara melatih dan mengelola model ucapan kustom.
Transkripsi Gunakan transkripsi untuk mentranskripsikan sejumlah besar audio dalam penyimpanan.

Saat Anda menggunakan transkripsi batch, Anda mengirim beberapa file per permintaan atau menunjuk ke kontainer Azure Blob Storage dengan file audio untuk ditranskripsikan. Lihat Membuat transkripsi untuk contoh cara membuat transkripsi dari beberapa file audio.
Web hook Gunakan webhook untuk menerima pemberitahuan tentang peristiwa pembuatan, pemrosesan, penyelesaian, dan penghapusan.

Anda dapat menggunakan webhook dengan ucapan kustom dan transkripsi batch. Webhook berlaku untuk himpunan data, titik akhir, evaluasi, model, dan transkripsi.

Ucapan kustom

Grup operasi berikut berlaku untuk ucapan kustom.

Grup operasi Deskripsi
Himpunan data Gunakan himpunan data untuk melatih dan menguji model ucapan kustom.

Misalnya, Anda dapat membandingkan performa ucapan kustom yang dilatih dengan himpunan data tertentu dengan performa model dasar atau model ucapan kustom yang dilatih dengan himpunan data yang berbeda. Lihat Mengunggah himpunan data pelatihan dan pengujian untuk contoh cara mengunggah himpunan data.
Titik Akhir Menyebarkan model ucapan kustom ke titik akhir.

Anda harus menyebarkan titik akhir kustom untuk menggunakan model ucapan kustom. Lihat Menyebarkan model untuk contoh cara mengelola titik akhir penyebaran.
Evaluasi Gunakan evaluasi untuk membandingkan performa model yang berbeda.

Misalnya, Anda dapat membandingkan performa model ucapan kustom yang dilatih dengan himpunan data tertentu dengan performa model dasar atau model kustom yang dilatih dengan himpunan data yang berbeda. Lihat kualitas pengenalan pengujian dan akurasi pengujian untuk contoh cara menguji dan mengevaluasi model ucapan kustom.
Model Gunakan model dasar atau model kustom untuk mentranskripsikan file audio.

Anda dapat menggunakan model dengan ucapan kustom dan transkripsi batch. Misalnya, Anda dapat menggunakan model yang dilatih dengan himpunan data tertentu untuk mentranskripsikan file audio. Lihat Melatih model dan siklus hidup model ucapan kustom untuk contoh cara melatih dan mengelola model ucapan kustom.
Proyek Gunakan proyek untuk mengelola model ucapan kustom, melatih dan menguji himpunan data, dan titik akhir penyebaran.

Proyek ucapan kustom berisi model, himpunan data pelatihan dan pengujian, dan titik akhir penyebaran. Setiap proyek khusus untuk lokal. Misalnya, Anda dapat membuat proyek untuk bahasa Inggris di Amerika Serikat. Lihat Membuat proyek untuk contoh cara membuat proyek.
Web hook Gunakan webhook untuk menerima pemberitahuan tentang peristiwa pembuatan, pemrosesan, penyelesaian, dan penghapusan.

Anda dapat menggunakan webhook dengan ucapan kustom dan transkripsi batch. Webhook berlaku untuk himpunan data, titik akhir, evaluasi, model, dan transkripsi.

Kondisi layanan

Kondisi layanan memberikan wawasan tentang kesehatan keseluruhan layanan dan subkomponen. Lihat Service Health untuk informasi selengkapnya.

Langkah berikutnya