Co to jest transkrypcja wsadowa?

2025-05-25

Transkrypcja wsadowa służy do transkrypcji dużej ilości danych audio w magazynie. Zarówno interfejs API REST zamiany mowy na tekst, jak i interfejs wiersza polecenia mowy obsługują transkrypcję wsadową.

Należy podać wiele plików na żądanie lub wskazać kontener Azure Blob Storage z plikami audio do transkrypcji. Usługa transkrypcji wsadowej może obsługiwać dużą liczbę przesłanych transkrypcji. Usługa transkrybuje pliki współbieżnie, co zmniejsza czas zwrotu.

Jak to działa?

W przypadku transkrypcji wsadowych przesyłasz dane audio, a następnie pobierasz wyniki transkrypcji asynchronicznie. Usługa transkrybuje dane audio i przechowuje wyniki w kontenerze magazynu. Następnie możesz pobrać wyniki z kontenera magazynu.

Napiwek

W przypadku rozwiązania o niskim lub braku kodu można użyć łącznika usługi Batch Speech do tekstu w aplikacjach platformy Power Platform, takich jak Power Automate, Power Apps i Logic Apps. Zobacz Przewodnik po transkrypcji wsadowej usługi Power Automate, aby rozpocząć pracę.

Aby użyć interfejsu API REST transkrypcji wsadowej:

Lokalizowanie plików audio na potrzeby transkrypcji wsadowej — możesz przekazać własne dane lub użyć istniejących plików audio za pośrednictwem publicznego identyfikatora URI lub identyfikatora URI sygnatury dostępu współdzielonego (SAS).
Tworzenie transkrypcji wsadowej — prześlij zadanie transkrypcji z parametrami, takimi jak pliki audio, język transkrypcji i model transkrypcji.
Pobieranie wyników transkrypcji wsadowej — sprawdź stan transkrypcji i pobierz wyniki transkrypcji asynchronicznie.

Ważne

Zadania transkrypcji wsadowej są zaplanowane zgodnie z najlepszymi potrzebami. W godzinach szczytu może upłynąć do 30 minut lub dłużej, zanim zadanie transkrypcji rozpocznie przetwarzanie. Zobacz, jak sprawdzić bieżący stan zadania transkrypcji wsadowej w tej sekcji.

Udostępnij za pośrednictwem

Co to jest transkrypcja wsadowa?

Jak to działa?

Treści powiązane

Opinia

Dodatkowe zasoby