Uwaga
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Transkrypcja wsadowa służy do transkrypcji dużej ilości danych audio w magazynie. Zarówno interfejs API REST zamiany mowy na tekst, jak i interfejs wiersza polecenia mowy obsługują transkrypcję wsadową.
Należy podać wiele plików na żądanie lub wskazać kontener Azure Blob Storage z plikami audio do transkrypcji. Usługa transkrypcji wsadowej może obsługiwać dużą liczbę przesłanych transkrypcji. Usługa transkrybuje pliki współbieżnie, co zmniejsza czas zwrotu.
Jak to działa?
W przypadku transkrypcji wsadowych przesyłasz dane audio, a następnie pobierasz wyniki transkrypcji asynchronicznie. Usługa transkrybuje dane audio i przechowuje wyniki w kontenerze magazynu. Następnie możesz pobrać wyniki z kontenera magazynu.
Napiwek
W przypadku rozwiązania o niskim lub braku kodu można użyć łącznika usługi Batch Speech do tekstu w aplikacjach platformy Power Platform, takich jak Power Automate, Power Apps i Logic Apps. Zobacz Przewodnik po transkrypcji wsadowej usługi Power Automate, aby rozpocząć pracę.
Aby użyć interfejsu API REST transkrypcji wsadowej:
- Lokalizowanie plików audio na potrzeby transkrypcji wsadowej — możesz przekazać własne dane lub użyć istniejących plików audio za pośrednictwem publicznego identyfikatora URI lub identyfikatora URI sygnatury dostępu współdzielonego (SAS).
- Tworzenie transkrypcji wsadowej — prześlij zadanie transkrypcji z parametrami, takimi jak pliki audio, język transkrypcji i model transkrypcji.
- Pobieranie wyników transkrypcji wsadowej — sprawdź stan transkrypcji i pobierz wyniki transkrypcji asynchronicznie.
Ważne
Zadania transkrypcji wsadowej są zaplanowane zgodnie z najlepszymi potrzebami. W godzinach szczytu może upłynąć do 30 minut lub dłużej, zanim zadanie transkrypcji rozpocznie przetwarzanie. Zobacz, jak sprawdzić bieżący stan zadania transkrypcji wsadowej w tej sekcji.