Dokumentacja zamiany mowy na tekst
Zamiana mowy na tekst w usłudze Azure Speech, znana również jako rozpoznawanie mowy, umożliwia transkrypcję strumieni audio w czasie rzeczywistym oraz wsadową transkrypcję w tekst. Dzięki dodatkowym wejściowym tekstom referencyjnym umożliwia również ocenę wymowy w czasie rzeczywistym i daje głośnikom opinie na temat dokładności i płynności dźwięku mówionego.
Informacje o zamianie mowy na tekst
Omówienie
- Co to jest zamiana mowy w czasie rzeczywistym na tekst?
- Co to jest grupowe rozpoznawanie mowy na tekst?
- Co to jest mowa dostosowana?
- Użyj interfejsu wiersza polecenia do zamiany mowy na tekst bez kodowania
Szybki start
Programowanie za pomocą mowy na tekst
Przewodnik z instrukcjami
- Użyj szybkiego interfejsu API transkrypcji
- Tworzenie niestandardowego projektu mowy
- Wytrenowanie modelu dla mowy spersonalizowanej
- Używanie skompresowanych formatów dźwiękowych danych wejściowych