Dokumentacja zamiany mowy na tekst
Zamiana mowy na tekst z usługi Mowa, znana również jako rozpoznawanie mowy, umożliwia transkrypcję strumieni audio w czasie rzeczywistym i wsadową na tekst. Dzięki dodatkowym wejściowym tekstom referencyjnym umożliwia również ocenę wymowy w czasie rzeczywistym i daje głośnikom opinie na temat dokładności i płynności dźwięku mówionego.
Informacje o zamianie mowy na tekst
Omówienie
- Co to jest zamiana mowy w czasie rzeczywistym na tekst?
- Co to jest zamiana mowy wsadowej na tekst?
- Co to jest mowa niestandardowa?
- Używanie interfejsu wiersza polecenia usługi Mowa do zamiany mowy na tekst bez kodu
Szybki start
Programowanie za pomocą mowy na tekst
Przewodnik z instrukcjami
- Używanie szybkiego interfejsu API transkrypcji
- Tworzenie niestandardowego projektu mowy
- Trenowanie modelu na potrzeby mowy niestandardowej
- Używanie skompresowanych formatów dźwiękowych danych wejściowych