Typy služeb rozhraní SPEECH API
Službu Azure Cognitive Services Speech můžete použít k provádění transformací mluveného jazyka, včetně převodu řeči na text, převodu textu na řeč, překladu řeči a rozpoznávání mluvčího.
Poznámka
Azure Cognitive Service for Language použijte, pokud chcete získat přehled o termínech nebo frázích nebo získat podrobnou kontextovou analýzu mluveného nebo psaného jazyka.
Služby
- Převod řeči na text může převádět zvukové streamy na text v reálném čase nebo v dávce.
- Převod textu na řeč umožňuje aplikacím převádět text na lidskou řeč.
- Překlad řeči poskytuje vícejazyčný překlad řeči na řeč a převod řeči na text zvukových streamů.
Jak zvolit službu speech
Tento vývojový diagram vám může pomoct vybrat službu speech, která vyhovuje vašim potřebám:
Levá strana diagramu znázorňuje procesy převodu zvuku na zvuk nebo převod zvuku na text.
- Převod řeči na text se používá k převodu řeči ze zdroje zvuku do textového formátu.
- Převod řeči na řeč se používá k překladu řeči v jednom jazyce na řeč v jiném jazyce.
Pravá strana diagramu znázorňuje procesy převodu textu na zvuk.
- Převod textu na řeč se používá ke generování mluveného zvuku z textového zdroje.
Běžné případy použití
Následující tabulka doporučuje služby pro některé běžné případy použití.
Případ použití | Služba, která se má použít |
---|---|
Poskytnutí skrytých titulků pro nahraná nebo živá videa | Převod řeči na text |
Vytvoření přepisu telefonního hovoru nebo schůzky | Převod řeči na text |
Implementace automatizovaného diktování poznámek | Převod řeči na text |
Určení zamýšleného vstupu uživatele pro další zpracování | Převod řeči na text |
Generování mluvených odpovědí na uživatelský vstup | Převod textu na řeč |
Vytváření hlasových nabídek pro telefonní systémy | Převod textu na řeč |
Čtení e-mailů nebo textových zpráv nahlas ve scénářích s hands-free | Převod textu na řeč |
Vysílání oznámení na veřejných místech, jako jsou železniční stanice nebo letiště | Převod textu na řeč |
Vytvoření skrytých titulků v reálném čase pro řeč nebo souběžný obousměrný překlad mluvené konverzace | Převod řeči na text |
Přispěvatelé
Tento článek spravuje Microsoft. Původně ji napsali následující přispěvatelé.
Hlavní autoři:
- Kruti Mehta | Vedoucí Fast-Track technik Azure
- Oscar Shimabukuro | Vedoucí architekt cloudových řešení
Další přispěvatelé:
- Mick Alberts | Technický spisovatel
- Ashish Chahuan | Vedoucí architekt cloudových řešení
- Brandon Cowen | Vedoucí architekt cloudových řešení
- Manjit Singh | Softwarový inženýr
- Christina Skarpathiotaki | Vedoucí architekt cloudových řešení
- Nathan Widdup | Vedoucí Fast-Track technik Azure
Pokud chcete zobrazit neveřejné profily LinkedIn, přihlaste se na LinkedIn.
Další kroky
- Co je služba Speech?
- Příspěvek na blogu o rozhraních Speech API
- Studijní program: Zřízení a správa služeb Azure Cognitive Services
- Studijní program: Zpracování a překlad řeči ve službě Azure Cognitive Speech Services
Související prostředky
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro