Úvod
Řeč je jedním z nejpřirozenějších způsobů komunikace lidí a přináší možnosti řeči aplikacím AI intuitivnější, přístupnější a poutavější uživatelské prostředí. Ať už vytváříte hlasového asistenta, vytváříte přístupné aplikace nebo vyvíjíte konverzační agenty AI, je pochopení hlasových technologií nezbytné pro moderní řešení AI.
V tomto modulu prozkoumáte dvě základní funkce řeči, které umožňují hlasové aplikace: rozpoznávání řeči (převod mluvených slov na text) a syntézu řeči (převod textu na přirozený zvuk). Dozvíte se, jak tyto technologie spolupracují, abyste vytvořili bezproblémové hlasové interakce a dozvěděli se o reálných scénářích, ve kterých může řeč transformovat uživatelská prostředí.
Poznámka:
Uvědomujeme si, že se různí lidé rádi učí různými způsoby. Tento modul můžete dokončit ve formátu založeném na videu nebo obsah si můžete přečíst jako text a obrázky. Text obsahuje větší podrobnosti než videa, takže v některých případech na něj můžete chtít odkazovat jako na doplňkový materiál k prezentaci videa.