Wprowadzenie
Generowanie modeli sztucznej inteligencji umożliwia tworzenie inteligentnych aplikacji opartych na czatach, które mogą zrozumieć dane wejściowe i rozumować. Tradycyjnie wprowadzanie tekstu jest podstawowym trybem interakcji z modelami sztucznej inteligencji, ale modele wielomodalne stają się coraz bardziej dostępne. Te modele umożliwiają aplikacjom czatu reagowanie na dane wejściowe audio, a także tekst.
W tym module omówimy generowanie sztucznej inteligencji z włączoną obsługą dźwięku i dowiesz się, jak za pomocą rozwiązania Microsoft Foundry tworzyć generowanie rozwiązań sztucznej inteligencji, które odpowiadają na monity zawierające kombinację danych tekstowych i dźwiękowych.