Сводка

Завершено

Tip

Дополнительные сведения см. на вкладке "Текст и изображения ".

В этом модуле представлено распознавание речи (речь — текст) в качестве основы для приложений и агентов с поддержкой голоса. Учащиеся изучают, как речевой звук записывается из микрофона или звукового файла и преобразуется в письменный текст с помощью службы "Речь Azure". Модуль объясняет, где речь в тексте помещается в приложение ( в клиентском приложении или серверной службе) и выделяет распространенные сценарии, такие как динамическое транскрибирование, субтитры, обработка голосовой почты и предоставление текстовых данных агентам ИИ.

Затем модуль охватывает синтез речи (текст в речь), который позволяет приложениям создавать естественный звук из текста. Учащиеся видят, как речь Azure использует нейронные голоса для управления произношением, тоном, скоростью и шагом, а также как синтезированный звук можно воспроизводить немедленно или сохранять для последующего использования. В этом разделе подчеркивается, как синтез речи позволяет приложениям и агентам отвечать голосом, улучшая доступность, взаимодействие без помощи рук и общий пользовательский опыт.

Наконец, модуль объединяет эти возможности через преобразование речи в речь с помощью Voice Live. Учащиеся обнаруживают, как Voice Live объединяет речь в текст, обоснование ИИ и текст в речь в единую полностью управляемую службу для бесед в режиме реального времени. Вместо объединения нескольких компонентов разработчики могут использовать Voice Live для создания адаптивных, естественных голосовых агентов, которые могут прослушивать, думать и говорить, что упрощает создание готовых к работе диалоговых интерфейсов с помощью службы "Речь Azure" и Microsoft Foundry.

Дополнительные сведения см. по ссылкам ниже.