Поделиться через


Что такое голосовой помощник?

Используя голосовых помощников со службой "Речь", разработчики могут создать естественные и привычные для человека разговорные функции для своих приложений и возможностей. Служба голосового помощника обеспечивает быстрое, надежное взаимодействие между устройством и реализацией помощника.

Выбор решения помощника

Первым этапом создания голосового помощника является принятие решения о том, что вы от него хотите. Служба "Речь" предоставляет несколько дополнительных решений для создания взаимодействий с помощником. Возможно, вы хотите, чтобы ваше приложение поддерживало открытый разговор с фразами, такими как "Мне нужно пойти в Сиэтл" или "Какой вид пиццы можно заказать?" Для гибкости и гибкости вы можете добавлять голосовые и голосовые возможности бота с помощью Azure AI Служба Bot с каналом "Речь Direct Line".

Если вы еще не уверены, что вы хотите сделать при помощи помощника, мы рекомендуем использовать Direct Line Speech как оптимальный вариант. Оно обеспечивает интеграцию с широким набором инструментов и средств разработки, таких как Виртуальный помощник, шаблон Enterprise и служба QnA Maker, для создания общих шаблонов и использования существующих источников знаний.

Эталонная архитектура для создания голосового помощника с помощью пакета SDK службы "Речь"

Концептуальная схема потока службы оркестрации голосового помощника.

Основные возможности

Независимо от того, выбираете ли вы direct Line Speech или другое решение для создания взаимодействий помощника, вы можете использовать широкий набор функций настройки для настройки помощника для вашего бренда, продукта и личности.

Категория Функции
Пользовательские ключевые слова Пользователи могут начать диалог с помощниками с помощью пользовательского ключевого слова, например "Эй Contoso". Приложение делает это с помощью настраиваемого механизма ключевых слов в пакете SDK службы "Речь", который можно настроить, перейдя в Начало работы с пользовательскими ключевыми словами. Голосовые помощники могут использовать проверку ключевых слов на стороне службы для повышения точности активации ключевых слов (в отличие от использования только устройства).
Речь к тексту Голосовые помощники преобразуют звук в распознанный текст в режиме реального времени с помощью речи в текст из службы "Речь". Этот текст расшифровывается как для реализованного решения помощника, так и для клиентского приложения.
Текст в речь Текстовые ответы от помощника синтезируются с помощью текста в речь из службы "Речь". Затем этот синтез становится доступным для клиентского приложения в виде аудиопотока. Корпорация Майкрософт предлагает возможность создавать собственный собственный, высококачественный нейронный текст для речи (Нейронный TTS), который дает голос вашему бренду.

Начало работы с голосовыми помощниками

Мы предлагаем следующую статью краткого руководства, которая предназначена для запуска кода менее чем за 10 минут: краткое руководство. Создание пользовательского голосового помощника с помощью direct Line Speech

Пример кода и учебники

Пример кода для создания голосового помощника доступен на сайте GitHub. Примеры охватывают клиентское приложение для подключения к помощнику на нескольких популярных языках программирования.

Пользовательская настройка

Речевые помощники, созданные с помощью речевой службы, могут использовать полный спектр вариантов настройки.

Примечание.

Параметры настройки зависят от языка или языкового стандарта. Дополнительные сведения см. в разделе Поддерживаемые языки.

Следующие шаги