Поделиться через


Начало работы с голосовыми помощниками в Windows

В этом руководстве описано, как начать разработку голосового помощника в Windows.

Настройка среды разработки

Чтобы начать разработку голосового помощника для Windows, необходимо убедиться, что у вас есть соответствующая среда разработки.

  • Visual Studio: необходимо установить Microsoft Visual Studio 2017, Community Edition или более поздней версии.
  • Версия Windows. Компьютер с быстрой кольцевой сборкой Windows Insider и версией Windows SDK для Windows Insider. Этот пример кода проверяется как работа с сборкой 19025.vb_release_analog.191112-1600 предварительного выпуска Windows с помощью пакета SDK для Windows 19018. Любая сборка или пакет SDK более поздних версий, чем указано, должны быть совместимыми.
  • Средства разработки UWP. Рабочая нагрузка на универсальной платформе Windows в Visual Studio. Описание подготовки компьютера к разработке приложений UWP, см. на странице Настройки UWP.
  • Рабочий микрофон и аудиовыход

Получение ресурсов от корпорации Майкрософт

Для некоторых ресурсов, необходимых для настраиваемого голосового агента в Windows, требуются ресурсы корпорации Майкрософт. Пример голосового помощника UWP содержит образцы версий этих ресурсов для первоначальной разработки и тестирования, поэтому этот раздел не потребуется для первоначальной разработки.

  • Модель ключевых слов. Для активации голоса требуется модель ключевых слов Майкрософт в формате файла BIN. Для файла BIN, указанного в примере голосового помощника UWP, было проведено обучение по ключевому слову contoso.
  • Маркер функции ограниченного доступа: так как API ConversationalAgent предоставляют доступ к микрофону аудио, они защищены в соответствии с ограничениями функции ограниченного доступа. Чтобы использовать функцию ограниченного доступа, необходимо получить маркер компонента ограниченного доступа, подключенный к удостоверению пакета приложения от Корпорации Майкрософт. Дополнительные сведения о любой функции ограниченного доступа или запросе маркера разблокировки обратитесь к служба поддержки Майкрософт.

Создание службы диалоговых окон

Для полного интерфейса голосового помощника приложение нуждается в службе диалоговых окон, которая

  • определяет ключевые слова в заданном звуковом файле;
  • прослушивает данные пользователя и преобразовывать их в текст;
  • отправляет текст в бот;
  • преобразует текст, выдаваемый ботом в звуковые выходные данные.

Ниже приведены требования к созданию базовой службы диалоговых окон с помощью функции "Речь direct Line".

  • Ресурс речи: ресурс Azure для функций службы "Речь", таких как речь в тексте и тексте. Создайте ресурс службы "Речь" на портале Azure. Дополнительные сведения см. в статье "Создание нового ресурса служб ИИ Azure".
  • Бот Bot Framework: бот, созданный с помощью Bot Framework версии 4.2 или выше, подписан на Direct Line Speech , чтобы включить входные и выходные данные голосовой связи. В этом руководстве содержатся пошаговые инструкции по созданию "Эхо-бота" и оформлению подписки на канал Direct Line Speech. Вы также можете перейти к этой статье Bot Framework, чтобы узнать, как создать настраиваемого бота. Затем выполните те же действия , чтобы подписать его на Direct Line Speech, но с новым ботом, а не с "эхо-ботом".

Попробуйте пример приложения

С помощью ключа ресурса службы "Речь" и идентификатора бота эхо бота вы можете попробовать пример голосового помощника UWP. Следуйте инструкциям в файле сведений, чтобы запустить приложение и ввести учетные данные.

Создание собственного голосового помощника для Windows

Получив маркер функции ограниченного доступа и файл bin от Майкрософт, вы можете начать работу с собственным голосовой помощником в Windows.

Следующие шаги