Начало работы с голосовыми помощниками в Windows
В этом руководстве описано, как начать разработку голосового помощника в Windows.
Настройка среды разработки
Чтобы начать разработку голосового помощника для Windows, необходимо убедиться, что у вас есть соответствующая среда разработки.
- Visual Studio: необходимо установить Microsoft Visual Studio 2017, Community Edition или более поздней версии.
- Версия Windows. Компьютер с быстрой кольцевой сборкой Windows Insider и версией Windows SDK для Windows Insider. Этот пример кода проверяется как работа с сборкой
19025.vb_release_analog.191112-1600
предварительного выпуска Windows с помощью пакета SDK для Windows 19018. Любая сборка или пакет SDK более поздних версий, чем указано, должны быть совместимыми. - Средства разработки UWP. Рабочая нагрузка на универсальной платформе Windows в Visual Studio. Описание подготовки компьютера к разработке приложений UWP, см. на странице Настройки UWP.
- Рабочий микрофон и аудиовыход
Получение ресурсов от корпорации Майкрософт
Для некоторых ресурсов, необходимых для настраиваемого голосового агента в Windows, требуются ресурсы корпорации Майкрософт. Пример голосового помощника UWP содержит образцы версий этих ресурсов для первоначальной разработки и тестирования, поэтому этот раздел не потребуется для первоначальной разработки.
- Модель ключевых слов. Для активации голоса требуется модель ключевых слов Майкрософт в формате файла BIN. Для файла BIN, указанного в примере голосового помощника UWP, было проведено обучение по ключевому слову contoso.
- Маркер функции ограниченного доступа: так как API ConversationalAgent предоставляют доступ к микрофону аудио, они защищены в соответствии с ограничениями функции ограниченного доступа. Чтобы использовать функцию ограниченного доступа, необходимо получить маркер компонента ограниченного доступа, подключенный к удостоверению пакета приложения от Корпорации Майкрософт. Дополнительные сведения о любой функции ограниченного доступа или запросе маркера разблокировки обратитесь к служба поддержки Майкрософт.
Создание службы диалоговых окон
Для полного интерфейса голосового помощника приложение нуждается в службе диалоговых окон, которая
- определяет ключевые слова в заданном звуковом файле;
- прослушивает данные пользователя и преобразовывать их в текст;
- отправляет текст в бот;
- преобразует текст, выдаваемый ботом в звуковые выходные данные.
Ниже приведены требования к созданию базовой службы диалоговых окон с помощью функции "Речь direct Line".
- Ресурс речи: ресурс Azure для функций службы "Речь", таких как речь в тексте и тексте. Создайте ресурс службы "Речь" на портале Azure. Дополнительные сведения см. в статье "Создание нового ресурса служб ИИ Azure".
- Бот Bot Framework: бот, созданный с помощью Bot Framework версии 4.2 или выше, подписан на Direct Line Speech , чтобы включить входные и выходные данные голосовой связи. В этом руководстве содержатся пошаговые инструкции по созданию "Эхо-бота" и оформлению подписки на канал Direct Line Speech. Вы также можете перейти к этой статье Bot Framework, чтобы узнать, как создать настраиваемого бота. Затем выполните те же действия , чтобы подписать его на Direct Line Speech, но с новым ботом, а не с "эхо-ботом".
Попробуйте пример приложения
С помощью ключа ресурса службы "Речь" и идентификатора бота эхо бота вы можете попробовать пример голосового помощника UWP. Следуйте инструкциям в файле сведений, чтобы запустить приложение и ввести учетные данные.
Создание собственного голосового помощника для Windows
Получив маркер функции ограниченного доступа и файл bin от Майкрософт, вы можете начать работу с собственным голосовой помощником в Windows.