Поделиться через


Переход с обычного пользовательского голоса на нейронный

Внимание

Стандартный уровень обучения, отличный от нейронной подготовки пользовательского голоса, снят с 29 февраля 2024 года. Вы могли бы использовать не нейронный пользовательский голос с ресурсом "Речь" до 29 февраля 2024 года. Теперь вы можете использовать только настраиваемый нейронный голос с ресурсами службы "Речь". Если у вас есть не нейронный пользовательский голос, необходимо перейти на пользовательский нейронный голос.

Пользовательский нейронный голос позволяет создавать более качественные голосовые модели, причем для этого требуется меньше данных. Вы можете разрабатывать более реалистичные, естественные голоса, подходящие для беседы. Клиенты и конечные пользователи получают выгоду от новейших технологий преобразования текста в речь.

Пользовательский голос Пользовательский нейронный голос
Стандартная (традиционная) пользовательская голосовая модель разделяет звучащую речь на фонетические фрагменты, которые можно объединить заново и сопоставить, используя классические программные или статистические методы. Пользовательский нейронный голос синтезирует речь с помощью глубоких нейронных сетей, которые "научились" способом фонетики объединяются в естественной речи человека, а не с помощью классических программ или статистических методов.
Пользовательскому голосу1 требуется большой объем голосовых данных для создания голосовой модели, более приближенной к человеческому поведению. При меньшем количестве записанных строк стандартная пользовательская голосовая модель, как правило, звучит более очевидно роботизировано. Возможности пользовательского нейронного голоса позволяют с помощью небольшого набора записей создавать уникальные голоса, использующие различные языки и стили.

1 При создании пользовательской голосовой модели в рамках одной бесплатной подписки (F0) можно импортировать не более 10 ZIP-файлов с данными, а используя стандартную подписку (S0) — 500 файлов.

Необходимые действия

Прежде чем можно будет перейти на пользовательский нейронный голос, приложение должно быть принято. Корпорация Майкрософт предоставляет доступ к службе пользовательского нейронного голоса по собственному усмотрению с учетом собственных критериев соответствия. Чтобы использовать пользовательский нейронный голос, вы должны соблюдать наши принципы ответственного использования ИИ и правила поведения.

Совет

Даже не имея учетной записи Azure, вы можете прослушать образцы голосов в Speech Studio и подобрать тот, который лучше всего отвечает вашим бизнес-потребностям.

  1. Ознакомьтесь с нашей политикой ограничения доступа и подайте свою заявку.
  2. После утверждения приложения вы получите доступ к функции "нейронного обучения". Убедитесь, что вы войдите в Speech Studio , используя ту же подписку Azure, которую вы предоставляете в приложении.
  3. Прежде чем обучать и развертывать пользовательскую голосовую модель, необходимо создать профиль таланта голоса. Для профиля требуется звуковой файл, записанный талантом голоса, который дает согласие на использование данных речи для обучения пользовательской голосовой модели.
  4. Обновите код в приложениях, если вы создали новую конечную точку с помощью новой модели.

Сведения о пользовательском голосе (устарел)

Дополнительные сведения о пользовательском голосе см. в следующих разделах.

Поддержка языков

Пользовательский голос поддерживает следующие языки (языковые стандарты).

Язык Locale
Китайский (мандаринский, упрощенное письмо) zh-CN
Китайский (мандаринский, упрощенное письмо), английский двуязычный zh-CN двуязычный
Английский (Индия) en-IN
Английский (Великобритания) en-GB
Английский (США) en-US
Французский (Франция) fr-FR
Немецкий (Германия) de-DE
Итальянский (Италия) it-IT
португальский (Бразилия) pt-BR
Испанский (Мексика) es-MX

Региональная поддержка

При создании пользовательского голосового шрифта используйте созданную конечную точку. Вы также можете использовать конечные точки, перечисленные в этом разделе, заменив {deploymentId} идентификатор развертывания для модели голосовой связи.

Область/регион Конечная точка
Восточная Австралия https://australiaeast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Южная Бразилия https://brazilsouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Центральная Канада https://canadacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Центральная часть США https://centralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Восточная Азия https://eastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Восточная часть США https://eastus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Восточная часть США 2 https://eastus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Центральная Франция https://francecentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Центральная Индия https://centralindia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Восточная Япония https://japaneast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Западная Япония https://japanwest.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Республика Корея, центральный регион https://koreacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Центрально-северная часть США https://northcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Северная Европа https://northeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Центрально-южная часть США https://southcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Юго-Восточная Азия https://southeastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
южная часть Соединенного Королевства https://uksouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Западная Европа https://westeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Центрально-западная часть США https://westcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Западная часть США https://westus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Западная часть США 2 https://westus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}

Следующие шаги