Переход с обычного пользовательского голоса на нейронный

Статья
10.03.2025

Важно!

Стандартный уровень обучения, отличный от нейронной подготовки пользовательского голоса, снят с 29 февраля 2024 года. Вы могли бы использовать не нейронный пользовательский голос с ресурсом "Речь" до 29 февраля 2024 года. Теперь вы можете использовать только настраиваемый нейронный голос с ресурсами службы "Речь". Если у вас есть не нейронный пользовательский голос, необходимо перейти на пользовательский нейронный голос.

Пользовательский нейронный голос позволяет создавать более качественные голосовые модели, причем для этого требуется меньше данных. Вы можете разрабатывать более реалистичные, естественные голоса, подходящие для беседы. Клиенты и конечные пользователи получают выгоду от новейших технологий преобразования текста в речь.

Пользовательский голос	Пользовательский нейронный голос
Стандартная (традиционная) пользовательская голосовая модель разделяет звучащую речь на фонетические фрагменты, которые можно объединить заново и сопоставить, используя классические программные или статистические методы.	Пользовательский нейронный голос синтезирует речь с помощью глубоких нейронных сетей, которые "научились" способом фонетики объединяются в естественной речи человека, а не с помощью классических программ или статистических методов.
Пользовательскому голосу¹ требуется большой объем голосовых данных для создания голосовой модели, более приближенной к человеческому поведению. При меньшем количестве записанных строк стандартная пользовательская голосовая модель, как правило, звучит более очевидно роботизировано.	Возможности пользовательского нейронного голоса позволяют с помощью небольшого набора записей создавать уникальные голоса, использующие различные языки и стили.

Пользовательский голос

Пользовательский нейронный голос

Стандартная (традиционная) пользовательская голосовая модель разделяет звучащую речь на фонетические фрагменты, которые можно объединить заново и сопоставить, используя классические программные или статистические методы.

Пользовательский нейронный голос синтезирует речь с помощью глубоких нейронных сетей, которые "научились" способом фонетики объединяются в естественной речи человека, а не с помощью классических программ или статистических методов.

Пользовательскому голосу¹ требуется большой объем голосовых данных для создания голосовой модели, более приближенной к человеческому поведению. При меньшем количестве записанных строк стандартная пользовательская голосовая модель, как правило, звучит более очевидно роботизировано.

Возможности пользовательского нейронного голоса позволяют с помощью небольшого набора записей создавать уникальные голоса, использующие различные языки и стили.

¹ При создании пользовательской голосовой модели в рамках одной бесплатной подписки (F0) можно импортировать не более 10 ZIP-файлов с данными, а используя стандартную подписку (S0) — 500 файлов.

Необходимые действия

Прежде чем можно будет перейти на пользовательский нейронный голос, приложение должно быть принято. Корпорация Майкрософт предоставляет доступ к службе пользовательского нейронного голоса по собственному усмотрению с учетом собственных критериев соответствия. Чтобы использовать пользовательский нейронный голос, вы должны соблюдать наши принципы ответственного использования ИИ и правила поведения.

Совет

Даже не имея учетной записи Azure, вы можете прослушать образцы голосов в Speech Studio и подобрать тот, который лучше всего отвечает вашим бизнес-потребностям.

Ознакомьтесь с нашей политикой ограничения доступа и подайте свою заявку.
После утверждения приложения вы получите доступ к функции "нейронного обучения". Убедитесь, что вы войдите в Speech Studio , используя ту же подписку Azure, которую вы предоставляете в приложении.
Прежде чем обучать и развертывать пользовательскую голосовую модель, необходимо создать профиль таланта голоса. Для профиля требуется звуковой файл, записанный талантом голоса, который дает согласие на использование данных речи для обучения пользовательской голосовой модели.
Обновите код в приложениях, если вы создали новую конечную точку с помощью новой модели.

Сведения о пользовательском голосе (устарел)

Дополнительные сведения о пользовательском голосе см. в следующих разделах.

Поддержка языков

Пользовательский голос поддерживает следующие языки (языковые стандарты).

Язык	Locale
Китайский (мандаринский, упрощенное письмо)	`zh-CN`
Китайский (мандаринский, упрощенное письмо), английский двуязычный	`zh-CN` двуязычный
Английский (Индия)	`en-IN`
Английский (Великобритания)	`en-GB`
Английский (США)	`en-US`
Французский (Франция)	`fr-FR`
Немецкий (Германия)	`de-DE`
Итальянский (Италия)	`it-IT`
португальский (Бразилия)	`pt-BR`
Испанский (Мексика)	`es-MX`

Региональная поддержка

При создании пользовательского голосового шрифта используйте созданную конечную точку. Вы также можете использовать конечные точки, перечисленные в этом разделе, заменив {deploymentId} идентификатор развертывания для модели голосовой связи.

Область/регион	Конечная точка
Восточная Австралия	`https://australiaeast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Южная Бразилия	`https://brazilsouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Центральная Канада	`https://canadacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Центральная часть США	`https://centralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Восточная Азия	`https://eastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Восточная часть США	`https://eastus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Восточная часть США 2	`https://eastus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Центральная Франция	`https://francecentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Центральная Индия	`https://centralindia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Восточная Япония	`https://japaneast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Западная Япония	`https://japanwest.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Республика Корея, центральный регион	`https://koreacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Центрально-северная часть США	`https://northcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Северная Европа	`https://northeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Центрально-южная часть США	`https://southcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Юго-Восточная Азия	`https://southeastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
южная часть Соединенного Королевства	`https://uksouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Западная Европа	`https://westeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Центрально-западная часть США	`https://westcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Западная часть США	`https://westus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Западная часть США 2	`https://westus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`

Следующие шаги

Испытайте пользовательский нейронный голос

Дополнительные ресурсы

Документация

Миграция на пользовательский REST API голосовой связи — служба "Речь" - Azure AI services

Этот документ помогает разработчикам перенести код из текста версии 3 в REST API речи в пользовательский REST API голосовой связи.
Переход на нейронный голос — служба "Речь " - Azure AI services

В этом документе перечислены преимущества перехода с ненейронного голоса на нейронный.
Обзор функции пользовательского нейронного голоса — служба речи - Azure AI services

Пользовательский нейронный голос — это функция речи, которая позволяет создавать однообразный, настраиваемый, искусственный голос для ваших приложений. В качестве примера вы предоставляете собственные звуковые данные.
Применение для пользовательского нейронного голоса

Это короткое видео, в который вы узнаете, как применить к Пользовательскому нейронной голосовой связи Azure Cognitive Services. Пользовательский нейронный голос создает высокоприрожденные искусственные голоса с помощью самостоятельно предоставляемых речевых данных. С помощью пользовательского нейронного голоса вы можете создать уникальный цифровой голос, который может создать узнаваемое удостоверение, соответствующее вашему бренду.Дополнительные сведения о пользовательской нейронной голосово
Развертывание профессиональной голосовой модели в качестве конечной точки — служба "Речь" - Azure AI services

Узнайте, как развернуть профессиональную голосовую модель в качестве конечной точки.
Создание проекта для профессиональной голосовой связи — служба "Речь" - Azure AI services

Узнайте, как создать проект для профессионального голоса.
Переход с предварительно созданного стандартного голоса к предварительно созданному нейронному голосу: служба "Речь" - Azure AI services

Этот документ описывает, как перейти с предварительно созданного стандартного голоса на предварительно созданный нейронный голос.

Поделиться через