Eseguire la migrazione dalla voce personalizzata alla voce neurale personalizzata

Importante

Il livello di training non neurale standard della voce personalizzata viene ritirato dal 1° marzo 2021 al 29 febbraio 2024. Se è stata usata una voce personalizzata non neurale con la risorsa Voce prima del 1° marzo 2021, è possibile continuare a farlo fino al 29 febbraio 2024. Tutte le altre risorse voce possono usare solo la voce neurale personalizzata. Dopo il 29 febbraio 2024, le voci personalizzate non neurali non saranno supportate con alcuna risorsa Voce.

I prezzi per la voce personalizzata sono diversi dalla voce neurale personalizzata. Passare alla pagina dei prezzi e controllare i dettagli dei prezzi nella sezione "Deprecata" collapsable. La voce personalizzata (training non neurale) viene definita Personalizzata.

La voce neurale personalizzata consente di creare modelli vocali di qualità superiore, richiedendo meno dati. È possibile sviluppare voci più realistiche, naturali e conversazionali. I clienti e gli utenti finali traggono vantaggio dalla tecnologia text to speech più recente, in modo responsabile.

Voce personalizzata Voce neurale personalizzata
Il metodo standard o "tradizionale" della voce personalizzata suddivide il linguaggio parlato in frammenti fonetici che possono essere remixati e abbinati usando la programmazione classica o metodi statistici. La voce neurale personalizzata sintetizza il parlato usando reti neurali profonde che hanno "appreso" il modo in cui i fonetici vengono combinati in linguaggio umano naturale, invece di usare metodi di programmazione classica o statistica.
La vocepersonalizzata 1 richiede un volume elevato di dati vocali per produrre un modello vocale più simile a quello umano. Con meno linee registrate, un modello vocale personalizzato standard tende a suonare più ovviamente robotica. La funzionalità voce neurale personalizzata consente di creare una voce di marca univoca in più lingue e stili usando un piccolo set di registrazioni.

1 Quando si crea un modello vocale personalizzato, il numero massimo di file di dati che è consentito importare per ogni sottoscrizione è 10 .zip file per gli utenti della sottoscrizione gratuita (F0) e 500 per gli utenti della sottoscrizione standard (S0).

Azione richiesta

Prima di poter eseguire la migrazione alla voce neurale personalizzata, l'applicazione deve essere accettata. L'accesso al servizio vocale neurale personalizzato è soggetto alla sola discrezione di Microsoft in base ai criteri di idoneità. È necessario impegnarsi a usare la voce neurale personalizzata in linea con i principi di IA responsabile e il codice di comportamento.

Suggerimento

Anche senza un account Azure, è possibile ascoltare gli esempi vocali in Speech Studio e determinare la voce appropriata per le esigenze aziendali.

  1. Altre informazioni sui criteri relativi al limite di accesso e quindi si applicano qui.
  2. Dopo l'approvazione dell'applicazione, viene fornito l'accesso alla funzionalità di training "neurale". Assicurarsi di accedere a Speech Studio usando la stessa sottoscrizione di Azure specificata nell'applicazione.
  3. Prima di poter eseguire il training e distribuire un modello vocale personalizzato, è necessario creare un profilo di voice talent. Il profilo richiede un file audio registrato dal voice talent che acconsente all'utilizzo dei dati vocali per eseguire il training di un modello vocale personalizzato.
  4. Aggiornare il codice nelle app se è stato creato un nuovo endpoint con un nuovo modello.

Dettagli vocali personalizzati (deprecato)

Per informazioni dettagliate sulla voce personalizzata, leggere le sezioni seguenti.

Supporto di versioni in lingue diverse

La voce personalizzata supporta le lingue seguenti (impostazioni locali).

Lingua Impostazioni locali
Cinese (mandarino, semplificato) zh-CN
Cinese (mandarino, semplificato), bilingue inglese zh-CN Bilingue
Inglese (India) en-IN
Inglese (Regno Unito) en-GB
Inglese (Stati Uniti) en-US
Francese (Francia) fr-FR
Tedesco (Germania) de-DE
Italiano (Italia) it-IT
Portoghese (Brasile) pt-BR
Spagnolo (Messico) es-MX

Supporto a livello di area

Se è stato creato un tipo di carattere vocale personalizzato, usare l'endpoint creato. È anche possibile usare gli endpoint elencati in questa sezione, sostituendo con {deploymentId} l'ID di distribuzione per il modello vocale.

Area Endpoint
Australia orientale https://australiaeast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Brasile meridionale https://brazilsouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Canada centrale https://canadacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Stati Uniti centrali https://centralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Asia orientale https://eastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Stati Uniti orientali https://eastus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Stati Uniti orientali 2 https://eastus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Francia centrale https://francecentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
India centrale https://centralindia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Giappone orientale https://japaneast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Giappone occidentale https://japanwest.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Corea centrale https://koreacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Stati Uniti centro-settentrionali https://northcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Europa settentrionale https://northeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Stati Uniti centro-meridionali https://southcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Asia sud-orientale https://southeastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Regno Unito meridionale https://uksouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Europa occidentale https://westeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Stati Uniti centro-occidentali https://westcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
Stati Uniti occidentali https://westus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}
West US 2 https://westus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}

Passaggi successivi