Eseguire la migrazione dalla voce personalizzata alla voce neurale personalizzata

Articolo
01/21/2024

Importante

Il livello di training non neurale standard della voce personalizzata viene ritirato dal 1° marzo 2021 al 29 febbraio 2024. Se è stata usata una voce personalizzata non neurale con la risorsa Voce prima del 1° marzo 2021, è possibile continuare a farlo fino al 29 febbraio 2024. Tutte le altre risorse voce possono usare solo la voce neurale personalizzata. Dopo il 29 febbraio 2024, le voci personalizzate non neurali non saranno supportate con alcuna risorsa Voce.

I prezzi per la voce personalizzata sono diversi dalla voce neurale personalizzata. Passare alla pagina dei prezzi e controllare i dettagli dei prezzi nella sezione "Deprecata" collapsable. La voce personalizzata (training non neurale) viene definita Personalizzata.

La voce neurale personalizzata consente di creare modelli vocali di qualità superiore, richiedendo meno dati. È possibile sviluppare voci più realistiche, naturali e conversazionali. I clienti e gli utenti finali traggono vantaggio dalla tecnologia text to speech più recente, in modo responsabile.

Voce personalizzata	Voce neurale personalizzata
Il metodo standard o "tradizionale" della voce personalizzata suddivide il linguaggio parlato in frammenti fonetici che possono essere remixati e abbinati usando la programmazione classica o metodi statistici.	La voce neurale personalizzata sintetizza il parlato usando reti neurali profonde che hanno "appreso" il modo in cui i fonetici vengono combinati in linguaggio umano naturale, invece di usare metodi di programmazione classica o statistica.
La voce^{personalizzata 1} richiede un volume elevato di dati vocali per produrre un modello vocale più simile a quello umano. Con meno linee registrate, un modello vocale personalizzato standard tende a suonare più ovviamente robotica.	La funzionalità voce neurale personalizzata consente di creare una voce di marca univoca in più lingue e stili usando un piccolo set di registrazioni.

¹ Quando si crea un modello vocale personalizzato, il numero massimo di file di dati che è consentito importare per ogni sottoscrizione è 10 .zip file per gli utenti della sottoscrizione gratuita (F0) e 500 per gli utenti della sottoscrizione standard (S0).

Azione richiesta

Prima di poter eseguire la migrazione alla voce neurale personalizzata, l'applicazione deve essere accettata. L'accesso al servizio vocale neurale personalizzato è soggetto alla sola discrezione di Microsoft in base ai criteri di idoneità. È necessario impegnarsi a usare la voce neurale personalizzata in linea con i principi di IA responsabile e il codice di comportamento.

Suggerimento

Anche senza un account Azure, è possibile ascoltare gli esempi vocali in Speech Studio e determinare la voce appropriata per le esigenze aziendali.

Altre informazioni sui criteri relativi al limite di accesso e quindi si applicano qui.
Dopo l'approvazione dell'applicazione, viene fornito l'accesso alla funzionalità di training "neurale". Assicurarsi di accedere a Speech Studio usando la stessa sottoscrizione di Azure specificata nell'applicazione.
Prima di poter eseguire il training e distribuire un modello vocale personalizzato, è necessario creare un profilo di voice talent. Il profilo richiede un file audio registrato dal voice talent che acconsente all'utilizzo dei dati vocali per eseguire il training di un modello vocale personalizzato.
Aggiornare il codice nelle app se è stato creato un nuovo endpoint con un nuovo modello.

Dettagli vocali personalizzati (deprecato)

Per informazioni dettagliate sulla voce personalizzata, leggere le sezioni seguenti.

Supporto di versioni in lingue diverse

La voce personalizzata supporta le lingue seguenti (impostazioni locali).

Lingua	Impostazioni locali
Cinese (mandarino, semplificato)	`zh-CN`
Cinese (mandarino, semplificato), bilingue inglese	`zh-CN` Bilingue
Inglese (India)	`en-IN`
Inglese (Regno Unito)	`en-GB`
Inglese (Stati Uniti)	`en-US`
Francese (Francia)	`fr-FR`
Tedesco (Germania)	`de-DE`
Italiano (Italia)	`it-IT`
Portoghese (Brasile)	`pt-BR`
Spagnolo (Messico)	`es-MX`

Supporto a livello di area

Se è stato creato un tipo di carattere vocale personalizzato, usare l'endpoint creato. È anche possibile usare gli endpoint elencati in questa sezione, sostituendo con {deploymentId} l'ID di distribuzione per il modello vocale.

Area	Endpoint
Australia orientale	`https://australiaeast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Brasile meridionale	`https://brazilsouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Canada centrale	`https://canadacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Stati Uniti centrali	`https://centralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Asia orientale	`https://eastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Stati Uniti orientali	`https://eastus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Stati Uniti orientali 2	`https://eastus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Francia centrale	`https://francecentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
India centrale	`https://centralindia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Giappone orientale	`https://japaneast.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Giappone occidentale	`https://japanwest.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Corea centrale	`https://koreacentral.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Stati Uniti centro-settentrionali	`https://northcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Europa settentrionale	`https://northeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Stati Uniti centro-meridionali	`https://southcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Asia sud-orientale	`https://southeastasia.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Regno Unito meridionale	`https://uksouth.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Europa occidentale	`https://westeurope.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Stati Uniti centro-occidentali	`https://westcentralus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
Stati Uniti occidentali	`https://westus.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`
West US 2	`https://westus2.voice.speech.microsoft.com/cognitiveservices/v1?deploymentId={deploymentId}`

Passaggi successivi

Provare la voce neurale personalizzata