Custom neural voice lite (anteprima)

Articolo
01/18/2024

Speech Studio offre due tipi di progetto CNV (Neural Voice) personalizzati: CNV lite e CNV professional.

Il professionista CNV (Custom Neural Voice) consente di caricare i dati di training raccolti tramite studi di registrazione professionali e di creare una voce di qualità superiore quasi indistinguibile dai campioni umani. L'accesso professionale CNV è limitato in base ai criteri di idoneità e utilizzo. Richiedere l'accesso nel modulo di assunzione.
L'opzione CNV (Custom Neural Voice) è un tipo di progetto in anteprima pubblica. È possibile demore e valutare la voce neurale personalizzata prima di investire in registrazioni professionali per creare una voce di qualità superiore. Non è necessaria alcuna applicazione. Microsoft limita e seleziona i campioni di registrazione e test da usare con CNV lite. È necessario richiedere l'accesso completo ai professionisti CNV per distribuire e usare il modello lite CNV per scopi aziendali.

Con un progetto lite CNV, si registra la voce online leggendo 20-50 script predefiniti forniti da Microsoft. Dopo aver registrato almeno 20 campioni, è possibile iniziare a eseguire il training di un modello. Dopo aver completato il training del modello, è possibile esaminare il modello ed esaminare 20 esempi di output prodotti con un altro set di script predefiniti.

Vedere le lingue supportate per la voce neurale personalizzata.

Confrontare i tipi di progetto

La tabella seguente riepiloga le differenze principali tra i tipi di progetto professionale CNV lite e CNV.

Articoli	Lite (anteprima)	Pro
Scenari di destinazione	Dimostrazione o valutazione	Scenari professionali come le voci di marca e carattere per i chatbot o la lettura di contenuti audio.
Dati di training	Registrare online con Speech Studio	Bring your own data (Bring Your Own Data). È consigliabile registrare in uno studio professionale.
Script per la registrazione	Fornito in Speech Studio	Usare script personalizzati che corrispondano allo scenario del caso d'uso. Microsoft fornisce script di esempio per riferimento.
Dimensioni dei dati necessarie	20-50 espressioni	300-2000 espressioni
Tempo di addestramento	Meno di un'ora di calcolo	Circa 20-40 ore di calcolo
Qualità vocale	Qualità moderata	Qualità elevata
Disponibilità	Chiunque può registrare campioni online ed eseguire il training di un modello a scopo dimostrativo e di valutazione. Se si vuole distribuire il modello lite CNV per l'uso aziendale, è necessario l'accesso completo alla voce neurale personalizzata.	Il caricamento dei dati non è limitato, ma è possibile eseguire il training e distribuire un modello professionale CNV solo dopo l'approvazione dell'accesso. L'accesso professionale CNV è limitato in base ai criteri di idoneità e utilizzo. Richiedere l'accesso nel modulo di assunzione.
Prezzi	I prezzi per unità si applicano allo stesso modo per i progetti professionali CNV lite e CNV. Controllare i dettagli dei prezzi qui.	I prezzi per unità si applicano allo stesso modo per i progetti professionali CNV lite e CNV. Controllare i dettagli dei prezzi qui.

Creare un progetto neural voice lite personalizzato

Per creare un progetto neural voice lite personalizzato, seguire questa procedura:

Accedere a Speech Studio.
Selezionare la sottoscrizione e la risorsa Voce da usare.

Importante

Il training vocale neurale personalizzato è attualmente disponibile solo in alcune aree. Per altre informazioni, vedere note a piè di pagina nella tabella delle aree .
Selezionare Voce personalizzata>Crea un progetto.
Selezionare Custom neural voice lite Next (Voce neurale personalizzata lite).>

Nota

Per creare un progetto Neural Voice Pro personalizzato, vedere Creare un progetto per la voce neurale personalizzata.
Seguire le istruzioni fornite dalla procedura guidata per creare il progetto.
Selezionare il nuovo progetto in base al nome o selezionare Vai al progetto. Queste voci di menu vengono visualizzate nel pannello sinistro: Registra e compila, Rivedi modello e Distribuisci modello.

Il progetto lite CNV scade dopo 90 giorni, a meno che non venga inviata la dichiarazione verbale registrata dal voice talent.

Registrare e compilare un modello lite CNV

Registrare almeno 20 campioni vocali (fino a 50) con script forniti online. Gli esempi vocali registrati qui vengono usati per creare una versione sintetica della voce.

Ecco alcuni suggerimenti utili per registrare gli esempi vocali:

Usa un buon microfono. Aumentare la chiarezza dei campioni usando un microfono di alta qualità. Parla di circa 8 pollici di distanza dal microfono per evitare rumori della bocca.
Evitare il rumore di fondo. Registra in una stanza tranquilla senza rumore di fondo o eco.
Rilassarsi e parlare naturalmente. Permettetevi di esprimere emozioni mentre leggete le frasi.
Registra in un'unica operazione. Per mantenere un livello di energia coerente, registrare tutte le frasi in una sessione.
Pronunciare ogni parola correttamente e parlare chiaramente.

Per registrare e compilare un modello lite CNV, seguire questa procedura:

Selezionare Voce personalizzata> Nome progetto >Record e compilazione.
Seleziona Inizia.
Leggere attentamente le condizioni per i talenti vocali. Selezionare la casella di controllo per confermare le condizioni per l'utilizzo.
Selezionare Accetta
Premere l'icona del microfono per avviare il controllo del rumore. Questo controllo rumore richiede solo pochi secondi e non è necessario parlare durante di esso.
Se il rumore è stato rilevato, è possibile selezionare di nuovo Controlla per ripetere il controllo del rumore. Se non è stato rilevato alcun rumore, è possibile selezionare Fine per procedere al passaggio successivo.
Esaminare i suggerimenti per la registrazione e selezionare Ottenuto. Per ottenere risultati ottimali, passare a un'area tranquilla senza rumore di fondo prima di registrare i campioni vocali.
Premere l'icona del microfono per avviare la registrazione.
Premere l'icona di arresto per arrestare la registrazione.
Esaminare le metriche di qualità. Dopo aver registrato ogni esempio, controllare la metrica di qualità prima di continuare con quella successiva.
Registrare altri esempi. Sebbene sia possibile creare un modello con solo 20 campioni, è consigliabile registrare fino a 50 per ottenere una migliore qualità.
Selezionare Train model (Esegui training modello ) per avviare il processo di training.

Il processo di training richiede circa un'ora di calcolo. È possibile controllare lo stato del processo di training nella pagina Rivedi modello .

Esaminare il modello

Per esaminare il modello lite CNV e ascoltare la propria voce sintetica, seguire questa procedura:

Selezionare Voce personalizzata> Nome progetto >Rivedi modello. Qui è possibile esaminare il nome del modello vocale, la lingua del modello, le dimensioni dei dati di esempio e lo stato di training. Il nome della voce è composto dalla parola "Neural" aggiunta al nome del progetto.
Selezionare il nome del modello vocale per esaminare i dettagli del modello e ascoltare il testo di esempio per i risultati vocali.
Selezionare l'icona di riproduzione per ascoltare la voce parla ogni script.

Inviare un'istruzione verbale

Prima di poter distribuire il modello per l'uso aziendale, è necessario un'istruzione verbale registrata dal voice talent.

Per inviare l'istruzione verbale di voice talent, seguire questa procedura:

Selezionare Voce personalizzata> Il nome >del progetto Deploy model (Distribuisci modello>) Manage your voice talent (Gestisci il voice talent).
Seleziona il modello.
Immettere il nome del voice talent e il nome della società.
Leggere e registrare l'istruzione . Selezionare l'icona del microfono per avviare la registrazione. Selezionare l'icona di arresto per arrestare la registrazione.
Selezionare Invia per inviare l'istruzione.
Controllare lo stato di elaborazione nella tabella script nella parte inferiore del dashboard. Dopo aver completato lo stato, è possibile distribuire il modello.

Distribuire un modello

Per distribuire il modello vocale e usarlo nelle applicazioni, è necessario ottenere l'accesso completo alla voce neurale personalizzata. Richiedere l'accesso nel modulo di assunzione. Entro circa 10 giorni lavorativi, si riceve un messaggio di posta elettronica con lo stato di approvazione. Prima di poter distribuire il modello per l'uso aziendale, è necessaria anche un'istruzione verbale registrata dal voice talent.

Per distribuire un modello lite CNV, seguire questa procedura:

Selezionare Voce personalizzata> Nome progetto> Deploy model Deploy model (Distribuisci modello>).
Selezionare un nome di modello vocale e quindi selezionare Avanti.
Immettere un nome e una descrizione per l'endpoint e quindi selezionare Avanti.
Selezionare la casella di controllo per accettare le condizioni per l'utilizzo e quindi selezionare Avanti.
Selezionare Distribuisci per distribuire il modello.

Da qui è possibile usare il modello di voce lite CNV in modo analogo a quello usato da un modello di voce professionale CNV. Ad esempio, è possibile sospendere o riprendere un endpoint dopo la creazione, per limitare la spesa e risparmiare risorse che non sono in uso. È anche possibile accedere alla voce nello strumento Creazione contenuto audio in Speech Studio.

Condividi tramite