Quote e limiti del Servizio cognitivo di Azure per la voce

2025-03-10

Questo articolo contiene un riferimento rapido e una descrizione dettagliata delle quote e dei limiti per il Servizio cognitivo di Azure per la voce in Servizi di Azure AI. Le informazioni sono rilevanti per tutti i piani tariffari del servizio. Contengono anche alcune procedure consigliate per evitare la limitazione delle richieste.

Per il piano tariffario gratuito (F0), consultare anche le quote mensili nella pagina prezzi.

Informazioni di riferimento su quote e limiti

Le seguenti sezioni forniscono una guida rapida alle quote e ai limiti applicabili al Servizio cognitivo di Azure per la voce.

Per informazioni sulle quote regolabili per le risorse Voce Standard (S0), consultare ulteriori spiegazioni, procedure consigliatee istruzioni di rettifica. Le quote e i limiti per le risorse Voce Gratuite (F0) non sono rettificabili.

Importante

Se si passa una risorsa di Ai Foundry per Voce dal piano tariffario Gratuito (F0) al piano tariffario Standard (S0), la modifica delle quote corrispondenti può richiedere fino a diverse ore.

Quote e limiti della conversione della voce in testo scritto per ogni risorsa

Questa sezione descrive le quote e i limiti della conversione della voce in testo scritto per ogni risorsa Voce. Se non diversamente specificato, i limiti non sono rettificabili.

Conversione della voce in testo scritto e traduzione vocale in tempo reale

È possibile usare la conversione della voce in testo scritto in tempo reale con SDK Voce o l'API REST Conversione della voce in testo scritto per audio brevi.

Importante

Questi limiti riguardano la somma delle richieste simultanee di conversione della voce in testo scritto e delle richieste di traduzione vocale in tempo reale. Ad esempio, se si hanno 60 richieste simultanee di conversione della voce in testo scritto e 40 richieste simultanee di traduzione vocale, si raggiungerà il limite di 100 richieste simultanee.

Obiettivo di vendita	Gratuito (F0)	Standard (S0)
Limite di richieste simultanee - Endpoint del modello di base	1 Questo limite non è rettificabile.	100 (valore predefinito) La frequenza è rettificabile per le risorse Standard (S0). Consultare ulteriori spiegazioni, procedure consigliate e istruzioni di rettifica.
Limite di richieste simultanee - Endpoint personalizzato	1 Questo limite non è rettificabile.	100 (valore predefinito) La frequenza è rettificabile per le risorse Standard (S0). Consultare ulteriori spiegazioni, procedure consigliate e istruzioni di rettifica.
Lunghezza massima dell'audio per la diarizzazione in tempo reale.	N/D	240 minuti per file

Trascrizione rapida

Obiettivo di vendita	Gratuito (F0)	Standard (S0)
Dimensioni massime del file di input audio	N/D	300 MB
Lunghezza massima dell’audio	N/D	120 minuti per file
Numero massimo di richieste al minuto	N/D	600

Trascrizione batch

Obiettivo di vendita	Gratuito (F0)	Standard (S0)
Limite dell'API REST per la conversione della voce in testo scritto	Non disponibile per F0	100 richieste per 10 secondi (600 richieste al minuto)
Dimensioni massime del file di input audio	N/D	1 GB
Numero massimo di BLOB per contenitore	N/D	10.000
Numero massimo di file per richiesta di trascrizione (quando si usano più URL di contenuto come input).	N/D	1000
Lunghezza massima di audio per le trascrizioni con diarizzazione abilitata.	N/D	240 minuti per file

Personalizzazione del modello

I limiti in questa tabella sono validi per ogni risorsa Voce quando si crea un modello Voce personalizzato.

Obiettivo di vendita	Gratuito (F0)	Standard (S0)
Limite dell'API REST	100 richieste per 10 secondi (600 richieste al minuto)	100 richieste per 10 secondi (600 richieste al minuto)
Numero massimo di distribuzioni di modelli personalizzati per risorsa Voce	1	50
Numero massimo di set di dati vocali	2	500
Dimensioni massime del file del set di dati acustico per l'importazione dei dati	2GB	2GB
Dimensioni massime del file del set di dati linguistico per l'importazione dei dati	200 MB	1,5 GB
Dimensioni massime del file del set di dati di pronuncia per l'importazione dei dati	1 KB	1 MB
Dimensioni massime del testo quando si usa il parametro `text` nella richiesta API Models_Create	200 kB	500 KB

Quote e limiti della sintesi vocale per ogni risorsa

Questa sezione illustra le quote e i limiti della sintesi vocale per ogni risorsa Voce.

Sintesi vocale in tempo reale

È possibile usare la sintesi vocale in tempo reale con SDK Voce o l'API REST Sintesi vocale. Se non diversamente specificato, i limiti non sono rettificabili.

Obiettivo di vendita	Gratuito (F0)	Standard (S0)
Numero massimo di transazioni per periodo di tempo per voci standard e voci personalizzate.	20 transazioni per 60 secondi Questo limite non è rettificabile.	200 transazioni al secondo (TPS) (valore predefinito) La velocità è rettificabile fino a 1000 TPS per le risorse Standard (S0). Consultare ulteriori spiegazioni, procedure consigliate e istruzioni di rettifica.
Lunghezza massima di audio prodotto per richiesta	10 minuti	10 minuti
Numero totale massimo di tag `<voice>` e `<audio>` distinti in SSML	50	50
Dimensioni massime di messaggi SSML per turno per ogni websocket	64 kB	64 kB

Sintesi batch

Questi limiti non sono rettificabili. Per ulteriori informazioni sulla latenza di sintesi batch, consultare latenza di sintesi batch e procedure consigliate.

Obiettivo di vendita	Gratuito (F0)	Standard (S0)
Limite dell'API REST	Non disponibile per F0	100 richieste ogni 10 secondi
Dimensioni massime del payload JSON per la creazione del processo di sintesi	N/D	2 megabyte
Processi di sintesi attivi simultanei	N/D	Nessun limite
Numero massimo di input di testo per processo di sintesi	N/D	10.000
Tempo massimo di vita per un processo di sintesi dal momento in cui passa allo stato finale	N/D	Fino a 31 giorni (specificato tramite le proprietà)

Voce personalizzata - Professionista

I limiti di questa tabella si applicano per ogni risorsa Voce quando si crea una voce professionale.

Obiettivo di vendita	Gratuito (F0)	Standard (S0)
Numero massimo di transazioni al secondo (TPS)	Non disponibile per F0	200 transazioni al secondo (TPS) (valore predefinito)
Numero massimo di set di dati	N/D	500
Numero massimo di caricamenti simultanei dei set di dati	N/D	5
Dimensioni massime del file di dati per l'importazione di dati per ogni set di dati	N/D	2GB
Caricamento di audio o audio lunghi senza script	N/D	Sì
Numero massimo di training di modelli simultanei	N/D	4
Numero massimo di endpoint personalizzati	N/D	50

Voce personalizzata - Voce personale

I limiti di questa tabella sono validi per ogni risorsa Voce quando si crea una voce personale.

Obiettivo di vendita	Gratuito (F0)	Standard (S0)
Limite dell'API REST (esclusa la sintesi vocale)	Non disponibile per F0	50 richieste per 10 secondi
Numero massimo di transazioni al secondo (TPS) per la sintesi vocale	Non disponibile per F0	200 transazioni al secondo (TPS) (valore predefinito)

Avatar per la sintesi vocale in batch

Obiettivo di vendita	Gratuito (F0)	Standard (S0)
Limite dell'API REST	Non disponibile per F0	2 richieste al minuto

Avatar di sintesi vocale in tempo reale

Obiettivo di vendita	Gratuito (F0)	Standard (S0)
Nuove connessioni al minuto	Non disponibile per F0	2 nuove connessioni al minuto
Durata massima della connessione con parlato	Non disponibile per F0	30 minuti¹
Durata massima della connessione con stato inattivo	Non disponibile per F0	5 minuti

¹ Per garantire il funzionamento continuo dell'avatar in tempo reale per più di 30 minuti, è possibile abilitare la riconnessione automatica. Per informazioni su come configurare la riconnessione automatica, vedere questo codice di esempio (cercare “Riconnessione automatica”).

Strumento Creazione di contenuto audio

Obiettivo di vendita	Gratuito (F0)	Standard (S0)
Dimensioni del file (testo normale in SSML)¹	3,000 caratteri per file	20,000 caratteri per file
Dimensioni file (file lessico)²	30 KB per file	100 KB per file
Caratteri fatturabili in SSML	15,000 caratteri per file	100,000 caratteri per file
Esportare nella libreria audio	1 attività simultanea	N/D

¹ Il limite riguarda solo il testo normale in SSML e non include tag.

² I caratteri del file lessico non vengono addebitati. Solo gli elementi lessico in SSML vengono conteggiati come caratteri fatturabili. Per ulteriori informazioni, consultare i caratteri fatturabili.

Quote e limiti di riconoscimento del parlante per risorsa

Il riconoscimento del parlante è limitato a 20 transazioni al secondo (TPS).

Descrizione dettagliata, rettifica delle quote e procedure consigliate

Alcune quote del servizio Voce sono rettificabili. Questa sezione fornisce ulteriori spiegazioni, procedure consigliate e istruzioni di rettifica.

Le seguenti quote sono rettificabili per risorse Standard (S0). I limiti delle richieste Gratuite (F0) non sono rettificabili.

Limite di richieste simultanee di conversione della voce in testo scritto per l'endpoint del modello di base e l'endpoint personalizzato
Numero massimo di transazioni in testo vocale per periodo di tempo per voci standard e voci personalizzate
Limite di richieste simultanee per la traduzione vocale

Prima di richiedere un aumento della quota (se applicabile), controllare il valore TPS (transazioni al secondo) corrente e assicurarsi che sia necessario aumentare la quota. Il servizio cognitivo di Azure per la voce usa tecnologie di scalabilità automatica per portare le risorse di calcolo necessarie in modalità on demand. Allo stesso tempo, il servizio cognitivo di Azure per la voce tenta di tenere bassi i costi non mantenendo una quantità eccessiva di capacità hardware.

Di seguito è descritto un esempio. Si supponga che l'applicazione riceva il codice di risposta 429, che indica la presenza di troppe richieste. L'applicazione riceve questa risposta sebbene il carico di lavoro rientri nei limiti definiti dal Riferimento quote e limiti. La spiegazione più probabile è che il servizio cognitivo di Azure per la voce stia aumentando la propria scalabilità per poter soddisfare la domanda e non abbia ancora raggiunto la scalabilità necessaria. Di conseguenza, il servizio non dispone immediatamente di risorse sufficienti per gestire la richiesta. In questi casi, l'aumento della quota non sarà utile. Nella maggior parte dei casi, le prestazioni del servizio Voce verranno aumentate presto e il problema che causa il codice di risposta 429 verrà risolto.

Procedure consigliate generali per attenuare la limitazione durante la scalabilità automatica

Per ridurre al minimo i problemi relativi alla limitazione, è consigliabile usare le seguenti tecniche:

Implementare la logica di ripetizione dei tentativi nell'applicazione.
Evitare modifiche brusche nel carico di lavoro. Aumentare gradualmente il carico di lavoro. Si supponga, ad esempio, che l'applicazione stia usando la sintesi vocale e che il carico di lavoro corrente sia 5 TPS. Il secondo successivo, si aumenta il carico a 20 TPS (ovvero quattro volte di più). Il servizio cognitivo di Azure per la voce comincia immediatamente ad aumentare la scalabilità per soddisfare il nuovo carico, ma non è in grado di farlo entro un secondo. Alcune richieste ottengono il codice di risposta 429 (troppe richieste).
Testare modelli di aumento del carico diversi. Per ulteriori informazioni, consultare l'esempio di criterio del carico di lavoro.
Creare altre risorse del servizio cognitivo di Azure per la voce in aree diverse e distribuirne il carico di lavoro. La creazione di più risorse del servizio cognitivo di Azure per la voce nella stessa area non influisce sulle prestazioni, poiché tutte le risorse vengono gestite dallo stesso cluster back-end.

Le sezioni successive descrivono casi specifici di rettifica delle quote.

Conversione della voce in testo scritto: aumentare il limite di richieste simultanee per la conversione della voce in testo scritto

Per impostazione predefinita, la somma di richieste simultanee di conversione della voce in testo scritto e di traduzione vocale è limitata a 100 per risorsa nel modello di base e 100 per endpoint personalizzato nel modello personalizzato. È possibile aumentare questo numero per il piano tariffario standard. Prima di inviare la richiesta, assicurarsi di avere familiarità con il materiale descritto in precedenza in questo articolo, ad esempio le procedure consigliate per attenuare la limitazione.

Nota

I limiti di richieste simultanee per i modelli di base e per quelli personalizzati devono essere rettificati separatamente. È possibile che una risorsa del servizio cognitivo di Azure per la voce sia associata a molti endpoint personalizzati che ospitano molte distribuzioni di modelli personalizzati. In base alle esigenze, le rettifiche del limite per ogni endpoint personalizzato devono essere richieste separatamente.

L'aumento del limite di richieste simultanee non influisce direttamente sui costi. Il modello di pagamento del servizio cognitivo di Azure per la voce richiede di pagare esclusivamente per quanto usato. Il limite definisce il livello di scalabilità del servizio prima che inizi la limitazione delle richieste.

Il valore esistente del parametro limite di richieste simultanee non è visibile tramite il portale di Azure, gli strumenti da riga di comando o le richieste API. Per verificare il valore esistente, creare una richiesta di supporto di Azure.

Nota

I contenitori Voce non richiedono un aumento del limite di richieste simultanee, poiché sono vincolati solo dalle CPU dell'hardware in cui sono ospitati. Tuttavia, i contenitori Voce, presentano limitazioni di capacità specifiche che devono essere prese in considerazione. Per ulteriori informazioni, consultare Domande frequenti sui contenitori Voce.

Preparare le informazioni necessarie

Per il modello di base:
- ID risorsa Voce
- Area
Per il modello personalizzato:
- Area
- ID endpoint personalizzato

Come ottenere informazioni per il modello di base:

Vai al portale di Azure.
Selezionare la risorsa del servizio cognitivo di Azure per la voce per la quale si vuole aumentare o controllare il limite di richieste simultanee.
Nel gruppo Gestione risorse, selezionare Proprietà.
Copiare e salvare i valori dei seguenti campi:
- ID risorsa
- Posizione (area dell'endpoint)

Come ottenere informazioni per il modello personalizzato:

Passare al portale di Speech Studio.
Accedere, se necessario, e passare a Servizio Voce personalizzato.
Selezionare il progetto e passare a Distribuzione.
Selezionare l'endpoint richiesto.
Copiare e salvare i valori dei seguenti campi:
- Area del servizio (area dell'endpoint)
- ID endpoint

Creare e inviare una richiesta di supporto

Avviare l'aumento del limite di richieste simultanee per la risorsa o, se necessario, controllare il limite corrente inviando una richiesta di supporto. In tal caso, eseguire la procedura seguente:

Assicurarsi di avere le informazioni necessarie elencate nella sezione precedente.
Vai al portale di Azure.
Selezionare la risorsa del servizio cognitivo di Azure per la voce per la quale si vuole aumentare (o controllare) il limite di richieste simultanee.
Nel gruppo Supporto e risoluzione dei problemi, selezionare Nuova richiesta di supporto. Verrà visualizzata una nuova finestra con informazioni popolate automaticamente sulla sottoscrizione e sulla risorsa di Azure.
In Riepilogo, descrivere l’azione desiderata (ad esempio, "Aumentare il limite di richieste simultanee per la conversione della voce in testo scritto").
In Tipo di problema, selezionare Problemi relativi a quota o sottoscrizione.
In Sottotipo problema, selezionare:
- Aumento della quota o del numero di richieste simultanee per effettuare una richiesta di aumento.
- Convalida della quota o dell'utilizzo per controllare il limite esistente.
Selezionare Avanti: Soluzioni. Procedere con la creazione della richiesta.
Nella scheda Dettagli, immettere quanto segue nel campo Descrizione:
- Notare che la richiesta riguarda la quota di conversione della voce in testo scritto.
- Scegliere il modello di base o quello personalizzato.
- Informazioni sulle risorse di Azure raccolte in precedenza.
- Qualsiasi altra informazione richiesta.
Nella scheda Rivedi e crea selezionare Crea.
Prendere nota del numero della richiesta di supporto nelle notifiche del portale di Azure. Si verrà contattati a breve in proposito alla richiesta.

Esempio di procedura consigliata per il criterio di carico di lavoro

Ecco un esempio generale di un buon approccio da adottare. Questo esempio è inteso solo come modello che è possibile modificare in base alle proprie esigenze.

Si supponga che una risorsa del servizio cognitivo di Azure per la voce abbia il limite di richieste simultanee impostato su 300. Avviare il carico di lavoro da 20 connessioni simultanee e aumentare il carico di 20 connessioni simultanee ogni 90-120 secondi. Controllare le risposte del servizio e implementare la logica che esegue il fallback (riduce il carico) se si ottengono troppe richieste (codice di risposta 429). Ripetere quindi l'aumento del carico dopo un minuto e, se questo non dovesse funzionare, riprovare dopo due minuti. Usare un criterio di 1-2-4-4 minuti per gli intervalli.

In genere, è consigliabile testare il carico di lavoro e i criteri di carico di lavoro prima di passare alla produzione.

Sintesi vocale: aumentare il limite di richieste simultanee

È possibile aumentare questo numero per il piano tariffario standard. Prima di inviare la richiesta, assicurarsi di avere familiarità con il materiale descritto in precedenza in questo articolo, ad esempio le procedure consigliate per attenuare la limitazione.

Nota

I contenitori Voce non richiedono un aumento del limite di richieste simultanee, poiché sono vincolati solo dalle CPU dell'hardware in cui sono ospitati.

Preparare le informazioni necessarie

Per creare una richiesta di aumento, è necessario fornire le proprie informazioni.

Per la voce standard:
- ID risorsa Voce
- Area
Per la voce personalizzata:
- Area di distribuzione
- ID endpoint personalizzato

Come ottenere informazioni per la voce standard:

Vai al portale di Azure.
Selezionare la risorsa del servizio cognitivo di Azure per la voce per la quale si vuole aumentare o controllare il limite di richieste simultanee.
Nel gruppo Gestione risorse, selezionare Proprietà.
Copiare e salvare i valori dei seguenti campi:
- ID risorsa
- Posizione (area dell'endpoint)

Come ottenere informazioni per la voce personalizzata:

Passare al portale di Speech Studio.
Accedere, se necessario, e passare a Voce personalizzata.
Selezionare il progetto e passare a Distribuisci modello.
Selezionare l'endpoint richiesto.
Copiare e salvare i valori dei seguenti campi:
- Area del servizio (area dell'endpoint)
- ID endpoint

Creare e inviare una richiesta di supporto

Avviare l'aumento del limite di richieste simultanee per la risorsa o, se necessario, controllare il limite corrente inviando una richiesta di supporto. In tal caso, eseguire la procedura seguente:

Assicurarsi di avere le informazioni necessarie elencate nella sezione precedente.
Vai al portale di Azure.
Selezionare la risorsa del servizio cognitivo di Azure per la voce per la quale si vuole aumentare (o controllare) il limite di richieste simultanee.
Nel gruppo Supporto e risoluzione dei problemi, selezionare Nuova richiesta di supporto. Verrà visualizzata una nuova finestra con informazioni popolate automaticamente sulla sottoscrizione e sulla risorsa di Azure.
In Riepilogo, descrivere l’azione desiderata (ad esempio, "Aumentare il limite di richieste simultanee per la sintesi vocale").
In Tipo di problema, selezionare Problemi relativi a quota o sottoscrizione.
In Sottotipo problema, selezionare:
- Aumento della quota o del numero di richieste simultanee per effettuare una richiesta di aumento.
- Convalida della quota o dell'utilizzo per controllare il limite esistente.
Nella scheda Soluzione consigliata, selezionare Avanti.
Nella scheda Dettagli aggiuntivi, compilare tutti gli elementi necessari. Nel campo Dettagli, immettere quanto segue:
- Notare che la richiesta riguarda la quota di sintesi vocale.
- Scegliere la voce standard o la voce personalizzata.
- Informazioni sulle risorse di Azure raccolte in precedenza.
- Qualsiasi altra informazione richiesta.
Nella scheda Rivedi e crea selezionare Crea.
Prendere nota del numero della richiesta di supporto nelle notifiche del portale di Azure. Si verrà contattati a breve in proposito alla richiesta.

Avatar di sintesi vocale: aumentare il limite delle nuove connessioni

Per aumentare il limite delle nuove connessioni al minuto per l'avatar di sintesi vocale, contattare il rappresentante di vendita e creare un ticket con le informazioni seguenti:

URI risorsa Voce
Richiesta di un nuovo limite per l’aumento a
Giustificazione per l'aumento
Data di inizio dell'aumento
Data di fine dell'aumento
Avatar standard o avatar personalizzato

Condividi tramite

Quote e limiti del Servizio cognitivo di Azure per la voce

Informazioni di riferimento su quote e limiti

Quote e limiti della conversione della voce in testo scritto per ogni risorsa

Conversione della voce in testo scritto e traduzione vocale in tempo reale

Trascrizione rapida

Trascrizione batch

Personalizzazione del modello

Quote e limiti della sintesi vocale per ogni risorsa

Sintesi vocale in tempo reale

Sintesi batch

Voce personalizzata - Professionista

Voce personalizzata - Voce personale

Avatar per la sintesi vocale in batch

Avatar di sintesi vocale in tempo reale

Strumento Creazione di contenuto audio

Quote e limiti di riconoscimento del parlante per risorsa

Descrizione dettagliata, rettifica delle quote e procedure consigliate

Procedure consigliate generali per attenuare la limitazione durante la scalabilità automatica

Conversione della voce in testo scritto: aumentare il limite di richieste simultanee per la conversione della voce in testo scritto

Preparare le informazioni necessarie

Creare e inviare una richiesta di supporto

Esempio di procedura consigliata per il criterio di carico di lavoro

Sintesi vocale: aumentare il limite di richieste simultanee

Preparare le informazioni necessarie

Creare e inviare una richiesta di supporto

Avatar di sintesi vocale: aumentare il limite delle nuove connessioni

Commenti e suggerimenti

Risorse aggiuntive