Quote e limiti del servizio

Articolo
05/08/2024

Questo contenuto si applica a:v4.0 (anteprima) | Versioni precedenti:v3.1 (GA)v3.0 (GA)

Questo contenuto si applica a:v2.1 | Versione più recente:v4.0 (anteprima)

Questo articolo contiene sia un riferimento rapido che una descrizione dettagliata delle quote e dei limiti del servizio Di Intelligence per intelligenza artificiale di Azure per tutti i piani tariffari. Include anche alcune procedure consigliate per evitare la limitazione delle richieste.

Uso dei modelli

Tipi di documento supportati	Lettura	Layout	Modelli predefiniti	Modelli personalizzati	Funzionalità dei componenti aggiuntivi
PDF	✔️	✔️	✔️	✔️	✔️
Immagini: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️	✔️	✖️	✖️	✖️

✔️ = supportato ✖️ = Non supportato

Tipi di documento supportati	Lettura	Layout	Modelli predefiniti	Modelli personalizzati
PDF	✔️	✔️	✔️	✔️
Immagini: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️	✖️	✖️	✖️

✔️ = supportato ✖️ = Non supportato

Obiettivo di vendita	Gratuito (F0)¹	Standard (S0)
Limite di transazioni al secondo	1	15 (valore predefinito)
Regolabili	No	Sì ²
Dimensioni massime del documento	4 MB	500 MB
Regolabili	No	No
Numero massimo di pagine (analisi)	2	2000
Regolabili	No	No
Dimensioni massime del file delle etichette	10 MB	10 MB
Regolabili	No	No
Dimensioni massime della risposta JSON del riconoscimento ottico dei caratteri (OCR)	500 MB	500 MB
Regolabili	No	No
Numero massimo di modelli	500	5000
Regolabili	No	No
Numero massimo di modelli neurali	100	500
Regolabili	No	No

Uso del modello personalizzato

Obiettivo di vendita	Gratuito (F0) ¹	Standard (S0)
Limiti al numero di modelli composti	5	200 (valore predefinito)
Regolabili	No	No
*Dimensioni del set di dati di training Neurale**	1 GB ³	1 GB (valore predefinito)
Regolabili	No	No
*Dimensioni del set di dati di training Modello**	50 MB ⁴	50 MB (valore predefinito)
Regolabili	No	No
*Numero massimo di pagine (training) Modello**	500	500 (valore predefinito)
Regolabili	No	No
*Numero massimo di pagine (training) Neurale**	50,000	50.000 (valore predefinito)
Regolabili	No	No
Training del modello neurale personalizzato	10 al mese	20 al mese
Regolabili	No	Sì ³
*Numero massimo di pagine (training) Classificatore**	10,000	10.000 (valore predefinito)
Regolabili	No	No
*Numero massimo di tipi di documento (classi) Classificatore**	500	500 (valore predefinito)
Regolabili	No	No
*Dimensioni del set di dati di training Classificatore**	1 GB	1 GB (valore predefinito)
Regolabili	No	No
*Numero minimo di campioni per classe Classificatore**	5	5 (valore predefinito)
Regolabili	No	No

Limiti del modello personalizzato

Obiettivo di vendita	Gratuito (F0) ¹	Standard (S0)
Limiti al numero di modelli composti	5	200 (valore predefinito)
Regolabili	No	No
Dimensioni del set di dati training	50 MB	50 MB (valore predefinito)
Regolabili	No	No
Numero massimo di pagine (training)	500	500 (valore predefinito)
Regolabili	No	No

¹ Per il piano tariffario Gratuito (F0), vedere anche le quote mensili nella pagina dei prezzi.
² Vedere procedure consigliatee [istruzioni per la modifica(#create-and-submit-support-request).
³ Il numero di training dei modelli neurali viene reimpostato a ogni mese di calendario. Aprire una richiesta di supporto per aumentare il limite di training mensile.

⁴ Questo limite si applica a tutti i documenti presenti nella cartella del set di dati di training prima di eventuali aggiornamenti correlati all'etichettatura.

Descrizione dettagliata, modifica delle quote e procedure consigliate

Prima di richiedere un aumento della quota (se applicabile), assicurarsi che sia necessario. Il servizio Document Intelligence usa la scalabilità automatica per portare le risorse on-demanddi calcolo necessarie, mantenere i costi dei clienti bassi e effettuare il deprovisioning delle risorse inutilizzate non mantenendo una quantità eccessiva di capacità hardware.

Se l'applicazione restituisce il codice di risposta 429 (troppe richieste) e il carico di lavoro rientra nei limiti definiti: molto probabilmente, il servizio aumenta fino alla domanda, ma deve ancora raggiungere la scalabilità necessaria. Di conseguenza, il servizio non ha immediatamente risorse sufficienti per gestire la richiesta. Questo stato è temporaneo e non dovrebbe durare molto.

Procedure consigliate generali per ridurre la limitazione delle richieste durante la scalabilità automatica

Per ridurre al minimo i problemi relativi alla limitazione delle richieste (codice di risposta 429), è consigliabile usare le tecniche seguenti:

Implementare la logica di ripetizione dei tentativi nell'applicazione
Evitare modifiche brusche nel carico di lavoro. Aumentare gradualmente il carico di lavoro
Esempio. L'applicazione usa Document Intelligence e il carico di lavoro corrente è 10 TPS (transazioni al secondo). Il secondo successivo, si aumenta il carico a 40 TPS (ovvero quattro volte di più). Il servizio inizia immediatamente ad aumentare le risorse per soddisfare il nuovo carico, ma probabilmente non riesce a farlo entro un secondo, quindi alcune delle richieste ottengono il codice di risposta 429.

Le sezioni successive descrivono casi specifici di modifica delle quote. Passare a Document Intelligence: aumento del limite di richieste simultanee

Aumento del limite di richieste di transazioni al secondo

Per impostazione predefinita, il numero di transazioni al secondo è limitato a 15 transazioni al secondo per una risorsa di Document Intelligence. Per il piano tariffario Standard, questo limite può essere aumentato. Prima di inviare la richiesta, assicurarsi di avere familiarità con il materiale descritto in questa sezione e di conoscere queste procedure consigliate.

L'aumento del limite di richieste simultanee non influisce direttamente sui costi. Il servizio Document Intelligence usa il modello "Pagamento solo per ciò che si usa". Il limite definisce il livello di scalabilità del servizio prima di avviare la limitazione delle richieste.

Il valore esistente del parametro relativo al limite di richieste simultanee non è visibile tramite il portale di Azure, gli strumenti da riga di comando o le richieste API. Per verificare il valore esistente, creare una richiesta di supporto di Azure.

Se si intende aumentare il numero di transazioni al secondo, è possibile abilitare la scalabilità automatica per la risorsa. Leggere questo documento per abilitare il ridimensionamento automatico per la propria risorsa * Abilitare il ridimensionamento automatico. È anche possibile inviare una richiesta di supporto per incrementare il valore di TPS.

Avere a disposizione le informazioni necessarie

ID risorsa di Document Intelligence
Paese
Come ottenere informazioni (modello di base):
- Accedere al portale di Azure
- Selezionare la risorsa di Document Intelligence per cui si vuole aumentare il limite di transazioni
- Selezionare Proprietà (gruppo Gestione risorse)
- Copiare e salvare i valori dei campi seguenti:
  - ID risorsa
  - Posizione (area dell'endpoint)

Creare e inviare una richiesta di supporto

Per avviare l'aumento del limite di transazioni al secondo (TPS) per la risorsa, inviare la richiesta di supporto:

Assicurarsi di avere a disposizione le informazioni necessarie
Accedere al portale di Azure
Selezionare la risorsa di Intelligence per i documenti per cui si vuole aumentare il limite TPS
Selezionare Nuova richiesta di supporto (gruppo Supporto e risoluzione dei problemi)
Viene visualizzata una nuova finestra con informazioni popolate automaticamente sulla sottoscrizione e sulla risorsa di Azure.
Immettere Riepilogo (ad esempio"Aumentare il limite TPS di Intelligence per i documenti")
In tipo di problema* selezionare "Convalida quota o utilizzo"
Selezionare Avanti: Soluzioni
Procedere con la creazione della richiesta
Nella scheda Dettagli immettere le informazioni seguenti nel campo Descrizione:
- si noti che la richiesta riguarda la quota di Document Intelligence .
- Fornire un valore previsto di TPS che si vuole ottenere con la scalabilità.
- Informazioni sulle risorse di Azure raccolte.
- Completare l'immissione delle informazioni necessarie e selezionare il pulsante Crea nella scheda Rivedi e crea
- Prendere nota del numero della richiesta di supporto nelle notifiche del portale di Azure. Si verrà contattati a breve per un'ulteriore elaborazione

Esempio di procedura consigliata per un modello di carico di lavoro

Questo esempio illustra l'approccio che si consiglia di seguire per attenuare la possibile limitazione delle richieste dovuta all'operazione di scalabilità automatica in corso. Non si tratta di una ricetta esatta, ma semplicemente di un modello che si invita a seguire e a modificare in base alle esigenze.

Si supponga che una risorsa di Document Intelligence abbia impostato il limite predefinito. Avviare il carico di lavoro per inviare le richieste di analisi. Se si riscontra una frequente limitazione delle richieste con il codice di risposta 429, iniziare implementando un backoff esponenziale nella richiesta GET di analisi della risposta. Usando un tempo di attesa progressivamente più lungo tra i tentativi per risposte di errore consecutive, ad esempio un modello 2-5-13-34 per i ritardi tra le richieste. In generale, è consigliabile non chiamare la risposta get analyze più di una volta ogni 2 secondi per una richiesta POST corrispondente.

Se si rileva una limitazione del numero di richieste POST per i documenti inviati, provare ad aggiungere un ritardo tra le richieste. Se il carico di lavoro richiede un livello superiore di elaborazione simultanea, è necessario creare una richiesta di supporto per aumentare i limiti di servizio per il numero di transazioni al secondo.

In genere, è consigliabile testare il carico di lavoro e i modelli di carico di lavoro prima di passare all'ambiente di produzione.

Passaggi successivi

Informazioni sui codici errore e sulla risoluzione dei problemi