Quote e limiti del servizio
Questo contenuto si applica a:v2.1 | Versione più recente:v4.0 (anteprima)
Questo articolo contiene sia un riferimento rapido che una descrizione dettagliata delle quote e dei limiti del servizio Di Intelligence per intelligenza artificiale di Azure per tutti i piani tariffari. Include anche alcune procedure consigliate per evitare la limitazione delle richieste.
Uso dei modelli
Tipi di documento supportati | Lettura | Layout | Modelli predefiniti | Modelli personalizzati | Funzionalità dei componenti aggiuntivi |
---|---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
Immagini: JPEG/JPG , PNG , BMP , TIFF , HEIF |
✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , PPTX , XLS |
✔️ | ✔️ | ✖️ | ✖️ | ✖️ |
✔️ = supportato ✖️ = Non supportato
Tipi di documento supportati | Lettura | Layout | Modelli predefiniti | Modelli personalizzati |
---|---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ | |
Immagini: JPEG/JPG , PNG , BMP , TIFF , HEIF |
✔️ | ✔️ | ✔️ | ✔️ |
Microsoft Office: DOCX , PPTX , XLS |
✔️ | ✖️ | ✖️ | ✖️ |
✔️ = supportato ✖️ = Non supportato
Obiettivo di vendita | Gratuito (F0)1 | Standard (S0) |
---|---|---|
Limite di transazioni al secondo | 1 | 15 (valore predefinito) |
Regolabili | No | Sì 2 |
Dimensioni massime del documento | 4 MB | 500 MB |
Regolabili | No | No |
Numero massimo di pagine (analisi) | 2 | 2000 |
Regolabili | No | No |
Dimensioni massime del file delle etichette | 10 MB | 10 MB |
Regolabili | No | No |
Dimensioni massime della risposta JSON del riconoscimento ottico dei caratteri (OCR) | 500 MB | 500 MB |
Regolabili | No | No |
Numero massimo di modelli | 500 | 5000 |
Regolabili | No | No |
Numero massimo di modelli neurali | 100 | 500 |
Regolabili | No | No |
Uso del modello personalizzato
Obiettivo di vendita | Gratuito (F0) 1 | Standard (S0) |
---|---|---|
Limiti al numero di modelli composti | 5 | 200 (valore predefinito) |
Regolabili | No | No |
Dimensioni del set di dati di training * Neurale | 1 GB 3 | 1 GB (valore predefinito) |
Regolabili | No | No |
Dimensioni del set di dati di training * Modello | 50 MB 4 | 50 MB (valore predefinito) |
Regolabili | No | No |
Numero massimo di pagine (training) * Modello | 500 | 500 (valore predefinito) |
Regolabili | No | No |
Numero massimo di pagine (training) * Neurale | 50,000 | 50.000 (valore predefinito) |
Regolabili | No | No |
Training del modello neurale personalizzato | 10 al mese | 20 al mese |
Regolabili | No | Sì 3 |
Numero massimo di pagine (training) * Classificatore | 10,000 | 10.000 (valore predefinito) |
Regolabili | No | No |
Numero massimo di tipi di documento (classi) * Classificatore | 500 | 500 (valore predefinito) |
Regolabili | No | No |
Dimensioni del set di dati di training * Classificatore | 1 GB | 1 GB (valore predefinito) |
Regolabili | No | No |
Numero minimo di campioni per classe * Classificatore | 5 | 5 (valore predefinito) |
Regolabili | No | No |
Limiti del modello personalizzato
Obiettivo di vendita | Gratuito (F0) 1 | Standard (S0) |
---|---|---|
Limiti al numero di modelli composti | 5 | 200 (valore predefinito) |
Regolabili | No | No |
Dimensioni del set di dati training | 50 MB | 50 MB (valore predefinito) |
Regolabili | No | No |
Numero massimo di pagine (training) | 500 | 500 (valore predefinito) |
Regolabili | No | No |
1 Per il piano tariffario Gratuito (F0), vedere anche le quote mensili nella pagina dei prezzi.
2 Vedere procedure consigliatee [istruzioni per la modifica(#create-and-submit-support-request).
3 Il numero di training dei modelli neurali viene reimpostato a ogni mese di calendario. Aprire una richiesta di supporto per aumentare il limite di training mensile.
4 Questo limite si applica a tutti i documenti presenti nella cartella del set di dati di training prima di eventuali aggiornamenti correlati all'etichettatura.
Descrizione dettagliata, modifica delle quote e procedure consigliate
Prima di richiedere un aumento della quota (se applicabile), assicurarsi che sia necessario. Il servizio Document Intelligence usa la scalabilità automatica per portare le risorse on-demand
di calcolo necessarie, mantenere i costi dei clienti bassi e effettuare il deprovisioning delle risorse inutilizzate non mantenendo una quantità eccessiva di capacità hardware.
Se l'applicazione restituisce il codice di risposta 429 (troppe richieste) e il carico di lavoro rientra nei limiti definiti: molto probabilmente, il servizio aumenta fino alla domanda, ma deve ancora raggiungere la scalabilità necessaria. Di conseguenza, il servizio non ha immediatamente risorse sufficienti per gestire la richiesta. Questo stato è temporaneo e non dovrebbe durare molto.
Procedure consigliate generali per ridurre la limitazione delle richieste durante la scalabilità automatica
Per ridurre al minimo i problemi relativi alla limitazione delle richieste (codice di risposta 429), è consigliabile usare le tecniche seguenti:
- Implementare la logica di ripetizione dei tentativi nell'applicazione
- Evitare modifiche brusche nel carico di lavoro. Aumentare gradualmente il carico di lavoro
Esempio. L'applicazione usa Document Intelligence e il carico di lavoro corrente è 10 TPS (transazioni al secondo). Il secondo successivo, si aumenta il carico a 40 TPS (ovvero quattro volte di più). Il servizio inizia immediatamente ad aumentare le risorse per soddisfare il nuovo carico, ma probabilmente non riesce a farlo entro un secondo, quindi alcune delle richieste ottengono il codice di risposta 429.
Le sezioni successive descrivono casi specifici di modifica delle quote. Passare a Document Intelligence: aumento del limite di richieste simultanee
Aumento del limite di richieste di transazioni al secondo
Per impostazione predefinita, il numero di transazioni al secondo è limitato a 15 transazioni al secondo per una risorsa di Document Intelligence. Per il piano tariffario Standard, questo limite può essere aumentato. Prima di inviare la richiesta, assicurarsi di avere familiarità con il materiale descritto in questa sezione e di conoscere queste procedure consigliate.
L'aumento del limite di richieste simultanee non influisce direttamente sui costi. Il servizio Document Intelligence usa il modello "Pagamento solo per ciò che si usa". Il limite definisce il livello di scalabilità del servizio prima di avviare la limitazione delle richieste.
Il valore esistente del parametro relativo al limite di richieste simultanee non è visibile tramite il portale di Azure, gli strumenti da riga di comando o le richieste API. Per verificare il valore esistente, creare una richiesta di supporto di Azure.
Se si intende aumentare il numero di transazioni al secondo, è possibile abilitare la scalabilità automatica per la risorsa. Leggere questo documento per abilitare il ridimensionamento automatico per la propria risorsa * Abilitare il ridimensionamento automatico. È anche possibile inviare una richiesta di supporto per incrementare il valore di TPS.
Avere a disposizione le informazioni necessarie
ID risorsa di Document Intelligence
Paese
Come ottenere informazioni (modello di base):
- Accedere al portale di Azure
- Selezionare la risorsa di Document Intelligence per cui si vuole aumentare il limite di transazioni
- Selezionare Proprietà (gruppo Gestione risorse)
- Copiare e salvare i valori dei campi seguenti:
- ID risorsa
- Posizione (area dell'endpoint)
Creare e inviare una richiesta di supporto
Per avviare l'aumento del limite di transazioni al secondo (TPS) per la risorsa, inviare la richiesta di supporto:
- Assicurarsi di avere a disposizione le informazioni necessarie
- Accedere al portale di Azure
- Selezionare la risorsa di Intelligence per i documenti per cui si vuole aumentare il limite TPS
- Selezionare Nuova richiesta di supporto (gruppo Supporto e risoluzione dei problemi)
- Viene visualizzata una nuova finestra con informazioni popolate automaticamente sulla sottoscrizione e sulla risorsa di Azure.
- Immettere Riepilogo (ad esempio"Aumentare il limite TPS di Intelligence per i documenti")
- In tipo di problema* selezionare "Convalida quota o utilizzo"
- Selezionare Avanti: Soluzioni
- Procedere con la creazione della richiesta
- Nella scheda Dettagli immettere le informazioni seguenti nel campo Descrizione:
- si noti che la richiesta riguarda la quota di Document Intelligence .
- Fornire un valore previsto di TPS che si vuole ottenere con la scalabilità.
- Informazioni sulle risorse di Azure raccolte.
- Completare l'immissione delle informazioni necessarie e selezionare il pulsante Crea nella scheda Rivedi e crea
- Prendere nota del numero della richiesta di supporto nelle notifiche del portale di Azure. Si verrà contattati a breve per un'ulteriore elaborazione
Esempio di procedura consigliata per un modello di carico di lavoro
Questo esempio illustra l'approccio che si consiglia di seguire per attenuare la possibile limitazione delle richieste dovuta all'operazione di scalabilità automatica in corso. Non si tratta di una ricetta esatta, ma semplicemente di un modello che si invita a seguire e a modificare in base alle esigenze.
Si supponga che una risorsa di Document Intelligence abbia impostato il limite predefinito. Avviare il carico di lavoro per inviare le richieste di analisi. Se si riscontra una frequente limitazione delle richieste con il codice di risposta 429, iniziare implementando un backoff esponenziale nella richiesta GET di analisi della risposta. Usando un tempo di attesa progressivamente più lungo tra i tentativi per risposte di errore consecutive, ad esempio un modello 2-5-13-34 per i ritardi tra le richieste. In generale, è consigliabile non chiamare la risposta get analyze più di una volta ogni 2 secondi per una richiesta POST corrispondente.
Se si rileva una limitazione del numero di richieste POST per i documenti inviati, provare ad aggiungere un ritardo tra le richieste. Se il carico di lavoro richiede un livello superiore di elaborazione simultanea, è necessario creare una richiesta di supporto per aumentare i limiti di servizio per il numero di transazioni al secondo.
In genere, è consigliabile testare il carico di lavoro e i modelli di carico di lavoro prima di passare all'ambiente di produzione.