Quote e limiti del servizio

Questo contenuto si applica a:segno di spuntav4.0 (anteprima) | Versioni precedenti:segno di spunta bluv3.1 (GA)segno di spunta bluv3.0 (GA)

Questo contenuto si applica a:segno di spuntav2.1 | Versione più recente:segno di spunta bluv4.0 (anteprima)

Questo articolo contiene sia un riferimento rapido che una descrizione dettagliata delle quote e dei limiti del servizio Di Intelligence per intelligenza artificiale di Azure per tutti i piani tariffari. Include anche alcune procedure consigliate per evitare la limitazione delle richieste.

Uso dei modelli

Tipi di documento supportati Lettura Layout Modelli predefiniti Modelli personalizzati Funzionalità dei componenti aggiuntivi
PDF ✔️ ✔️ ✔️ ✔️ ✔️
Immagini: JPEG/JPG, PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️ ✔️
Microsoft Office: DOCX, PPTX, XLS ✔️ ✔️ ✖️ ✖️ ✖️

✔️ = supportato ✖️ = Non supportato

Tipi di documento supportati Lettura Layout Modelli predefiniti Modelli personalizzati
PDF ✔️ ✔️ ✔️ ✔️
Immagini: JPEG/JPG, PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️
Microsoft Office: DOCX, PPTX, XLS ✔️ ✖️ ✖️ ✖️

✔️ = supportato ✖️ = Non supportato

Obiettivo di vendita Gratuito (F0)1 Standard (S0)
Limite di transazioni al secondo 1 15 (valore predefinito)
Regolabili No 2
Dimensioni massime del documento 4 MB 500 MB
Regolabili No No
Numero massimo di pagine (analisi) 2 2000
Regolabili No No
Dimensioni massime del file delle etichette 10 MB 10 MB
Regolabili No No
Dimensioni massime della risposta JSON del riconoscimento ottico dei caratteri (OCR) 500 MB 500 MB
Regolabili No No
Numero massimo di modelli 500 5000
Regolabili No No
Numero massimo di modelli neurali 100 500
Regolabili No No

Uso del modello personalizzato

Obiettivo di vendita Gratuito (F0) 1 Standard (S0)
Limiti al numero di modelli composti 5 200 (valore predefinito)
Regolabili No No
Dimensioni del set di dati di training * Neurale 1 GB 3 1 GB (valore predefinito)
Regolabili No No
Dimensioni del set di dati di training * Modello 50 MB 4 50 MB (valore predefinito)
Regolabili No No
Numero massimo di pagine (training) * Modello 500 500 (valore predefinito)
Regolabili No No
Numero massimo di pagine (training) * Neurale 50,000 50.000 (valore predefinito)
Regolabili No No
Training del modello neurale personalizzato 10 al mese 20 al mese
Regolabili No 3
Numero massimo di pagine (training) * Classificatore 10,000 10.000 (valore predefinito)
Regolabili No No
Numero massimo di tipi di documento (classi) * Classificatore 500 500 (valore predefinito)
Regolabili No No
Dimensioni del set di dati di training * Classificatore 1 GB 1 GB (valore predefinito)
Regolabili No No
Numero minimo di campioni per classe * Classificatore 5 5 (valore predefinito)
Regolabili No No

Limiti del modello personalizzato

Obiettivo di vendita Gratuito (F0) 1 Standard (S0)
Limiti al numero di modelli composti 5 200 (valore predefinito)
Regolabili No No
Dimensioni del set di dati training 50 MB 50 MB (valore predefinito)
Regolabili No No
Numero massimo di pagine (training) 500 500 (valore predefinito)
Regolabili No No

1 Per il piano tariffario Gratuito (F0), vedere anche le quote mensili nella pagina dei prezzi.
2 Vedere procedure consigliatee [istruzioni per la modifica(#create-and-submit-support-request).
3 Il numero di training dei modelli neurali viene reimpostato a ogni mese di calendario. Aprire una richiesta di supporto per aumentare il limite di training mensile.

4 Questo limite si applica a tutti i documenti presenti nella cartella del set di dati di training prima di eventuali aggiornamenti correlati all'etichettatura.

Descrizione dettagliata, modifica delle quote e procedure consigliate

Prima di richiedere un aumento della quota (se applicabile), assicurarsi che sia necessario. Il servizio Document Intelligence usa la scalabilità automatica per portare le risorse on-demanddi calcolo necessarie, mantenere i costi dei clienti bassi e effettuare il deprovisioning delle risorse inutilizzate non mantenendo una quantità eccessiva di capacità hardware.

Se l'applicazione restituisce il codice di risposta 429 (troppe richieste) e il carico di lavoro rientra nei limiti definiti: molto probabilmente, il servizio aumenta fino alla domanda, ma deve ancora raggiungere la scalabilità necessaria. Di conseguenza, il servizio non ha immediatamente risorse sufficienti per gestire la richiesta. Questo stato è temporaneo e non dovrebbe durare molto.

Procedure consigliate generali per ridurre la limitazione delle richieste durante la scalabilità automatica

Per ridurre al minimo i problemi relativi alla limitazione delle richieste (codice di risposta 429), è consigliabile usare le tecniche seguenti:

  • Implementare la logica di ripetizione dei tentativi nell'applicazione
  • Evitare modifiche brusche nel carico di lavoro. Aumentare gradualmente il carico di lavoro
    Esempio. L'applicazione usa Document Intelligence e il carico di lavoro corrente è 10 TPS (transazioni al secondo). Il secondo successivo, si aumenta il carico a 40 TPS (ovvero quattro volte di più). Il servizio inizia immediatamente ad aumentare le risorse per soddisfare il nuovo carico, ma probabilmente non riesce a farlo entro un secondo, quindi alcune delle richieste ottengono il codice di risposta 429.

Le sezioni successive descrivono casi specifici di modifica delle quote. Passare a Document Intelligence: aumento del limite di richieste simultanee

Aumento del limite di richieste di transazioni al secondo

Per impostazione predefinita, il numero di transazioni al secondo è limitato a 15 transazioni al secondo per una risorsa di Document Intelligence. Per il piano tariffario Standard, questo limite può essere aumentato. Prima di inviare la richiesta, assicurarsi di avere familiarità con il materiale descritto in questa sezione e di conoscere queste procedure consigliate.

L'aumento del limite di richieste simultanee non influisce direttamente sui costi. Il servizio Document Intelligence usa il modello "Pagamento solo per ciò che si usa". Il limite definisce il livello di scalabilità del servizio prima di avviare la limitazione delle richieste.

Il valore esistente del parametro relativo al limite di richieste simultanee non è visibile tramite il portale di Azure, gli strumenti da riga di comando o le richieste API. Per verificare il valore esistente, creare una richiesta di supporto di Azure.

Se si intende aumentare il numero di transazioni al secondo, è possibile abilitare la scalabilità automatica per la risorsa. Leggere questo documento per abilitare il ridimensionamento automatico per la propria risorsa * Abilitare il ridimensionamento automatico. È anche possibile inviare una richiesta di supporto per incrementare il valore di TPS.

Avere a disposizione le informazioni necessarie

  • ID risorsa di Document Intelligence

  • Paese

  • Come ottenere informazioni (modello di base):

    • Accedere al portale di Azure
    • Selezionare la risorsa di Document Intelligence per cui si vuole aumentare il limite di transazioni
    • Selezionare Proprietà (gruppo Gestione risorse)
    • Copiare e salvare i valori dei campi seguenti:
      • ID risorsa
      • Posizione (area dell'endpoint)

Creare e inviare una richiesta di supporto

Per avviare l'aumento del limite di transazioni al secondo (TPS) per la risorsa, inviare la richiesta di supporto:

  • Assicurarsi di avere a disposizione le informazioni necessarie
  • Accedere al portale di Azure
  • Selezionare la risorsa di Intelligence per i documenti per cui si vuole aumentare il limite TPS
  • Selezionare Nuova richiesta di supporto (gruppo Supporto e risoluzione dei problemi)
  • Viene visualizzata una nuova finestra con informazioni popolate automaticamente sulla sottoscrizione e sulla risorsa di Azure.
  • Immettere Riepilogo (ad esempio"Aumentare il limite TPS di Intelligence per i documenti")
  • In tipo di problema* selezionare "Convalida quota o utilizzo"
  • Selezionare Avanti: Soluzioni
  • Procedere con la creazione della richiesta
  • Nella scheda Dettagli immettere le informazioni seguenti nel campo Descrizione:
    • si noti che la richiesta riguarda la quota di Document Intelligence .
    • Fornire un valore previsto di TPS che si vuole ottenere con la scalabilità.
    • Informazioni sulle risorse di Azure raccolte.
    • Completare l'immissione delle informazioni necessarie e selezionare il pulsante Crea nella scheda Rivedi e crea
    • Prendere nota del numero della richiesta di supporto nelle notifiche del portale di Azure. Si verrà contattati a breve per un'ulteriore elaborazione

Esempio di procedura consigliata per un modello di carico di lavoro

Questo esempio illustra l'approccio che si consiglia di seguire per attenuare la possibile limitazione delle richieste dovuta all'operazione di scalabilità automatica in corso. Non si tratta di una ricetta esatta, ma semplicemente di un modello che si invita a seguire e a modificare in base alle esigenze.

Si supponga che una risorsa di Document Intelligence abbia impostato il limite predefinito. Avviare il carico di lavoro per inviare le richieste di analisi. Se si riscontra una frequente limitazione delle richieste con il codice di risposta 429, iniziare implementando un backoff esponenziale nella richiesta GET di analisi della risposta. Usando un tempo di attesa progressivamente più lungo tra i tentativi per risposte di errore consecutive, ad esempio un modello 2-5-13-34 per i ritardi tra le richieste. In generale, è consigliabile non chiamare la risposta get analyze più di una volta ogni 2 secondi per una richiesta POST corrispondente.

Se si rileva una limitazione del numero di richieste POST per i documenti inviati, provare ad aggiungere un ritardo tra le richieste. Se il carico di lavoro richiede un livello superiore di elaborazione simultanea, è necessario creare una richiesta di supporto per aumentare i limiti di servizio per il numero di transazioni al secondo.

In genere, è consigliabile testare il carico di lavoro e i modelli di carico di lavoro prima di passare all'ambiente di produzione.

Passaggi successivi