Modelli personalizzati composti di Document Intelligence

Articolo
10/16/2024

Importante

Le versioni di anteprima pubblica di Informazioni sui documenti consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo. Le funzionalità, gli approcci e i processi possono cambiare prima della disponibilità generale, a seconda del feedback degli utenti.
Per impostazione predefinita, la versione di anteprima pubblica delle librerie client di Intelligence dei documenti è la versione dell'API REST 2024-07-31-preview.
La versione di anteprima pubblica 2024-07-31-preview è al momento disponibile solo nelle aree di Azure seguenti. Si noti che il modello di generazione personalizzata (estrazione di campi di documento) in Studio AI è disponibile solo nell'area Stati Uniti centro-settentrionali:
- Stati Uniti orientali
- Stati Uniti occidentali 2
- Europa occidentale
- Stati Uniti centro-settentrionali

Questo contenuto si applica a: v4.0 (anteprima) | Versioni precedenti: v3.1 (disponibilità generale) v3.0 (disponibilità generale) v2.1 (disponibilità generale)

Questo contenuto si applica a: v3.1 (disponibilità generale) | Versione più recente: v4.0 (anteprima) | Versioni precedenti: v3.0 v2.1

Questo contenuto si applica a: v3.0 (disponibilità generale) | Versioni più recenti: v4.0 (anteprima) v3.1 | Versione precedente: v2.1

Questo contenuto si applica a: v2.1 | Versione più recente: v4.0 (anteprima)

Importante

Il comportamento dell'operazione model compose cambierà da api-version=2024-07-31-preview. L'operazione model compose v4.0 e versioni successive aggiunge un classificatore con training esplicito anziché un classificatore implicito per l'analisi. Per la versione precedente del modello composto, vedere Modelli personalizzati composti v3.1. Se attualmente si usano modelli composti, è consigliabile eseguire l'aggiornamento all'implementazione più recente.

Che cos'è un modello composto?

È possibile raggruppare più modelli personalizzati a un modello composto denominato con un singolo ID modello. Ad esempio, il modello composto può includere modelli personalizzati sottoposti a training per analizzare gli ordini di acquisto per forniture, attrezzature e mobili. Anziché tentare manualmente di selezionare il modello appropriato, è possibile usare un modello composto per determinare il modello personalizzato appropriato per ogni operazione di analisi ed estrazione.

Alcuni scenari richiedono prima di tutto la classificazione del documento e quindi l'analisi del documento con il modello più adatto per estrarre i campi dal modello. Tali scenari possono includere quelli in cui un utente carica un documento, ma il tipo di documento non è noto in modo esplicito. Un altro scenario può essere quando più documenti vengono analizzati insieme in un singolo file e il file viene inviato per l'elaborazione. L'applicazione deve quindi identificare i documenti dei componenti e selezionare il modello migliore per ogni documento.

Nelle versioni precedenti, l'operazione model compose eseguiva una classificazione implicita per decidere quale modello personalizzato rappresentasse meglio il documento inviato. L'implementazione 2024-07-31-preview dell'operazione model compose sostituisce la classificazione implicita delle versioni precedenti con un passaggio di classificazione esplicito e aggiunge il routing condizionale.

Vantaggi della nuova operazione di composizione modello

La nuova operazione di model compose richiede di eseguire il training di un classificatore esplicito e offre diversi vantaggi.

Miglioramento incrementale continuo. È possibile migliorare in modo coerente la qualità del classificatore aggiungendo altri esempi e migliorare in modo incrementale la classificazione. Questa ottimizzazione garantisce che i documenti vengano sempre indirizzati al modello corretto per l'estrazione.
Controllo completo sul routing. Aggiungendo il routing basato sull'attendibilità, si fornisce una soglia di attendibilità per il tipo di documento e la risposta di classificazione.
Ignorare tipi di documento specifici durante l'operazione. Le implementazioni precedenti dell'operazione model compose selezionavano il modello di analisi migliore per l'estrazione in base al punteggio di attendibilità anche se i punteggi di attendibilità più elevati erano relativamente bassi. Fornendo una soglia di attendibilità o non eseguendo in modo esplicito il mapping di un tipo di documento noto dalla classificazione a un modello di estrazione, è possibile ignorare tipi di documento specifici.
Analizzare più istanze dello stesso tipo di documento. Se abbinata all'opzione splitMode del classificatore, l'operazione model compose può rilevare più istanze dello stesso documento in un file e dividere il file per elaborare ogni documento in modo indipendente. L'uso di splitMode consente l'elaborazione di più istanze di un documento in una singola richiesta.
Supporto per l'aggiunta di funzionalità. Funzionalità aggiuntive come campi di query o codici a barre possono essere specificate anche come parte dei parametri del modello di analisi.
Il numero massimo di modelli personalizzati assegnati è stato esteso a 500. La nuova implementazione dell'operazione model compose consente di assegnare fino a 500 modelli personalizzati sottoposti a training a un singolo modello composto.

Come usare la composizione del modello

Per iniziare, raccogliere esempi di tutti i documenti necessari, inclusi esempi con informazioni che devono essere estratte o ignorate.
Eseguire il training di un classificatore organizzando i documenti nelle cartelle in cui i nomi sono il tipo di documento che si intende usare nella definizione del modello composto.
Infine, eseguire il training di un modello di estrazione per ogni tipo di documento che si intende usare.
Dopo aver eseguito il training dei modelli di classificazione ed estrazione, usare Document Intelligence Studio, le librerie client o l'API REST per comporre i modelli di classificazione ed estrazione in un modello composto.

Usare il parametro splitMode per controllare il comportamento di suddivisione dei file:

Nessuno. L'intero file viene considerato come un singolo documento.
perPage. Ogni pagina del file viene considerata come un documento separato.
auto. Il file viene suddiviso automaticamente in documenti.

Determinazione dei prezzi e fatturazione

I modelli composti vengono fatturati come i singoli modelli personalizzati. I prezzi si basano sul numero di pagine analizzate dal modello di analisi downstream. La fatturazione si basa sul prezzo di estrazione delle pagine indirizzate a un modello di estrazione. Con l'aggiunta degli addebiti espliciti di classificazione vengono effettuati addebiti per la classificazione di tutte le pagine nel file di input. Per altre informazioni, vedere la pagina dei prezzi di Informazioni sui documenti.

Usare l'operazione di composizione del modello

Per iniziare, creare un elenco di tutti gli ID modello da comporre in un singolo modello.
Comporre i modelli in un singolo ID modello usando le librerie client, l'API REST o Studio.
Usare l'ID modello composto per analizzare i documenti.

Fatturazione

I modelli composti vengono fatturati come i singoli modelli personalizzati. I prezzi si basano sul numero di pagine analizzate. La fatturazione si basa sul prezzo di estrazione delle pagine indirizzate a un modello di estrazione. Per altre informazioni, vedere la pagina dei prezzi di Informazioni sui documenti.

Il prezzo rimane invariato per l'analisi di un documento con un singolo modello personalizzato o un modello personalizzato composto.

Funzionalità dei modelli composti

I modelli Custom template e custom neural possono essere uniti in un singolo modello composto in più versioni API.
La risposta include una proprietà docType per indicare quale dei modelli composti è stato usato per analizzare il documento.
Per i modelli custom template, è possibile creare il modello composto usando varianti di un modello personalizzato o tipi di modulo diversi. Questa operazione è utile nel caso in cui i moduli in ingresso appartengano a uno dei diversi modelli.
Per i modelli custom neural, la procedura consigliata consiste nell'aggiungere tutte le varianti diverse di un singolo tipo di documento in un singolo set di dati di training ed eseguire il training sul modello neurale personalizzato. L'operazione model compose è più indicata per gli scenari in cui vengono inviati documenti di tipi diversi per l'analisi.

Limiti della composizione di modelli

Con l'operazione model compose è possibile assegnare fino a 500 modelli a un singolo ID modello. Se il numero di modelli da comporre è maggiore del limite superiore di un modello composto, è possibile utilizzare una delle seguenti alternative:
- Classificare i documenti prima di chiamare il modello personalizzato. È possibile usare il Modello Lettura e creare una classificazione basata sul testo estratto dai documenti e alcune frasi usando codice, espressioni regolari, ricerca e così via.
- Se si vogliono estrarre gli stessi campi da vari documenti strutturati, semistrutturati e non strutturati, è consigliabile usare il modello neurale personalizzato di Deep Learning. Altre informazioni sulle differenze tra il modello personalizzato e il modello neurale personalizzato.
L'analisi di un documento tramite modelli composti è identica all'analisi di un documento tramite un singolo modello. Il risultato Analyze Document restituisce una proprietà docType che indica quale dei modelli di componenti selezionati per l'analisi del documento.
L'operazione model compose è attualmente disponibile solo per i modelli personalizzati sottoposti a training con etichette.

Compatibilità dei modelli composti

Tipo di modello personalizzato	Modelli sottoposti a training con v2.1 e v2.0	Modelli personalizzati e modelli neurali v3.1 e v3.0	Modelli personalizzati e modelli neurali v4.0 in anteprima	Modelli generativi personalizzati v4.0 in anteprima
Modelli sottoposti a training con le versioni 2.1 e 2.0	Non supportato	Non supportato	Non supportato	Non supportato
Modelli personalizzati e modelli neurali v3.0 e v3.1	Non supportato	Supportata	Supportato	Non supportato
Modelli personalizzati e modelli neurali v4.0 in anteprima	Non supportato	Supportata	Supportato	Non supportato
Modelli generativi personalizzati v4.0 in anteprima	Non supportato	Non supportato	Non supportato	Non supportato

Per comporre un modello sottoposto a training con una versione precedente dell'API (v2.1 o precedente), eseguire il training di un modello con l'API v3.0 usando lo stesso set di dati etichettato. Tale aggiunta garantisce che il modello v2.1 possa essere composto con altri modelli.
I modelli composti con la versione 2.1 dell'API continuano a essere supportati e non richiedono aggiornamenti.

Opzioni di sviluppo

Informazioni sui documenti v4.0:2024-07-31-preview supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità	Risorse
Modello personalizzato	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK
Modello composto	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK

Document Intelligence v3.1:2023-07-31 (disponibilità generale) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità	Risorse
Modello personalizzato	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK
Modello composto	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK

Document Intelligence v3.0:2022-08-31 (disponibilità generale) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità	Risorse
Modello personalizzato	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK
Modello composto	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK

Document Intelligence v2.1 supporta le risorse seguenti:

Funzionalità	Risorse
Modello personalizzato	• Strumento etichettatura Document Intelligence • REST API • Libreria client SDK • Contenitore Docker Document Intelligence
Modello composto	• Strumento di etichettatura Document Intelligence • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK

Passaggi successivi

Informazioni su come creare e comporre modelli personalizzati:

Creare un modello personalizzatoComporre modelli personalizzati

Condividi tramite