Modelli personalizzati composti di Document Intelligence
Importante
- Le versioni di anteprima pubblica di Informazioni sui documenti consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo. Le funzionalità, gli approcci e i processi possono cambiare prima della disponibilità generale, a seconda del feedback degli utenti.
- Per impostazione predefinita, la versione di anteprima pubblica delle librerie client di Intelligence dei documenti è la versione dell'API REST 2024-07-31-preview.
- La versione di anteprima pubblica 2024-07-31-preview è al momento disponibile solo nelle aree di Azure seguenti. Si noti che il modello di generazione personalizzata (estrazione di campi di documento) in Studio AI è disponibile solo nell'area Stati Uniti centro-settentrionali:
- Stati Uniti orientali
- Stati Uniti occidentali 2
- Europa occidentale
- Stati Uniti centro-settentrionali
Questo contenuto si applica a: v4.0 (anteprima) | Versioni precedenti: v3.1 (disponibilità generale) v3.0 (disponibilità generale) v2.1 (disponibilità generale)
Questo contenuto si applica a: v3.1 (disponibilità generale) | Versione più recente: v4.0 (anteprima) | Versioni precedenti: v3.0 v2.1
Questo contenuto si applica a: v3.0 (disponibilità generale) | Versioni più recenti: v4.0 (anteprima) v3.1 | Versione precedente: v2.1
Questo contenuto si applica a: v2.1 | Versione più recente: v4.0 (anteprima)
Importante
Il comportamento dell'operazione model compose
cambierà da api-version=2024-07-31-preview. L'operazione model compose
v4.0 e versioni successive aggiunge un classificatore con training esplicito anziché un classificatore implicito per l'analisi. Per la versione precedente del modello composto, vedere Modelli personalizzati composti v3.1. Se attualmente si usano modelli composti, è consigliabile eseguire l'aggiornamento all'implementazione più recente.
Che cos'è un modello composto?
È possibile raggruppare più modelli personalizzati a un modello composto denominato con un singolo ID modello. Ad esempio, il modello composto può includere modelli personalizzati sottoposti a training per analizzare gli ordini di acquisto per forniture, attrezzature e mobili. Anziché tentare manualmente di selezionare il modello appropriato, è possibile usare un modello composto per determinare il modello personalizzato appropriato per ogni operazione di analisi ed estrazione.
Alcuni scenari richiedono prima di tutto la classificazione del documento e quindi l'analisi del documento con il modello più adatto per estrarre i campi dal modello. Tali scenari possono includere quelli in cui un utente carica un documento, ma il tipo di documento non è noto in modo esplicito. Un altro scenario può essere quando più documenti vengono analizzati insieme in un singolo file e il file viene inviato per l'elaborazione. L'applicazione deve quindi identificare i documenti dei componenti e selezionare il modello migliore per ogni documento.
Nelle versioni precedenti, l'operazione model compose
eseguiva una classificazione implicita per decidere quale modello personalizzato rappresentasse meglio il documento inviato. L'implementazione 2024-07-31-preview
dell'operazione model compose
sostituisce la classificazione implicita delle versioni precedenti con un passaggio di classificazione esplicito e aggiunge il routing condizionale.
Vantaggi della nuova operazione di composizione modello
La nuova operazione di model compose
richiede di eseguire il training di un classificatore esplicito e offre diversi vantaggi.
Miglioramento incrementale continuo. È possibile migliorare in modo coerente la qualità del classificatore aggiungendo altri esempi e migliorare in modo incrementale la classificazione. Questa ottimizzazione garantisce che i documenti vengano sempre indirizzati al modello corretto per l'estrazione.
Controllo completo sul routing. Aggiungendo il routing basato sull'attendibilità, si fornisce una soglia di attendibilità per il tipo di documento e la risposta di classificazione.
Ignorare tipi di documento specifici durante l'operazione. Le implementazioni precedenti dell'operazione
model compose
selezionavano il modello di analisi migliore per l'estrazione in base al punteggio di attendibilità anche se i punteggi di attendibilità più elevati erano relativamente bassi. Fornendo una soglia di attendibilità o non eseguendo in modo esplicito il mapping di un tipo di documento noto dalla classificazione a un modello di estrazione, è possibile ignorare tipi di documento specifici.Analizzare più istanze dello stesso tipo di documento. Se abbinata all'opzione
splitMode
del classificatore, l'operazionemodel compose
può rilevare più istanze dello stesso documento in un file e dividere il file per elaborare ogni documento in modo indipendente. L'uso displitMode
consente l'elaborazione di più istanze di un documento in una singola richiesta.Supporto per l'aggiunta di funzionalità. Funzionalità aggiuntive come campi di query o codici a barre possono essere specificate anche come parte dei parametri del modello di analisi.
Il numero massimo di modelli personalizzati assegnati è stato esteso a 500. La nuova implementazione dell'operazione
model compose
consente di assegnare fino a 500 modelli personalizzati sottoposti a training a un singolo modello composto.
Come usare la composizione del modello
Per iniziare, raccogliere esempi di tutti i documenti necessari, inclusi esempi con informazioni che devono essere estratte o ignorate.
Eseguire il training di un classificatore organizzando i documenti nelle cartelle in cui i nomi sono il tipo di documento che si intende usare nella definizione del modello composto.
Infine, eseguire il training di un modello di estrazione per ogni tipo di documento che si intende usare.
Dopo aver eseguito il training dei modelli di classificazione ed estrazione, usare Document Intelligence Studio, le librerie client o l'API REST per comporre i modelli di classificazione ed estrazione in un modello composto.
Usare il parametro splitMode
per controllare il comportamento di suddivisione dei file:
- Nessuno. L'intero file viene considerato come un singolo documento.
- perPage. Ogni pagina del file viene considerata come un documento separato.
- auto. Il file viene suddiviso automaticamente in documenti.
Determinazione dei prezzi e fatturazione
I modelli composti vengono fatturati come i singoli modelli personalizzati. I prezzi si basano sul numero di pagine analizzate dal modello di analisi downstream. La fatturazione si basa sul prezzo di estrazione delle pagine indirizzate a un modello di estrazione. Con l'aggiunta degli addebiti espliciti di classificazione vengono effettuati addebiti per la classificazione di tutte le pagine nel file di input. Per altre informazioni, vedere la pagina dei prezzi di Informazioni sui documenti.
Usare l'operazione di composizione del modello
Per iniziare, creare un elenco di tutti gli ID modello da comporre in un singolo modello.
Comporre i modelli in un singolo ID modello usando le librerie client, l'API REST o Studio.
Usare l'ID modello composto per analizzare i documenti.
Fatturazione
I modelli composti vengono fatturati come i singoli modelli personalizzati. I prezzi si basano sul numero di pagine analizzate. La fatturazione si basa sul prezzo di estrazione delle pagine indirizzate a un modello di estrazione. Per altre informazioni, vedere la pagina dei prezzi di Informazioni sui documenti.
- Il prezzo rimane invariato per l'analisi di un documento con un singolo modello personalizzato o un modello personalizzato composto.
Funzionalità dei modelli composti
I modelli
Custom template
ecustom neural
possono essere uniti in un singolo modello composto in più versioni API.La risposta include una proprietà
docType
per indicare quale dei modelli composti è stato usato per analizzare il documento.Per i modelli
custom template
, è possibile creare il modello composto usando varianti di un modello personalizzato o tipi di modulo diversi. Questa operazione è utile nel caso in cui i moduli in ingresso appartengano a uno dei diversi modelli.Per i modelli
custom neural
, la procedura consigliata consiste nell'aggiungere tutte le varianti diverse di un singolo tipo di documento in un singolo set di dati di training ed eseguire il training sul modello neurale personalizzato. L'operazionemodel compose
è più indicata per gli scenari in cui vengono inviati documenti di tipi diversi per l'analisi.
Limiti della composizione di modelli
Con l'operazione
model compose
è possibile assegnare fino a 500 modelli a un singolo ID modello. Se il numero di modelli da comporre è maggiore del limite superiore di un modello composto, è possibile utilizzare una delle seguenti alternative:Classificare i documenti prima di chiamare il modello personalizzato. È possibile usare il Modello Lettura e creare una classificazione basata sul testo estratto dai documenti e alcune frasi usando codice, espressioni regolari, ricerca e così via.
Se si vogliono estrarre gli stessi campi da vari documenti strutturati, semistrutturati e non strutturati, è consigliabile usare il modello neurale personalizzato di Deep Learning. Altre informazioni sulle differenze tra il modello personalizzato e il modello neurale personalizzato.
L'analisi di un documento tramite modelli composti è identica all'analisi di un documento tramite un singolo modello. Il risultato
Analyze Document
restituisce una proprietàdocType
che indica quale dei modelli di componenti selezionati per l'analisi del documento.L'operazione
model compose
è attualmente disponibile solo per i modelli personalizzati sottoposti a training con etichette.
Compatibilità dei modelli composti
Tipo di modello personalizzato | Modelli sottoposti a training con v2.1 e v2.0 | Modelli personalizzati e modelli neurali v3.1 e v3.0 | Modelli personalizzati e modelli neurali v4.0 in anteprima | Modelli generativi personalizzati v4.0 in anteprima |
---|---|---|---|---|
Modelli sottoposti a training con le versioni 2.1 e 2.0 | Non supportato | Non supportato | Non supportato | Non supportato |
Modelli personalizzati e modelli neurali v3.0 e v3.1 | Non supportato | Supportata | Supportato | Non supportato |
Modelli personalizzati e modelli neurali v4.0 in anteprima | Non supportato | Supportata | Supportato | Non supportato |
Modelli generativi personalizzati v4.0 in anteprima | Non supportato | Non supportato | Non supportato | Non supportato |
Per comporre un modello sottoposto a training con una versione precedente dell'API (v2.1 o precedente), eseguire il training di un modello con l'API v3.0 usando lo stesso set di dati etichettato. Tale aggiunta garantisce che il modello v2.1 possa essere composto con altri modelli.
I modelli composti con la versione 2.1 dell'API continuano a essere supportati e non richiedono aggiornamenti.
Opzioni di sviluppo
Informazioni sui documenti v4.0:2024-07-31-preview supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse |
---|---|
Modello personalizzato | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Modello composto | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Document Intelligence v3.1:2023-07-31 (disponibilità generale) supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse |
---|---|
Modello personalizzato | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Modello composto | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Document Intelligence v3.0:2022-08-31 (disponibilità generale) supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse |
---|---|
Modello personalizzato | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Modello composto | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Document Intelligence v2.1 supporta le risorse seguenti:
Funzionalità | Risorse |
---|---|
Modello personalizzato | • Strumento etichettatura Document Intelligence • REST API • Libreria client SDK • Contenitore Docker Document Intelligence |
Modello composto | • Strumento di etichettatura Document Intelligence • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Passaggi successivi
Informazioni su come creare e comporre modelli personalizzati: