Modello di documento generale di Intelligence sui documenti

Articolo
03/08/2024

Importante

A partire dalle versioni di Document Intelligence 2024-02-29-preview, 2023-10-31-preview e in futuro, il modello di documento generale (precompilt-document) è deprecato. Per estrarre coppie chiave-valore, segni di selezione, testo, tabelle e struttura dai documenti, usare i modelli seguenti:

Funzionalità	versione	Model ID
`Layout` modello con il parametro `features=keyValuePairs` facoltativo della stringa di query abilitato.	• v4:2024-02-29-preview • v3.1:2023-07-31 (GA)	`prebuilt-layout`
Modello di documento generale	• v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) • v2.1 (GA)	`prebuilt-document`

Questo contenuto si applica a:v3.1 (GA) | Versione più recente:v4.0 (anteprima) | Versione precedente:v3.0

Questo contenuto si applica a:v3.0 (GA) | Versioni più recenti:v4.0 (anteprima)v3.1

Il modello di documento Generale combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con modelli di Deep Learning per estrarre coppie chiave-valore, tabelle e segni di selezione dai documenti. Il documento generale è disponibile con le API v3.1 e v3.0. Per altre informazioni, vedere la guida alla migrazione.

Funzionalità generali del documento

Il modello di documento generale è un modello con training preliminare; non richiede etichette o training.
Una singola API estrae coppie chiave-valore, segni di selezione, testo, tabelle e struttura dai documenti.
Il modello di documento generale supporta documenti strutturati, semistrutturati e non strutturati.
I segni di selezione vengono identificati come campi con un valore pari :selected: a o :unselected:.

Documento di esempio elaborato in Document Intelligence Studio

Screenshot dell'analisi generale dei documenti in Document Intelligence Studio.

Estrazione di coppie chiave-valore

L'API documento generale supporta la maggior parte dei tipi di modulo e analizza i documenti ed estrae le chiavi e i valori associati. È ideale per estrarre coppie chiave-valore comuni dai documenti. È possibile usare il modello di documento generale come alternativa al training di un modello personalizzato senza etichette.

Opzioni di sviluppo

Document Intelligence v3.1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità	Risorse	Model ID
Modello di documento generale	• Document Intelligence Studio • API REST• C# SDK • Python SDK • Java SDK • JavaScript SDK	precompilt-document

Document Intelligence v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità	Risorse	Model ID
Modello di documento generale	• Document Intelligence Studio • API REST• C# SDK • Python SDK • Java SDK • JavaScript SDK	precompilt-document

Requisiti di input

Per ottenere risultati ottimali, fornire una foto chiara o un'analisi di alta qualità per ogni documento.

Formati di file supportati:

Modello	PDF	Immagine: JPEG/JPG, PNG, BMP, TIFF, HEIF	Microsoft Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
Lettura	✔	✔	✔
Layout	✔	✔	✔ (2024-02-29-preview, 2023-10-31-preview)
Documento generale	✔	✔
Predefinito	✔	✔
Estrazione personalizzata	✔	✔
Classificazione personalizzata	✔	✔	✔ (2024-02-29-preview)

Per PDF e TIFF, è possibile elaborare fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).
Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
Le dimensioni dell'immagine devono essere comprese tra 50 x 50 pixel e 10.000 px x 10.000 pixel.
Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
L'altezza minima del testo da estrarre è di 12 pixel per un'immagine da 1024 x 768 pixel. Questa dimensione corrisponde a circa 8-point text a 150 punti per pollice (DPI).
Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello di modello personalizzato e 50.000 per il modello neurale personalizzato.
- Per il training del modello di estrazione personalizzato, le dimensioni totali dei dati di training sono di 50 MB per il modello di modello e 1G-MB per il modello neurale.
- Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono 1GB pari a un massimo di 10.000 pagine.

Estrazione dei dati generali del modello di documento

Provare a estrarre dati da moduli e documenti usando Document Intelligence Studio.

Sono necessarie le risorse seguenti:

Una sottoscrizione di Azure: è possibile crearne una gratuitamente.
Istanza di Document Intelligence nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (F0). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per ottenere la chiave e l'endpoint.

Screenshot delle chiavi e della posizione dell'endpoint nella portale di Azure.

Nota

Document Intelligence Studio e il modello di documento generale sono disponibili con l'API v3.0.

Nella home page di Document Intelligence Studio selezionare Documenti generali.
È possibile analizzare il documento di esempio o caricare i propri file.
Selezionare il pulsante Esegui analisi e, se necessario, configurare le opzioni Analizza:

Provare Document Intelligence Studio.

Coppie chiave-valore

Le coppie chiave-valore sono intervalli specifici all'interno del documento che identificano un'etichetta o una chiave e la risposta o il valore associato. In un modulo strutturato, queste coppie possono essere l'etichetta e il valore immesso dall'utente per tale campo. In un documento non strutturato, potrebbe essere la data in cui è stato eseguito un contratto in base al testo di un paragrafo. Il modello di intelligenza artificiale viene sottoposto a training per estrarre chiavi e valori identificabili in base a un'ampia gamma di tipi di documento, formati e strutture.

Le chiavi possono esistere anche in isolamento quando il modello rileva che esiste una chiave, senza alcun valore associato o durante l'elaborazione di campi facoltativi. Ad esempio, un campo del secondo nome può essere lasciato vuoto in un modulo in alcune istanze. Le coppie chiave-valore sono intervalli di testo contenuti nel documento. Per i documenti in cui lo stesso valore viene descritto in modi diversi, ad esempio cliente/utente, la chiave associata è cliente o utente (in base al contesto).

Estrazione dei dati

Modello	Estrazione di testo	Coppie chiave-valore	Segni di selezione	Tabelle	Nomi comuni
Documento generale	✓	✓	✓	✓	✓*

✓* - Disponibile solo nelle versioni API (versione 3.1 ga) e versioni successive dell'API 2023-07-31 .

Lingue e impostazioni locali supportate

Per un elenco completo delle lingue supportate, vedere la pagina Supporto linguistico - Modelli di analisi dei documenti.

Considerazioni

Poiché le chiavi sono intervalli di testo estratti dal documento, per documenti semistrutturati, è necessario eseguire il mapping delle chiavi a un dizionario di chiavi esistente.
Aspettarsi di visualizzare coppie chiave-valore con una chiave, ma nessun valore. Ad esempio, se un utente ha scelto di non fornire un indirizzo di posta elettronica nel modulo.

Passaggi successivi

Seguire la guida alla migrazione di Document Intelligence v3.1 per informazioni su come usare la versione v3.1 nelle applicazioni e nei flussi di lavoro.
Esplorare l'API REST.

Provare Document Intelligence Studio