Modello di documento generale di Intelligence sui documenti
Importante
A partire dalle versioni di Document Intelligence 2024-02-29-preview, 2023-10-31-preview e in futuro, il modello di documento generale (precompilt-document) è deprecato. Per estrarre coppie chiave-valore, segni di selezione, testo, tabelle e struttura dai documenti, usare i modelli seguenti:
Funzionalità | versione | Model ID |
---|---|---|
Layout modello con il parametro features=keyValuePairs facoltativo della stringa di query abilitato. |
• v4:2024-02-29-preview • v3.1:2023-07-31 (GA) |
prebuilt-layout |
Modello di documento generale | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) • v2.1 (GA) |
prebuilt-document |
Questo contenuto si applica a:v3.1 (GA) | Versione più recente:v4.0 (anteprima) | Versione precedente:v3.0
Questo contenuto si applica a:v3.0 (GA) | Versioni più recenti:v4.0 (anteprima)v3.1
Il modello di documento Generale combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con modelli di Deep Learning per estrarre coppie chiave-valore, tabelle e segni di selezione dai documenti. Il documento generale è disponibile con le API v3.1 e v3.0. Per altre informazioni, vedere la guida alla migrazione.
Funzionalità generali del documento
Il modello di documento generale è un modello con training preliminare; non richiede etichette o training.
Una singola API estrae coppie chiave-valore, segni di selezione, testo, tabelle e struttura dai documenti.
Il modello di documento generale supporta documenti strutturati, semistrutturati e non strutturati.
I segni di selezione vengono identificati come campi con un valore pari
:selected:
a o:unselected:
.
Documento di esempio elaborato in Document Intelligence Studio
Estrazione di coppie chiave-valore
L'API documento generale supporta la maggior parte dei tipi di modulo e analizza i documenti ed estrae le chiavi e i valori associati. È ideale per estrarre coppie chiave-valore comuni dai documenti. È possibile usare il modello di documento generale come alternativa al training di un modello personalizzato senza etichette.
Opzioni di sviluppo
Document Intelligence v3.1 supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di documento generale | • Document Intelligence Studio • API REST• C# SDK • Python SDK • Java SDK • JavaScript SDK |
precompilt-document |
Document Intelligence v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di documento generale | • Document Intelligence Studio • API REST• C# SDK • Python SDK • Java SDK • JavaScript SDK |
precompilt-document |
Requisiti di input
Per ottenere risultati ottimali, fornire una foto chiara o un'analisi di alta qualità per ogni documento.
Formati di file supportati:
Modello PDF Immagine:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTMLLettura ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Documento generale ✔ ✔ Predefinito ✔ ✔ Estrazione personalizzata ✔ ✔ Classificazione personalizzata ✔ ✔ ✔ (2024-02-29-preview) Per PDF e TIFF, è possibile elaborare fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).
Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
Le dimensioni dell'immagine devono essere comprese tra 50 x 50 pixel e 10.000 px x 10.000 pixel.
Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
L'altezza minima del testo da estrarre è di 12 pixel per un'immagine da 1024 x 768 pixel. Questa dimensione corrisponde a circa
8
-point text a 150 punti per pollice (DPI).Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello di modello personalizzato e 50.000 per il modello neurale personalizzato.
Per il training del modello di estrazione personalizzato, le dimensioni totali dei dati di training sono di 50 MB per il modello di modello e 1G-MB per il modello neurale.
Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono
1GB
pari a un massimo di 10.000 pagine.
Estrazione dei dati generali del modello di documento
Provare a estrarre dati da moduli e documenti usando Document Intelligence Studio.
Sono necessarie le risorse seguenti:
Una sottoscrizione di Azure: è possibile crearne una gratuitamente.
Istanza di Document Intelligence nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (
F0
). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per ottenere la chiave e l'endpoint.
Nota
Document Intelligence Studio e il modello di documento generale sono disponibili con l'API v3.0.
Nella home page di Document Intelligence Studio selezionare Documenti generali.
È possibile analizzare il documento di esempio o caricare i propri file.
Selezionare il pulsante Esegui analisi e, se necessario, configurare le opzioni Analizza:
Coppie chiave-valore
Le coppie chiave-valore sono intervalli specifici all'interno del documento che identificano un'etichetta o una chiave e la risposta o il valore associato. In un modulo strutturato, queste coppie possono essere l'etichetta e il valore immesso dall'utente per tale campo. In un documento non strutturato, potrebbe essere la data in cui è stato eseguito un contratto in base al testo di un paragrafo. Il modello di intelligenza artificiale viene sottoposto a training per estrarre chiavi e valori identificabili in base a un'ampia gamma di tipi di documento, formati e strutture.
Le chiavi possono esistere anche in isolamento quando il modello rileva che esiste una chiave, senza alcun valore associato o durante l'elaborazione di campi facoltativi. Ad esempio, un campo del secondo nome può essere lasciato vuoto in un modulo in alcune istanze. Le coppie chiave-valore sono intervalli di testo contenuti nel documento. Per i documenti in cui lo stesso valore viene descritto in modi diversi, ad esempio cliente/utente, la chiave associata è cliente o utente (in base al contesto).
Estrazione dei dati
Modello | Estrazione di testo | Coppie chiave-valore | Segni di selezione | Tabelle | Nomi comuni |
---|---|---|---|---|---|
Documento generale | ✓ | ✓ | ✓ | ✓ | ✓* |
✓* - Disponibile solo nelle versioni API (versione 3.1 ga) e versioni successive dell'API 2023-07-31
.
Lingue e impostazioni locali supportate
Per un elenco completo delle lingue supportate, vedere la pagina Supporto linguistico - Modelli di analisi dei documenti.
Considerazioni
Poiché le chiavi sono intervalli di testo estratti dal documento, per documenti semistrutturati, è necessario eseguire il mapping delle chiavi a un dizionario di chiavi esistente.
Aspettarsi di visualizzare coppie chiave-valore con una chiave, ma nessun valore. Ad esempio, se un utente ha scelto di non fornire un indirizzo di posta elettronica nel modulo.