Modelli di elaborazione di documenti
Importante
- Le versioni di anteprima pubblica di Document Intelligence consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo.
- Le funzionalità, gli approcci e i processi possono cambiare prima della disponibilità generale, a seconda del feedback degli utenti.
- La versione di anteprima pubblica delle librerie client di Document Intelligence per impostazione predefinita è l'API REST versione 2024-02-29-preview.
- L'anteprima pubblica versione 2024-02-29-preview è attualmente disponibile solo nelle aree di Azure seguenti:
- Stati Uniti orientali
- Stati Uniti occidentali2
- Europa occidentale
Questo contenuto si applica a:v4.0 (anteprima) | Versioni precedenti:v3.1 (GA)v3.0 (GA)v2.1 (GA)
Questo contenuto si applica a:v3.1 (GA) | Versione più recente:v4.0 (anteprima) | Versioni precedenti:v3.0v2.1
Questo contenuto si applica a:v3.0 (GA) | Versioni più recenti:v4.0 (anteprima)v3.1 | Versione precedente:v2.1
Questo contenuto si applica a:v2.1 | Versione più recente:v4.0 (anteprima)
Azure AI Document Intelligence supporta un'ampia gamma di modelli che consentono di aggiungere l'elaborazione intelligente dei documenti alle app e ai flussi. È possibile usare un modello predefinito specifico del dominio o eseguire il training di un modello personalizzato personalizzato in base alle esigenze aziendali e ai casi d'uso specifici. L'intelligence dei documenti può essere usata con l'API REST o le librerie client Python, C#, Java e JavaScript.
Panoramica dei modelli
La tabella seguente illustra i modelli disponibili per ogni anteprima corrente e l'API stabile:
Tipo di modello | Modello | • Anteprima 2024-02-29 • 10-31-preview 2023 |
2023-07-31 (GA) | 2022-08-31 (Disponibilità generale) | v2.1 (GA) |
---|---|---|---|---|---|
Modelli di analisi dei documenti | Lettura | ✔️ | ✔️ | ✔️ | n/d |
Modelli di analisi dei documenti | Layout | ✔️ | ✔️ | ✔️ | ✔️ |
Modelli di analisi dei documenti | Documento generale | spostato nel layout** | ✔️ | ✔️ | n/d |
Modelli predefiniti | Contratto | ✔️ | ✔️ | n/d | n/d |
Modelli predefiniti | Tessera sanitaria | ✔️ | ✔️ | ✔️ | n/d |
Modelli predefiniti | Documento di identità | ✔️ | ✔️ | ✔️ | ✔️ |
Modelli predefiniti | Fattura | ✔️ | ✔️ | ✔️ | ✔️ |
Modelli predefiniti | Ricevuta | ✔️ | ✔️ | ✔️ | ✔️ |
Modelli predefiniti | US 1040 Tax* | ✔️ | ✔️ | n/d | n/d |
Modelli predefiniti | Imposta usa 1098* | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | US 1099 Tax* | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Imposta US W2 | ✔️ | ✔️ | ✔️ | n/d |
Modelli predefiniti | URLA mutuo STATUNITENSE 1003 | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Riepilogo dei mutui statunitensi 1008 | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Divulgazione di chiusura di mutui statunitensi | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Certificato di matrimonio | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Carta di credito | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Biglietto da visita | deprecated | ✔️ | ✔️ | ✔️ |
Modello di classificazione personalizzato | Classificatore personalizzato | ✔️ | ✔️ | n/d | n/d |
Modello di estrazione personalizzato | Neurale personalizzato | ✔️ | ✔️ | ✔️ | n/d |
Modello customextraction | Modello personalizzato | ✔️ | ✔️ | ✔️ | ✔️ |
Modello di estrazione personalizzato | Personalizzato composto | ✔️ | ✔️ | ✔️ | ✔️ |
Tutti i modelli | Funzionalità dei componenti aggiuntivi | ✔️ | ✔️ | n/d | n/d |
* - Contiene modelli secondari. Vedere le informazioni specifiche del modello per le varianti e i sottotipi supportati.
Funzionalità del componente aggiuntivo | Componente aggiuntivo/gratuito | • Anteprima 2024-02-29 &bullet [2023-10-31-preview](/rest/api/aiservices/operation-groups?view=rest-aiservices-2024-02-29-preview&preserve-view=true |
2023-07-31 (GA) |
2022-08-31 (GA) |
v2.1 (GA) |
---|---|---|---|---|---|
Estrazione delle proprietà dei tipi di carattere | Componente aggiuntivo | ✔️ | ✔️ | n/d | n/d |
Estrazione di formule | Componente aggiuntivo | ✔️ | ✔️ | n/d | n/d |
Estrazione ad alta risoluzione | Componente aggiuntivo | ✔️ | ✔️ | n/d | n/d |
Estrazione di codice a barre | Gratuito | ✔️ | ✔️ | n/d | n/d |
Rilevamento lingua | Gratuito | ✔️ | ✔️ | n/d | n/d |
Coppie chiave-valore | Gratuito | ✔️ | n/d | n/d | n/d |
Campi di query | Componente aggiuntivo* | ✔️ | n/d | n/d | n/d |
Funzionalità di analisi dei modelli
Model ID | Estrazione contenuto | Campi di query | Paragrafi | Ruoli paragrafo | Segni di selezione | Tabelle | Coppie chiave-valore | Lingue | Codici | Analisi dei documenti | Formule* | Stile carattere* | Alta risoluzione* |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
prebuilt-read | ✓ | O | O | O | O | O | |||||||
prebuilt-layout | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | ||
prebuilt-document | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | |
prebuilt-businessCard | ✓ | ✓ | ✓ | ||||||||||
precompilt-contract | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||
prebuilt-healthInsuranceCard.us | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-idDocument | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-invoice | ✓ | ✓ | ✓ | ✓ | O | O | O | ✓ | O | O | O | ||
prebuilt-receipt | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-marriageCertificate.us | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
precompilt-creditCard | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
precompilt-mutuo.us.1003 | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
precompilt-mutuo.us.1008 | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.closingDisclosure | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w2 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098E | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098T | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1099(varianti) | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1040(varianti) | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
{ customModelName } | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O |
✓ - Abilitato
O - Facoltativo
* - Le funzionalità Premium comportano costi aggiuntivi
Componente aggiuntivo* - I campi di query vengono distribuiti in modo diverso rispetto alle altre funzionalità del componente aggiuntivo. Per informazioni dettagliate, vedere i prezzi.
Modello | Descrizione |
---|---|
Modelli di analisi dei documenti | |
OCR di lettura | Estrarre testo stampato e scritto a mano, incluse parole, posizioni e lingue rilevate. |
Analisi del layout | Estrarre testo ed elementi di layout di documenti come tabelle, segni di selezione, titoli, intestazioni di sezione e altro ancora. |
Modelli predefiniti | |
Tessera sanitaria | Automatizzare i processi sanitari estraendo assicurazione, membro, prescrizione, numero di gruppo e altre informazioni chiave dalle carte di assicurazione sanitaria degli Stati Uniti. |
Modelli di documento fiscale degli Stati Uniti | Elaborare moduli fiscali statunitensi per estrarre dipendenti, datori di lavoro, salario e altre informazioni. |
Modelli di documento ipotecari statunitensi | Elaborare moduli ipotecari statunitensi per estrarre le informazioni sul prestito e sulla proprietà. |
Contratto | Estrarre i dettagli del contratto e delle parti. |
Fattura | Automatizzare le fatture. |
Ricevuta | Estrarre dati dalle ricevute. |
Documento di identità (ID) | Estrarre i campi di identità (ID) dalle patenti di guida statunitensi e dai passaporti internazionali. |
Biglietto da visita | Digitalizzare i biglietti da visita per estrarre i campi chiave e i dati nelle applicazioni. |
Modelli personalizzati | |
Modello personalizzato (panoramica) | Estrarre dati da moduli e documenti specifici dell'azienda. I modelli personalizzati vengono sottoposti a training per i dati e i casi d'uso specifici. |
Modelli di estrazione personalizzati | ● I modelli di modello personalizzati usano segnali di layout per estrarre valori dai documenti e sono adatti per estrarre campi da documenti altamente strutturati con modelli di oggetto visivo definiti. ● I modelli neurali personalizzati vengono sottoposti a training su vari tipi di documento per estrarre campi da documenti strutturati, semistrutturati e non strutturati. |
Modello di classificazione personalizzato | Il modello di classificazione personalizzata può classificare ogni pagina in un file di input per identificare i documenti all'interno e può anche identificare più documenti o più istanze di un singolo documento all'interno di un file di input. |
Modelli composti | Combinano diversi modelli personalizzati in un singolo modello per automatizzare l'elaborazione di tipi di documento diversi con un singolo modello composto. |
Per tutti i modelli, ad eccezione del modello di biglietto da visita, Document Intelligence supporta ora funzionalità aggiuntive per consentire un'analisi più sofisticata. Queste funzionalità facoltative possono essere abilitate e disabilitate a seconda dello scenario di estrazione dei documenti. Sono disponibili sette funzionalità aggiuntive per la versione dell'API 2023-07-31
(GA) e successive:
ocrHighResolution
formulas
styleFont
barcodes
languages
keyValuePairs
(2024-02-29-preview, 2023-10-31-preview)queryFields
(2024-02-29-preview, 2023-10-31-preview)Not available with the US.Tax models
Dettagli del modello
Questa sezione descrive l'output previsto da ogni modello. Si noti che è possibile estendere l'output della maggior parte dei modelli con funzionalità del componente aggiuntivo.
Read OCR
L'API Lettura analizza ed estrae righe, parole, posizioni, lingue rilevate e stile scritto a mano, se rilevato.
Documento di esempio elaborato con Document Intelligence Studio:
Analisi del layout
Il modello di analisi del layout consente di analizzare ed estrarre testo, tabelle, segni di selezione e altri elementi della struttura, ad esempio titoli, intestazioni di sezione, intestazioni di pagina, piè di pagina e altro ancora.
Documento di esempio elaborato con Document Intelligence Studio:
Modello di tessera di assicurazione sanitaria
Il modello di tessera sanitaria combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con modelli di Deep Learning per analizzare ed estrarre informazioni chiave dalle tessere sanitarie USA.
Carta di assicurazione sanitaria statunitense di esempio elaborata con Document Intelligence Studio:
Documenti fiscali degli Stati Uniti
I modelli di documento fiscale degli Stati Uniti analizzano ed estraggono i campi chiave e le voci da un gruppo selezionato di documenti fiscali. L'API supporta l'analisi dei documenti fiscali statunitensi in lingua inglese di vari formati e qualità, tra cui immagini acquisite dal telefono, documenti digitalizzati e PDF digitali. Sono attualmente supportati i modelli seguenti:
Modello | Descrizione | ModelID |
---|---|---|
Imposta STATUNITENSE W-2 | Estrarre i dettagli della compensazione impostabile. | prebuilt-tax.us.W-2 |
Imposta USA 1040 | Estrarre i dettagli degli interessi ipotecari. | prebuilt-tax.us.1040(varianti) |
Imposta USA 1098 | Estrarre i dettagli degli interessi ipotecari. | prebuilt-tax.us.1098(varianti) |
Imposta USA 1099 | Estrarre il reddito ricevuto da fonti diverse dal datore di lavoro. | prebuilt-tax.us.1099(varianti) |
Documento W-2 di esempio elaborato con Document Intelligence Studio:
Documenti ipotecari statunitensi
I modelli di documento ipotecario statunitense analizzano ed estraggono i campi chiave, inclusi i prestiti, i prestiti e le informazioni sulle proprietà da un gruppo selezionato di documenti ipotecari. L'API supporta l'analisi dei documenti ipotecari statunitensi in lingua inglese di vari formati e qualità, tra cui immagini acquisite dal telefono, documenti digitalizzati e PDF digitali. Sono attualmente supportati i modelli seguenti:
Modello | Descrizione | ModelID |
---|---|---|
Contratto di licenza con l'utente finale 1003 | Estrarre prestiti, mutuatari, dettagli di proprietà. | precompilt-mutuo.us.1003 |
1008 Documento di riepilogo | Estrarre i dettagli del prestito, del venditore, della proprietà, del mutuo e della sottoscrizione. | precompilt-mutuo.us.1008 |
Divulgazione di chiusura | Estrarre i dettagli di chiusura, transazioni e prestito. | prebuilt-mortgage.us.closingDisclosure |
Certificato di matrimonio | Estrarre i dettagli relativi al matrimonio per i richiedenti prestiti comuni. | prebuilt-marriageCertificate |
Imposta STATUNITENSE W-2 | Estrarre i dettagli del risarcimento fiscale per la verifica del reddito. | prebuilt-tax.us.W-2 |
Documento di divulgazione di chiusura di esempio elaborato con Document Intelligence Studio:
Contract
Il modello di contratto analizza ed estrae i campi chiave e gli elementi riga dagli accordi contrattuali, tra cui parti, giurisdizioni, ID contratto e titolo. Il modello supporta attualmente documenti di contratto in lingua inglese.
Contratto di esempio elaborato con Document Intelligence Studio:
Fattura
Il modello di fattura automatizza l'elaborazione delle fatture per estrarre il nome del cliente, l'indirizzo di fatturazione, la data di scadenza e l'importo dovuto, le voci e altri dati chiave. Attualmente, il modello supporta fatture in inglese, spagnolo, tedesco, francese, italiano, portoghese e olandese.
Fattura di esempio elaborata con Document Intelligence Studio:
Ricevuta
Usare il modello di ricevuta per digitalizzare le ricevute di vendita ed estrarre il nome del commerciante, le date, le voci, le quantità e i totali delle ricevute stampate e scritte a mano. La versione 3.0 supporta anche l'elaborazione delle ricevute di hotel a pagina singola.
Conferma di esempio elaborata con Document Intelligence Studio:
Documento di identità (ID)
Usare il modello documento di identità (ID) per elaborare le patenti di guida USA (tutti i 50 stati e District of Columbia) e le pagine biografiche di passaporti internazionali (esclusi i visti e altri documenti di viaggio) al fine di estrarre i campi chiave.
Licenza del driver statunitense di esempio elaborata con Document Intelligence Studio:
Certificato di matrimonio
Usare il modello di certificato di matrimonio per elaborare i certificati di matrimonio degli Stati Uniti per estrarre campi chiave, tra cui le persone, la data e la posizione.
Certificato di matrimonio degli Stati Uniti di esempio elaborato con Document Intelligence Studio:
Carta di credito
Usare il modello di carta di credito per elaborare le carte di credito e di debito per estrarre i campi chiave.
Carta di credito di esempio elaborata con Document Intelligence Studio:
Modelli personalizzati
I modelli personalizzati possono essere classificati in modo ampio in due tipi. Modelli di classificazione personalizzati che supportano la classificazione di un "tipo di documento" e modelli di estrazione personalizzati che possono estrarre uno schema definito da un tipo di documento specifico.
I modelli di documenti personalizzati consentono di analizzare ed estrarre dati da moduli e documenti specifici dell'azienda. Vengono sottoposti a training per riconoscere i campi moduli all'interno di contenuto specifico ed estrarre coppie chiave-valore e dati di tabella. Per iniziare, è necessario un solo esempio del tipo di modulo.
La versione 3.0 del modello personalizzato supporta il rilevamento delle firme nei modelli personalizzati (modulo) e nelle tabelle tra pagine nei modelli modello e neurale.
Modello personalizzato di esempio elaborato con Document Intelligence Studio:
Estrazione personalizzata
Il modello di estrazione personalizzato può essere uno dei due tipi, modello personalizzato o neurale personalizzato. Per creare un modello di estrazione personalizzato, etichettare un set di dati di documenti con i valori da estrarre ed eseguire il training del modello sul set di dati etichettato. Per iniziare, sono necessari solo cinque esempi dello stesso tipo di modulo o documento.
Estrazione personalizzata di esempio elaborata con Document Intelligence Studio:
Classificatore personalizzato
Il modello di classificazione personalizzato consente di identificare il tipo di documento prima di richiamare il modello di estrazione. Il modello di classificazione è disponibile a partire dall'API 2023-07-31 (GA)
. Il training di un modello di classificazione personalizzato richiede almeno due classi distinte e un minimo di cinque esempi per classe.
Modelli composti
Un modello composto è costituito da una raccolta di modelli personalizzati assegnati a un singolo modello creato dai tipi di modulo. È possibile assegnare più modelli personalizzati a un modello composto denominato con un singolo ID modello. A un singolo modello composto è possibile assegnare fino a 200 modelli personalizzati sottoposti a training.
Finestra di dialogo Modello composto in Document Intelligence Studio:
Requisiti di input
Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.
Formati di file supportati:
Modello PDF Immagine:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTMLLettura ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Documento generale ✔ ✔ Predefinito ✔ ✔ Estrazione personalizzata ✔ ✔ Classificazione personalizzata ✔ ✔ ✔ (2024-02-29-preview) Per i formati PDF e TIFF, possono essere elaborate fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).
Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.
Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di
8
punti e 150 punti per pollice (DPI).Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.
Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e 1G MB per il modello neurale.
Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono
1GB
con un massimo di 10.000 pagine.
Nota
Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento non del servizio Di intelligence dei documenti.
Migrazione della versione
Informazioni su come usare Document Intelligence v3.0 nelle applicazioni seguendo la guida alla migrazione di Document Intelligence v3.1
Modello | Descrizione |
---|---|
Analisi dei documenti | |
Layout | Estrarre testo e informazioni sul layout dai documenti. |
Predefinita | |
Fattura | Estrarre le informazioni chiave dalle fatture in inglese e spagnolo. |
Ricevuta | Estrarre le informazioni chiave dalle ricevute in inglese. |
Documento di identità | Estrarre le informazioni chiave da patenti di guida USA e passaporti internazionali. |
Biglietto da visita | Estrarre le informazioni chiave dai biglietti da visita in inglese. |
Personalizzazione | |
Personalizzazione | Estrarre dati da moduli e documenti specifici dell'azienda. I modelli personalizzati vengono sottoposti a training per i dati e i casi d'uso specifici. |
Modello composto | Comporre una raccolta di modelli personalizzati e assegnarli a un singolo modello creato dai tipi di modulo. |
Layout
L'API Layout consente di analizzare ed estrarre testo, tabelle e intestazioni, segni di selezione e informazioni sulla struttura dai documenti.
Documento di esempio elaborato con lo strumento di etichettatura di esempio:
Fattura
Il modello di fattura consente di analizzare ed estrarre le informazioni chiave dalle fatture di vendita. L'API consente di analizzare le fatture in vari formati e di estrarre informazioni chiave, ad esempio nome cliente, indirizzo di fatturazione, scadenza e importo dovuto.
Fattura di esempio elaborata con lo strumento di etichettatura di esempio:
Ricevuta
- Il modello di ricevuta consente di analizzare ed estrarre le informazioni chiave dalle ricevute di vendita stampate e scritte a mano.
Ricevuta di esempio elaborata con lo strumento di etichettatura di esempio:
Documento di identità
Il modello di documento di identità consente di analizzare ed estrarre le informazioni chiave dai documenti seguenti:
U.S. Patenti di guida USA (tutti i 50 stati e District of Columbia)
Pagine biografiche di passaporti internazionali (esclusi i visti e altri documenti di viaggio). L'API consente di analizzare i documenti e di estrarre
Esempio di patente di guida USA elaborato con lo strumento di etichettatura di esempio:
Carta aziendale
Il modello di biglietto da visita consente di analizzare ed estrarre le informazioni chiave dalle immagini dei biglietti da visita.
Biglietto da visita di esempio elaborato con lo strumento di etichettatura di esempio:
Personalizzazione
- I modelli personalizzati consentono di analizzare ed estrarre dati da moduli e documenti specifici dell'azienda. L'API è un programma di apprendimento automatico sottoposto a training per riconoscere campi modulo all'interno di contenuto specifico ed estrarre coppie chiave-valore e dati di tabella. Per iniziare, sono necessari solo cinque esempi dello stesso tipo di modulo ed è possibile eseguire il training del modello con o senza set di dati etichettati.
Elaborazione di modelli personalizzati di esempio con lo strumento di etichettatura di esempio:
Modello personalizzato composto
Un modello composto è costituito da una raccolta di modelli personalizzati assegnati a un singolo modello creato dai tipi di modulo. È possibile assegnare più modelli personalizzati a un modello composto denominato con un singolo ID modello. A un singolo modello composto è possibile assegnare fino a 100 modelli personalizzati con training.
Finestra di dialogo Modello composto con lo strumento di etichettatura di esempio:
Estrazione dei dati del modello
Modello | Estrazione di testo | Rilevamento lingua | Segni di selezione | Tabelle | Paragrafi | Ruoli di paragrafo | Coppie chiave-valore | Campi |
---|---|---|---|---|---|---|---|---|
Layout | ✓ | ✓ | ✓ | ✓ | ✓ | |||
Fattura | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||
Ricevuta | ✓ | ✓ | ✓ | |||||
Documento di identità | ✓ | ✓ | ✓ | |||||
Biglietto da visita | ✓ | ✓ | ✓ | |||||
Modulo personalizzato | ✓ | ✓ | ✓ | ✓ | ✓ |
Requisiti di input
Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.
Formati di file supportati:
Modello PDF Immagine:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTMLLettura ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Documento generale ✔ ✔ Predefinito ✔ ✔ Estrazione personalizzata ✔ ✔ Classificazione personalizzata ✔ ✔ ✔ (2024-02-29-preview) Per i formati PDF e TIFF, possono essere elaborate fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).
Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.
Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di
8
punti e 150 punti per pollice (DPI).Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.
Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e 1G MB per il modello neurale.
Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono
1GB
con un massimo di 10.000 pagine.
Nota
Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento non del servizio Di intelligence dei documenti.
Migrazione della versione
Per informazioni su come usare Document Intelligence v3.0 nelle applicazioni, seguire la guida alla migrazione di Document Intelligence v3.1
Passaggi successivi
Provare a elaborare moduli e documenti personalizzati con Document Intelligence Studio.
Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.
Provare a elaborare moduli e documenti personalizzati con lo strumento di etichettatura di esempio di Document Intelligence.
Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.