Modelli di elaborazione documenti
Importante
- Le versioni di anteprima pubblica di Document Intelligence consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo.
- Le funzionalità, gli approcci e i processi possono cambiare, prima della disponibilità generale, in base al feedback degli utenti.
- La versione di anteprima pubblica delle librerie client di Document Intelligence per impostazione predefinita è l'API REST versione 2024-02-29-preview.
- L'anteprima pubblica versione 2024-02-29-preview è attualmente disponibile solo nelle aree di Azure seguenti:
- Stati Uniti orientali
- Stati Uniti occidentali2
- Europa occidentale
Questo contenuto si applica a:v4.0 (anteprima) | Versioni precedenti:v3.1 (GA)v3.0 (GA)v2.1 (GA)
Questo contenuto si applica a:v3.1 (GA) | Versione più recente:v4.0 (anteprima) | Versioni precedenti:v3.0v2.1
Questo contenuto si applica a:v3.0 (GA) | Versioni più recenti:v4.0 (anteprima)v3.1 | Versione precedente:v2.1
Questo contenuto si applica a:v2.1 | Versione più recente:v4.0 (anteprima)
Azure AI Document Intelligence supporta un'ampia gamma di modelli che consentono di aggiungere l'elaborazione intelligente dei documenti alle app e ai flussi. È possibile usare un modello predefinito specifico del dominio o eseguire il training di un modello personalizzato personalizzato in base alle esigenze aziendali e ai casi d'uso specifici. L'intelligence dei documenti può essere usata con l'API REST o le librerie client Python, C#, Java e JavaScript.
Panoramica dei modelli
La tabella seguente illustra i modelli disponibili per ogni anteprima corrente e l'API stabile:
Tipo di modello | Modello | • Anteprima 2024-02-29 &bullet 2023-10-31-preview |
2023-07-31 (GA) | 2022-08-31 (GA) | v2.1 (GA) |
---|---|---|---|---|---|
Modelli di analisi dei documenti | Lettura | ✔️ | ✔️ | ✔️ | n/d |
Modelli di analisi dei documenti | Layout | ✔️ | ✔️ | ✔️ | ✔️ |
Modelli di analisi dei documenti | Documento generale | spostato nel layout** | ✔️ | ✔️ | n/d |
Modelli predefiniti | Contratto | ✔️ | ✔️ | n/d | n/d |
Modelli predefiniti | Scheda assicurazione sanitaria | ✔️ | ✔️ | ✔️ | n/d |
Modelli predefiniti | Documento di identità | ✔️ | ✔️ | ✔️ | ✔️ |
Modelli predefiniti | Fattura | ✔️ | ✔️ | ✔️ | ✔️ |
Modelli predefiniti | Ricevuta | ✔️ | ✔️ | ✔️ | ✔️ |
Modelli predefiniti | US 1040 Tax* | ✔️ | ✔️ | n/d | n/d |
Modelli predefiniti | Imposta usa 1098* | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | US 1099 Tax* | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Imposta US W2 | ✔️ | ✔️ | ✔️ | n/d |
Modelli predefiniti | URLA mutuo STATUNITENSE 1003 | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Riepilogo dei mutui statunitensi 1008 | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Divulgazione di chiusura di mutui statunitensi | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Certificato di matrimonio | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Carta di credito | ✔️ | n/d | n/d | n/d |
Modelli predefiniti | Tessera business | deprecated | ✔️ | ✔️ | ✔️ |
Modello di classificazione personalizzato | Classificatore personalizzato | ✔️ | ✔️ | n/d | n/d |
Modello di estrazione personalizzato | Neurale personalizzato | ✔️ | ✔️ | ✔️ | n/d |
Modello customextraction | Modello personalizzato | ✔️ | ✔️ | ✔️ | ✔️ |
Modello di estrazione personalizzato | Personalizzato composto | ✔️ | ✔️ | ✔️ | ✔️ |
Tutti i modelli | Funzionalità dei componenti aggiuntivi | ✔️ | ✔️ | n/d | n/d |
* - Contiene modelli secondari. Vedere le informazioni specifiche del modello per le varianti e i sottotipi supportati.
Funzionalità del componente aggiuntivo | Componente aggiuntivo/gratuito | • Anteprima 2024-02-29 &bullet [2023-10-31-preview](/rest/api/aiservices/operation-groups?view=rest-aiservices-2024-02-29-preview&preserve-view=true |
2023-07-31 (GA) |
2022-08-31 (GA) |
v2.1 (GA) |
---|---|---|---|---|---|
Estrazione delle proprietà dei tipi di carattere | Componente aggiuntivo | ✔️ | ✔️ | n/d | n/d |
Estrazione di formule | Componente aggiuntivo | ✔️ | ✔️ | n/d | n/d |
Estrazione ad alta risoluzione | Componente aggiuntivo | ✔️ | ✔️ | n/d | n/d |
Estrazione di codice a barre | Libero | ✔️ | ✔️ | n/d | n/d |
Rilevamento lingua | Libero | ✔️ | ✔️ | n/d | n/d |
Coppie chiave-valore | Libero | ✔️ | n/d | n/d | n/d |
Campi di query | Componente aggiuntivo* | ✔️ | n/d | n/d | n/d |
Funzionalità di analisi dei modelli
Model ID | Estrazione contenuto | Campi di query | Paragrafi | Ruoli paragrafo | Segni di selezione | Tabelle | Coppie chiave-valore | Lingue | Codici | Analisi dei documenti | Formule* | Stile carattere* | Alta risoluzione* |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
precompilt-read | ✓ | O | O | O | O | O | |||||||
precompilt-layout | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | ||
precompilt-document | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | |
precompilt-businessCard | ✓ | ✓ | ✓ | ||||||||||
precompilt-contract | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||
prebuilt-healthInsuranceCard.us | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-idDocument | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
fattura predefinita | ✓ | ✓ | ✓ | ✓ | O | O | O | ✓ | O | O | O | ||
ricevuta predefinita | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-marriageCertificate.us | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
precompilt-creditCard | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
precompilt-mutuo.us.1003 | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
precompilt-mutuo.us.1008 | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.closingDisclosure | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w2 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098E | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098T | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1099(varianti) | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1040(varianti) | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
{ customModelName } | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O |
✓ - Abilitato
O - Facoltativo
* - Le funzionalità Premium comportano costi aggiuntivi
Componente aggiuntivo* - I campi di query vengono distribuiti in modo diverso rispetto alle altre funzionalità del componente aggiuntivo. Per informazioni dettagliate, vedere i prezzi .
Modello | Descrizione |
---|---|
Modelli di analisi dei documenti | |
Leggere OCR | Estrarre testo stampato e scritto a mano, incluse parole, posizioni e lingue rilevate. |
Analisi del layout | Estrarre elementi di layout di testo e documento come tabelle, segni di selezione, titoli, intestazioni di sezione e altro ancora. |
Modelli predefiniti | |
Scheda assicurazione sanitaria | Automatizzare i processi sanitari estraendo assicurazione, membro, prescrizione, numero di gruppo e altre informazioni chiave dalle carte di assicurazione sanitaria degli Stati Uniti. |
Modelli di documento fiscale degli Stati Uniti | Elaborare moduli fiscali statunitensi per estrarre dipendenti, datori di lavoro, salario e altre informazioni. |
Modelli di documento ipotecari statunitensi | Elaborare moduli ipotecari statunitensi per estrarre le informazioni sul prestito e sulla proprietà. |
Contratto | Estrarre i dettagli del contratto e delle parti. |
Fattura | Automatizzare le fatture. |
Ricevuta | Estrarre i dati della ricevuta dalle ricevute. |
Documento di identità (ID) | Estrarre i campi identity (ID) dalle licenze di guida statunitensi e dai passaporti internazionali. |
Tessera business | Analizzare i biglietti da visita per estrarre i campi chiave e i dati nelle applicazioni. |
Modelli personalizzati | |
Modello personalizzato (panoramica) | Estrarre dati da moduli e documenti specifici dell'azienda. I modelli personalizzati vengono sottoposti a training per i dati distinti e i casi d'uso. |
Modelli di estrazione personalizzati | ● I modelli di modello personalizzati usano segnali di layout per estrarre valori dai documenti e sono adatti per estrarre campi da documenti altamente strutturati con modelli di oggetto visivo definiti. ● I modelli neurali personalizzati vengono sottoposti a training su vari tipi di documento per estrarre campi da documenti strutturati, semistrutturati e non strutturati. |
Modello di classificazione personalizzato | Il modello di classificazione personalizzata può classificare ogni pagina in un file di input per identificare i documenti all'interno e può anche identificare più documenti o più istanze di un singolo documento all'interno di un file di input. |
Modelli composti | Combinare diversi modelli personalizzati in un singolo modello per automatizzare l'elaborazione di tipi di documento diversi con un singolo modello composto. |
Per tutti i modelli, ad eccezione del modello di biglietto da visita, Document Intelligence supporta ora funzionalità aggiuntive per consentire un'analisi più sofisticata. Queste funzionalità facoltative possono essere abilitate e disabilitate a seconda dello scenario di estrazione dei documenti. Sono disponibili sette funzionalità aggiuntive per la versione dell'API 2023-07-31
(GA) e successive:
ocrHighResolution
formulas
styleFont
barcodes
languages
keyValuePairs
(2024-02-29-preview, 2023-10-31-preview)queryFields
(2024-02-29-preview, 2023-10-31-preview)Not available with the US.Tax models
Dettagli del modello
Questa sezione descrive l'output previsto da ogni modello. Si noti che è possibile estendere l'output della maggior parte dei modelli con funzionalità del componente aggiuntivo.
Read OCR
L'API Lettura analizza ed estrae righe, parole, posizioni, lingue rilevate e stile scritto a mano, se rilevato.
Documento di esempio elaborato con Document Intelligence Studio:
Analisi del layout
Il modello di analisi layout analizza ed estrae testo, tabelle, segni di selezione e altri elementi della struttura, ad esempio titoli, intestazioni di sezione, intestazioni di pagina, piè di pagina e altro ancora.
Documento di esempio elaborato con Document Intelligence Studio:
Modello di tessera di assicurazione sanitaria
Il modello di scheda assicurazione sanitaria combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con i modelli di Deep Learning per analizzare ed estrarre le informazioni chiave dalle schede di assicurazione sanitaria degli Stati Uniti.
Carta di assicurazione sanitaria statunitense di esempio elaborata con Document Intelligence Studio:
Documenti fiscali degli Stati Uniti
I modelli di documento fiscale degli Stati Uniti analizzano ed estraggono i campi chiave e le voci da un gruppo selezionato di documenti fiscali. L'API supporta l'analisi dei documenti fiscali statunitensi in lingua inglese di vari formati e qualità, tra cui immagini acquisite dal telefono, documenti digitalizzati e PDF digitali. Sono attualmente supportati i modelli seguenti:
Modello | Descrizione | ModelID |
---|---|---|
Imposta STATUNITENSE W-2 | Estrarre i dettagli della compensazione impostabile. | prebuilt-tax.us.W-2 |
Imposta USA 1040 | Estrarre i dettagli degli interessi ipotecari. | prebuilt-tax.us.1040(varianti) |
Imposta USA 1098 | Estrarre i dettagli degli interessi ipotecari. | prebuilt-tax.us.1098(varianti) |
Imposta USA 1099 | Estrarre il reddito ricevuto da fonti diverse dal datore di lavoro. | prebuilt-tax.us.1099(varianti) |
Documento W-2 di esempio elaborato con Document Intelligence Studio:
Documenti ipotecari statunitensi
I modelli di documento ipotecario statunitense analizzano ed estraggono i campi chiave, inclusi i prestiti, i prestiti e le informazioni sulle proprietà da un gruppo selezionato di documenti ipotecari. L'API supporta l'analisi dei documenti ipotecari statunitensi in lingua inglese di vari formati e qualità, tra cui immagini acquisite dal telefono, documenti digitalizzati e PDF digitali. Sono attualmente supportati i modelli seguenti:
Modello | Descrizione | ModelID |
---|---|---|
Contratto di licenza con l'utente finale 1003 | Estrarre prestiti, mutuatari, dettagli di proprietà. | precompilt-mutuo.us.1003 |
1008 Documento di riepilogo | Estrarre i dettagli del prestito, del venditore, della proprietà, del mutuo e della sottoscrizione. | precompilt-mutuo.us.1008 |
Divulgazione di chiusura | Estrarre i dettagli di chiusura, transazioni e prestito. | prebuilt-mortgage.us.closingDisclosure |
Certificato di matrimonio | Estrarre i dettagli relativi al matrimonio per i richiedenti prestiti comuni. | prebuilt-marriageCertificate |
Imposta STATUNITENSE W-2 | Estrarre i dettagli del risarcimento fiscale per la verifica del reddito. | prebuilt-tax.us.W-2 |
Documento di divulgazione di chiusura di esempio elaborato con Document Intelligence Studio:
Contratto
Il modello di contratto analizza ed estrae i campi chiave e gli elementi riga dagli accordi contrattuali, tra cui parti, giurisdizioni, ID contratto e titolo. Il modello supporta attualmente documenti di contratto in lingua inglese.
Contratto di esempio elaborato con Document Intelligence Studio:
Fattura
Il modello di fattura automatizza l'elaborazione delle fatture per estrarre il nome del cliente, l'indirizzo di fatturazione, la data di scadenza e l'importo dovuto, le voci e altri dati chiave. Attualmente, il modello supporta fatture inglese, spagnolo, tedesco, francese, italiano, portoghese e olandese.
Fattura di esempio elaborata con Document Intelligence Studio:
Ricevuta
Usare il modello di ricevuta per analizzare le ricevute di vendita per il nome del commerciante, le date, gli articoli, le quantità e i totali delle ricevute stampate e scritte a mano. La versione 3.0 supporta anche l'elaborazione della ricevuta di hotel a pagina singola.
Conferma di esempio elaborata con Document Intelligence Studio:
Documento di identità (ID)
Usare il modello di documento di identità (ID) per elaborare le licenze del driver degli Stati Uniti (tutti i 50 stati e distretto di Columbia) e le pagine biografiche dei passaporti internazionali (esclusi i visti e altri documenti di viaggio) per estrarre i campi chiave.
Licenza del driver statunitense di esempio elaborata con Document Intelligence Studio:
Certificato di matrimonio
Usare il modello di certificato di matrimonio per elaborare i certificati di matrimonio degli Stati Uniti per estrarre campi chiave, tra cui le persone, la data e la posizione.
Certificato di matrimonio degli Stati Uniti di esempio elaborato con Document Intelligence Studio:
Carta di credito
Usare il modello di carta di credito per elaborare le carte di credito e di debito per estrarre i campi chiave.
Carta di credito di esempio elaborata con Document Intelligence Studio:
Modelli personalizzati
I modelli personalizzati possono essere classificati in modo ampio in due tipi. Modelli di classificazione personalizzati che supportano la classificazione di un "tipo di documento" e modelli di estrazione personalizzati che possono estrarre uno schema definito da un tipo di documento specifico.
I modelli di documento personalizzati analizzano ed estraggono dati da moduli e documenti specifici dell'azienda. Viene eseguito il training per riconoscere i campi modulo all'interno del contenuto distinto ed estrarre coppie chiave-valore e dati di tabella. Per iniziare, è necessario un solo esempio del tipo di modulo.
La versione 3.0 del modello personalizzato supporta il rilevamento delle firme nei modelli personalizzati (modulo) e nelle tabelle tra pagine nei modelli modello e neurale.
Modello personalizzato di esempio elaborato con Document Intelligence Studio:
Estrazione personalizzata
Il modello di estrazione personalizzato può essere uno dei due tipi, il modello personalizzato o il neurale personalizzato. Per creare un modello di estrazione personalizzato, etichettare un set di dati di documenti con i valori da estrarre ed eseguire il training del modello nel set di dati etichettato. Per iniziare, sono necessari solo cinque esempi dello stesso tipo di modulo o documento.
Estrazione personalizzata di esempio elaborata con Document Intelligence Studio:
Classificatore personalizzato
Il modello di classificazione personalizzato consente di identificare il tipo di documento prima di richiamare il modello di estrazione. Il modello di classificazione è disponibile a partire dall'API 2023-07-31 (GA)
. Il training di un modello di classificazione personalizzato richiede almeno due classi distinte e un minimo di cinque campioni per ogni classe.
Modelli composti
Un modello composto viene creato prendendo una raccolta di modelli personalizzati e assegnandoli a un singolo modello creato dai tipi di modulo. È possibile assegnare più modelli personalizzati a un modello composto denominato con un singolo ID modello. È possibile assegnare fino a 200 modelli personalizzati sottoposti a training a un singolo modello composto.
Finestra di dialogo Modello composto in Document Intelligence Studio:
Requisiti di input
Per ottenere risultati ottimali, fornire una foto chiara o un'analisi di alta qualità per ogni documento.
Formati di file supportati:
Modello PDF Immagine:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTMLLettura ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Documento generale ✔ ✔ Predefinito ✔ ✔ Estrazione personalizzata ✔ ✔ Classificazione personalizzata ✔ ✔ ✔ (2024-02-29-preview) Per PDF e TIFF, è possibile elaborare fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).
Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
Le dimensioni dell'immagine devono essere comprese tra 50 x 50 pixel e 10.000 px x 10.000 pixel.
Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
L'altezza minima del testo da estrarre è di 12 pixel per un'immagine da 1024 x 768 pixel. Questa dimensione corrisponde a circa
8
-point text a 150 punti per pollice (DPI).Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello di modello personalizzato e 50.000 per il modello neurale personalizzato.
Per il training del modello di estrazione personalizzato, le dimensioni totali dei dati di training sono di 50 MB per il modello di modello e 1G-MB per il modello neurale.
Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono
1GB
pari a un massimo di 10.000 pagine.
Nota
Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento non del servizio Di intelligence dei documenti.
Migrazione della versione
Informazioni su come usare Document Intelligence v3.0 nelle applicazioni seguendo la guida alla migrazione di Document Intelligence v3.1
Modello | Descrizione |
---|---|
Analisi dei documenti | |
Layout | Estrarre testo e informazioni di layout dai documenti. |
Predefinita | |
Fattura | Estrarre le informazioni chiave dalle fatture in inglese e spagnolo. |
Ricevuta | Estrarre le informazioni sulla chiave dalle ricevute in inglese. |
Documento di identità | Estrarre le informazioni chiave dalle licenze di guida statunitensi e dai passaporti internazionali. |
Tessera business | Estrarre le informazioni chiave dai biglietti da visita in inglese. |
Personalizzazione | |
Personalizzazione | Estrarre dati da moduli e documenti specifici dell'azienda. I modelli personalizzati vengono sottoposti a training per i dati distinti e i casi d'uso. |
Composto | Comporre una raccolta di modelli personalizzati e assegnarli a un singolo modello creato dai tipi di modulo. |
Layout
L'API Layout analizza ed estrae testo, tabelle e intestazioni, segni di selezione e informazioni sulla struttura dai documenti.
Documento di esempio elaborato con lo strumento di etichettatura di esempio:
Fattura
Il modello di fattura analizza ed estrae le informazioni chiave dalle fatture di vendita. L'API analizza le fatture in vari formati ed estrae informazioni chiave, ad esempio nome cliente, indirizzo di fatturazione, scadenza e importo dovuto.
Fattura di esempio elaborata con lo strumento di etichettatura di esempio:
Ricevuta
- Il modello di ricevuta analizza ed estrae le informazioni chiave dalle ricevute di vendita stampate e scritte a mano.
Ricevuta di esempio elaborata con lo strumento di etichettatura di esempio:
Documento di identità
Il modello di documento ID analizza ed estrae le informazioni chiave dai documenti seguenti:
Licenze di driver statunitensi (tutti i 50 stati e distretto di Columbia)
Pagine biografiche di passaporti internazionali (esclusi i visti e altri documenti di viaggio). L'API analizza i documenti di identità ed estrae
Licenza del driver U.S. di esempio elaborata con lo strumento di etichettatura di esempio:
Carta aziendale
Il modello di biglietto da visita analizza ed estrae le informazioni chiave dalle immagini dei biglietti da visita.
Biglietto da visita di esempio elaborato con lo strumento Di etichettatura di esempio:
Personalizzazione
- I modelli personalizzati analizzano ed estraggono dati da moduli e documenti specifici dell'azienda. L'API è un programma di Machine Learning sottoposto a training per riconoscere i campi modulo all'interno del contenuto distinto ed estrarre coppie chiave-valore e dati di tabella. Sono necessari solo cinque esempi dello stesso tipo di modulo per iniziare e il training del modello personalizzato può essere eseguito con o senza set di dati etichettati.
Esempio di elaborazione di modelli personalizzati con lo strumento di etichettatura di esempio:
Modello personalizzato composto
Un modello composto viene creato prendendo una raccolta di modelli personalizzati e assegnandoli a un singolo modello creato dai tipi di modulo. È possibile assegnare più modelli personalizzati a un modello composto denominato con un singolo ID modello. A un singolo modello composto è possibile assegnare fino a 100 modelli personalizzati con training.
Finestra di dialogo Modello composto con lo strumento Etichettatura di esempio:
Estrazione dei dati del modello
Modello | Estrazione di testo | Rilevamento lingua | Segni di selezione | Tabelle | Paragrafi | Ruoli paragrafo | Coppie chiave-valore | Campi |
---|---|---|---|---|---|---|---|---|
Layout | ✓ | ✓ | ✓ | ✓ | ✓ | |||
Fattura | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||
Ricevuta | ✓ | ✓ | ✓ | |||||
Documento ID | ✓ | ✓ | ✓ | |||||
Tessera business | ✓ | ✓ | ✓ | |||||
Modulo personalizzato | ✓ | ✓ | ✓ | ✓ | ✓ |
Requisiti di input
Per ottenere risultati ottimali, fornire una foto chiara o un'analisi di alta qualità per ogni documento.
Formati di file supportati:
Modello PDF Immagine:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTMLLettura ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Documento generale ✔ ✔ Predefinito ✔ ✔ Estrazione personalizzata ✔ ✔ Classificazione personalizzata ✔ ✔ ✔ (2024-02-29-preview) Per PDF e TIFF, è possibile elaborare fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).
Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
Le dimensioni dell'immagine devono essere comprese tra 50 x 50 pixel e 10.000 px x 10.000 pixel.
Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
L'altezza minima del testo da estrarre è di 12 pixel per un'immagine da 1024 x 768 pixel. Questa dimensione corrisponde a circa
8
-point text a 150 punti per pollice (DPI).Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello di modello personalizzato e 50.000 per il modello neurale personalizzato.
Per il training del modello di estrazione personalizzato, le dimensioni totali dei dati di training sono di 50 MB per il modello di modello e 1G-MB per il modello neurale.
Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono
1GB
pari a un massimo di 10.000 pagine.
Nota
Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento non del servizio Di intelligence dei documenti.
Migrazione della versione
Per informazioni su come usare Document Intelligence v3.0 nelle applicazioni, seguire la guida alla migrazione di Document Intelligence v3.1
Passaggi successivi
Provare a elaborare moduli e documenti personalizzati con Document Intelligence Studio.
Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.
Provare a elaborare moduli e documenti personalizzati con lo strumento di etichettatura di esempio di Document Intelligence.
Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.