Modello di contratto di Intelligence per documenti

Importante

  • Le versioni di anteprima pubblica di Document Intelligence consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo.
  • Le funzionalità, gli approcci e i processi possono cambiare, prima della disponibilità generale, in base al feedback degli utenti.
  • La versione di anteprima pubblica delle librerie client di Document Intelligence per impostazione predefinita è l'API REST versione 2024-02-29-preview.
  • L'anteprima pubblica versione 2024-02-29-preview è attualmente disponibile solo nelle aree di Azure seguenti:
  • Stati Uniti orientali
  • Stati Uniti occidentali2
  • Europa occidentale

Questo contenuto si applica a:segno di spuntav4.0 (anteprima) | Versione precedente:segno di spunta bluv3.1 (GA)

Questo contenuto si applica a:v3.1segno di spunta (GA) | Versione più recente:segno di spunta violav4.0 (anteprima)

Il modello di contratto document intelligence usa potenti funzionalità di riconoscimento ottico dei caratteri (OCR) per analizzare ed estrarre campi chiave ed elementi di riga da un gruppo selezionato di entità di contratto importanti. I contratti possono essere di vari formati e qualità, tra cui immagini acquisite dal telefono, documenti analizzati e PDF digitali. L'API analizza il testo del documento; estrae informazioni chiave come parti, giurisdizioni, ID contratto e titolo; e restituisce una rappresentazione di dati JSON strutturata. Il modello supporta attualmente i formati di documento in lingua inglese.

Elaborazione automatica dei contratti

L'elaborazione automatica dei contratti è il processo di estrazione dei campi del contratto chiave dai documenti. Storicamente, il processo di analisi del contratto viene ottenuto manualmente e, di conseguenza, molto dispendioso in termini di tempo. L'estrazione accurata dei dati chiave dai contratti è in genere il primo e uno dei passaggi più critici del processo di automazione del contratto.

Opzioni di sviluppo

Document Intelligence v4.0 (2024-02-29-preview) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di contratto Document Intelligence Studio
• API
REST•
C# SDK
Python SDK
Java SDK
JavaScript SDK
precompilt-contract

Document Intelligence v3.1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di contratto Document Intelligence Studio
• API
REST•
C# SDK
Python SDK
Java SDK
JavaScript SDK
precompilt-contract

Document Intelligence v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modello di contratto Document Intelligence Studio
• API
REST•
C# SDK
Python SDK
Java SDK
JavaScript SDK
precompilt-contract

Requisiti di input

  • Per ottenere risultati ottimali, fornire una foto chiara o un'analisi di alta qualità per ogni documento.

  • Formati di file supportati:

    Modello PDF Immagine:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Lettura
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Documento generale
    Predefinito
    Estrazione personalizzata
    Classificazione personalizzata ✔ (2024-02-29-preview)
  • Per PDF e TIFF, è possibile elaborare fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).

  • Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).

  • Le dimensioni dell'immagine devono essere comprese tra 50 x 50 pixel e 10.000 px x 10.000 pixel.

  • Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.

  • L'altezza minima del testo da estrarre è di 12 pixel per un'immagine da 1024 x 768 pixel. Questa dimensione corrisponde a circa 8-point text a 150 punti per pollice (DPI).

  • Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello di modello personalizzato e 50.000 per il modello neurale personalizzato.

    • Per il training del modello di estrazione personalizzato, le dimensioni totali dei dati di training sono di 50 MB per il modello di modello e 1G-MB per il modello neurale.

    • Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono 1GB pari a un massimo di 10.000 pagine.

Provare l'estrazione dei dati dei documenti del contratto

Vedere in che modo i dati, incluse le informazioni sui clienti, i dettagli del fornitore e le voci, vengono estratti dai contratti. Sono necessarie le risorse seguenti:

  • Una sottoscrizione di Azure: è possibile crearne una gratuitamente.

  • Istanza di Document Intelligence nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (F0). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per ottenere la chiave e l'endpoint.

Screenshot delle chiavi e della posizione dell'endpoint nella portale di Azure.

Document Intelligence Studio

  1. Nella home page di Document Intelligence Studio selezionare Documenti fiscali.

  2. È possibile analizzare i documenti fiscali di esempio o caricare i propri file.

  3. Selezionare il pulsante Esegui analisi e, se necessario, configurare le opzioni Analizza:

    Screenshot dei pulsanti Esegui analisi e Analizza opzioni in Document Intelligence Studio.

Lingue e impostazioni locali supportate

Per un elenco completo delle lingue supportate, vedere la pagina Dei modelli predefiniti.

Estrazione di campi

Di seguito sono riportati i campi estratti da un contratto nella risposta di output JSON.

Nome Tipo Descrizione Output di esempio
Title String Titolo contratto Contratto di assistenza
ContractId String Titolo contratto AB12956
Entità Matrice Elenco delle parti legali
ExecutionDate Data Data in cui l'accordo è stato firmato e concordato da tutte le parti On this twenty-third day of February two thousand and twenty two
ExpirationDate Data Data di scadenza del contratto Un anno
RenewalDate Data Data di rinnovo del contratto On this twenty-third day of February two thousand and twenty two
Giurisdizioni Matrice Elenco delle giurisdizioni

Le coppie chiave-valore del contratto e gli elementi di riga estratti si trovano nella documentResults sezione dell'output JSON.

Passaggi successivi

  • Provare a elaborare moduli e documenti personalizzati con Document Intelligence Studio.

  • Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.