Modello di modello personalizzato di Intelligence per documenti

Importante

  • Le versioni di anteprima pubblica di Document Intelligence consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo.
  • Le funzionalità, gli approcci e i processi possono cambiare, prima della disponibilità generale, in base al feedback degli utenti.
  • La versione di anteprima pubblica delle librerie client di Document Intelligence per impostazione predefinita è l'API REST versione 2024-02-29-preview.
  • L'anteprima pubblica versione 2024-02-29-preview è attualmente disponibile solo nelle aree di Azure seguenti:
  • Stati Uniti orientali
  • Stati Uniti occidentali2
  • Europa occidentale

Questo contenuto si applica a:segno di spuntav4.0 (anteprima) | Versioni precedenti:segno di spunta bluv3.1 (GA)segno di spunta bluv3.0 (GA)segno di spunta bluv2.1 (GA)

Questo contenuto si applica a:segno di spuntav3.1 (GA) | Versione più recente:segno di spunta violav4.0 (anteprima) | Versioni precedenti:segno di spunta bluv3.0segno di spunta bluv2.1

Questo contenuto si applica a:segno di spuntav3.0 (GA) | Versioni più recenti:segno di spunta violav4.0 (anteprima)segno di spunta violav3.1 | Versione precedente:segno di spunta bluv2.1

Questo contenuto si applica a:segno di spuntav2.1 | Versione più recente:segno di spunta bluv4.0 (anteprima)

Il modello personalizzato (in precedenza modulo personalizzato) è un modello di documento di facile training che estrae in modo accurato coppie chiave-valore, segni di selezione, tabelle, aree e firme dai documenti. I modelli di modello usano segnali di layout per estrarre valori dai documenti e sono adatti per estrarre campi da documenti altamente strutturati con modelli di oggetto visivo definiti.

I modelli di modello personalizzati condividono lo stesso formato e la stessa strategia di etichettatura dei modelli neurali personalizzati, con il supporto per più tipi e linguaggi di campo.

Funzionalità del modello

I modelli di modello personalizzati supportano coppie chiave-valore, segni di selezione, tabelle, campi di firma e aree selezionate.

Campi del modulo Opzioni di selezione Campi tabulari (tabelle) Firma Aree selezionate
Supportata Supportato Supportato Supportato Supportata

Campi tabulari

Con la versione di API 2022-06-30-preview e versioni successive, i modelli di modello personalizzati aggiungeranno il supporto per i campi tabulari tra pagine (tabelle):

  • Per etichettare una tabella che si estende su più pagine, etichettare ogni riga della tabella tra le diverse pagine di una singola tabella.
  • Come procedura consigliata, assicurarsi che il set di dati contenga alcuni esempi delle variazioni previste. Ad esempio, includere esempi in cui l'intera tabella si trova in una singola pagina e in cui le tabelle si estendono su due o più pagine se si prevede di visualizzare tali variazioni nei documenti.

I campi tabulari sono utili anche quando si estraggono informazioni ripetute all'interno di un documento non riconosciuto come tabella. Ad esempio, una sezione ripetuta di esperienze lavorative in un curriculum può essere etichettata ed estratta come campo tabulare.

Gestione delle variazioni

I modelli di modello si basano su un modello di oggetto visivo definito, le modifiche apportate al modello comportano un'accuratezza inferiore. In questi casi, suddividere il set di dati di training in modo da includere almeno cinque campioni di ogni modello ed eseguire il training di un modello per ognuna delle varianti. È quindi possibile comporre i modelli in un singolo endpoint. Per piccole varianti, ad esempio documenti e immagini PDF digitali, è consigliabile includere almeno cinque esempi di ogni tipo nello stesso set di dati di training.

Requisiti di input

  • Per ottenere risultati ottimali, fornire una foto chiara o un'analisi di alta qualità per ogni documento.

  • Formati di file supportati:

    Modello PDF Immagine:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Lettura
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview o versione successiva)
    Documento generale
    Predefinito
    Personalizzazione

    ✱ i file di Microsoft Office non sono attualmente supportati per altri modelli o versioni.

  • Per PDF e TIFF, è possibile elaborare fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).

  • Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).

  • Le dimensioni dell'immagine devono essere comprese tra 50 x 50 pixel e 10.000 px x 10.000 pixel.

  • Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.

  • L'altezza minima del testo da estrarre è di 12 pixel per un'immagine da 1024 x 768 pixel. Questa dimensione corrisponde a circa 8-point text a 150 punti per pollice (DPI).

  • Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello di modello personalizzato e 50.000 per il modello neurale personalizzato.

  • Per il training del modello di estrazione personalizzato, le dimensioni totali dei dati di training sono di 50 MB per il modello di modello e 1G-MB per il modello neurale.

  • Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono 1GB pari a un massimo di 10.000 pagine.

Training a model

I modelli di modello personalizzati sono disponibili a livello generale con l'API v4.0. Se si inizia con un nuovo progetto o si ha un set di dati etichettato esistente, usare l'API v3.1 o v3.0 con Document Intelligence Studio per eseguire il training di un modello di modello personalizzato.

Modello REST API SDK Etichettare e testare i modelli
Modello personalizzato API v3.1 Document Intelligence SDK Document Intelligence Studio

Con le API v3.0 e successive, l'operazione di compilazione per il training del modello supporta una nuova buildMode proprietà, per eseguire il training di un modello di modello personalizzato, impostare su buildModetemplate.

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-02-29-preview

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

I modelli di modello personalizzati sono disponibili a livello generale con l'API v3.1. Se si inizia con un nuovo progetto o si ha un set di dati etichettato esistente, usare l'API v3.1 o v3.0 con Document Intelligence Studio per eseguire il training di un modello di modello personalizzato.

Modello REST API SDK Etichettare e testare i modelli
Modello personalizzato API v3.1 Document Intelligence SDK Document Intelligence Studio

Con le API v3.0 e successive, l'operazione di compilazione per il training del modello supporta una nuova buildMode proprietà, per eseguire il training di un modello di modello personalizzato, impostare su buildModetemplate.

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Lingue e impostazioni locali supportate

Per un elenco completo delle lingue supportate, vedere la pagina Supporto linguistico : modelli personalizzati.

I modelli personalizzati (modello) sono disponibili a livello generale con l'API v2.1.

Modello REST API SDK Etichettare e testare i modelli
Modello personalizzato (modello) Document Intelligence 2.1 Document Intelligence SDK Strumento di etichettatura di esempio di Document Intelligence

Passaggi successivi

Informazioni su come creare e comporre modelli personalizzati: