Novità di Azure Riconoscimento modulo

Riconoscimento modulo servizio viene aggiornato in modo continuativo. Segnalibro questa pagina per rimanere aggiornati con note sulla versione, miglioramenti delle funzionalità e aggiornamenti della documentazione.

Settembre 2022

Espansione dell'area per il training di modelli neurali personalizzati

Il training di modelli neurali personalizzati è ora supportato in sei aree aggiuntive.

  • Australia orientale
  • Stati Uniti centrali
  • Asia orientale
  • Francia centrale
  • Regno Unito meridionale
  • Stati Uniti occidentali 2

Per un elenco completo delle aree in cui è supportato il training, vedere modelli neurali personalizzati.

versione ga di Riconoscimento modulo SDK versione 4.0.0

  • Riconoscimento modulo SDK versione 4.0.0 (.NET/C#, Java, JavaScript) e versione 3.2.0 (Python) sono disponibili a livello generale e pronti per l'uso nelle applicazioni di produzione!

  • Per altre informazioni sugli SDK di Riconoscimento modulo, vedere la panoramica dell'SDK.

  • Aggiornare le applicazioni usando la guida alla migrazione del linguaggio di programmazione (vedere di seguito).

Nota

A partire dalla versione 4.0.0, è stato introdotto un nuovo set di client per sfruttare le funzionalità più recenti del servizio Riconoscimento modulo.

Questa versione include gli aggiornamenti seguenti:

  • Versione 4.0.0 GA (2022-09-08)
  • Supporta client API REST v3.0 e v2.0

Pacchetto (NuGet)

Cronologia modifiche/rilascio

Guida alla migrazione

Leggimi

Esempi

Agosto 2022

versione di anteprima di Riconoscimento modulo SDK beta agosto 2022

Questa versione include gli aggiornamenti seguenti:

Versione 4.0.0-beta.5 (2022-08-09)

Cronologia modifiche/rilascio

Pacchetto (NuGet)

Documentazione di riferimento sull'SDK

Riconoscimento modulo v3.0 disponibile a livello generale

Riconoscimento modulo'API REST v3.0 è ora disponibile a livello generale e pronto per l'uso nelle applicazioni di produzione! Aggiornare le applicazioni con l'API REST versione 2022-08-31.

La versione di agosto introduce le nuove funzionalità e gli aggiornamenti seguenti:

aggiornamenti Riconoscimento modulo Studio
  • Passaggi successivi. In ogni pagina del modello, Studio ha ora una sezione passaggi successivi. Gli utenti possono fare rapidamente riferimento al codice di esempio, alle linee guida per la risoluzione dei problemi e alle informazioni sui prezzi.

  • Modelli personalizzati. Studio include ora la possibilità di riordinare le etichette nei progetti di modello personalizzati per migliorare l'efficienza dell'etichettatura.

  • Copiare modelli I modelli personalizzati possono essere copiati tra i servizi Riconoscimento modulo dall'interno di Studio. L'operazione consente la promozione di un modello sottoposto a training in altri ambienti e aree.

  • Eliminare documenti. Studio supporta ora l'eliminazione di documenti da set di dati etichettati all'interno di progetti personalizzati.

aggiornamenti del servizio Riconoscimento modulo
  • pre-lettura predefinita. Il modello OCR di lettura è ora disponibile anche in Riconoscimento modulo con paragrafi e rilevamento della lingua come due nuove funzionalità. Riconoscimento modulo Scenari di documento avanzati di lettura allineati alle funzionalità di intelligence dei documenti più ampie in Riconoscimento modulo.

  • layout predefinito. Il modello di layout estrae paragrafi e se il testo estratto è un paragrafo, titolo, intestazione di sezione, nota a piè di pagina, piè di pagina o numero di pagina.

  • fattura predefinita. I campi TotalVAT e Line/IVA verranno ora risolti rispettivamente nei campi TotalTax e Line/Tax esistenti.

  • predefinito-idDocument. Supporto per l'estrazione dei dati per l'ID stato degli Stati Uniti, la sicurezza sociale e le carte verdi. Supporto per le informazioni sul visto di passaporto.

  • ricevuta predefinita. Supporto delle impostazioni locali espanse per francese (fr-FR), spagnolo (es-ES), portoghese (pt-PT), italiano (it-IT) e tedesco (de-DE).

  • predefinito-businessCard. Supporto per l'analisi degli indirizzi per estrarre i sottocampi per i componenti degli indirizzi, ad esempio indirizzo, città, stato, paese e codice postale.

  • Miglioramenti della qualità dell'intelligenza artificiale

    • pre-lettura predefinita. Supporto avanzato per singoli caratteri, date scritte a mano, importi, nomi, altre entità comunemente trovate nelle ricevute e nelle fatture, oltre a migliorare l'elaborazione dei documenti PDF digitali.

    • layout predefinito. Supporto per il rilevamento migliore delle tabelle ritagliate, delle tabelle senza bordo e del miglioramento del riconoscimento delle celle con estensione prolungata.

    • predefinito-document. Miglioramento del valore e rilevamento delle caselle di controllo.

    • custom-neural. Precisione migliorata per il rilevamento e l'estrazione delle tabelle.

Giugno 2022

aggiornamento di giugno Riconoscimento modulo Studio

La versione di giugno è l'aggiornamento più recente del Riconoscimento modulo Studio. Esistono notevoli miglioramenti relativi all'esperienza utente e all'accessibilità risolti in questo aggiornamento:

  • Esempio di codice per Javascript e C#. La scheda Codice Studio aggiunge ora esempi di codice JavaScript e C# oltre a quello esistente di Python.
  • Nuova interfaccia utente di caricamento del documento. Studio supporta ora il caricamento di un documento con trascinamento & nella nuova interfaccia utente di caricamento.
  • Nuova funzionalità per i progetti personalizzati. I progetti personalizzati supportano ora la creazione di account di archiviazione e BLOB durante la configurazione del progetto. Inoltre, il progetto personalizzato supporta ora il caricamento di file di training direttamente all'interno di Studio e la copia del modello personalizzato esistente.

Riconoscimento modulo versione di anteprima v3.0

La versione 2022-06-30-preview presenta aggiornamenti estesi nelle API di funzionalità:

versione di anteprima di Riconoscimento modulo SDK beta giugno 2022

Questa nuova versione include gli aggiornamenti seguenti:

Febbraio 2022

Riconoscimento modulo versione di anteprima v3.0

Riconoscimento modulo versione di anteprima v3.0 introduce diverse nuove funzionalità e funzionalità e migliora quella esistente:

  • Il modello neurale personalizzato o il modello di documento personalizzato è un nuovo modello personalizzato per estrarre i segni di testo e selezione da moduli strutturati, semistrutured e documenti non strutturati.
  • Il modello predefinito W-2 è un nuovo modello predefinito per estrarre i campi dai moduli W-2 per scenari di verifica delle imposte e del reddito.
  • Leggere L'API estrae righe di testo stampate, parole, posizioni di testo, lingue rilevate e testo scritto a mano, se rilevato.
  • Il modello preliminare del documento generale viene ora aggiornato per supportare i contrassegni di selezione oltre al testo dell'API, alle tabelle, alla struttura, alle coppie chiave-valore e alle entità denominate dai moduli e dai documenti.
  • API fattura Il modello predefinito della fattura espande il supporto per le fatture spagnole.
  • Riconoscimento modulo Studio aggiunge nuove demo per gli esempi di lettura, W2, ricezione hotel e supporto per il training dei nuovi modelli neurali personalizzati.
  • L'espansione della lingua Riconoscimento modulo lettura, layout e modulo personalizzato aggiunge il supporto per 42 nuove lingue, tra cui arabo, hindi e altre lingue usando script arabo e Devanagari per espandere la copertura a 164 lingue. Il supporto della lingua scritto a mano si espande in giapponese e coreano.

Introduzione alla nuova API REST, Python o .NET SDK per l'API di anteprima v3.0.

Riconoscimento modulo estrazione dei dati del modello

Modello Estrazione del testo Coppie chiave-valore Contrassegni di selezione Tabelle Firme
Lettura
Documento generale
Layout
Fattura
Ricevuta
Documento di identità
Biglietto da visita
Modello personalizzato
Neurale personalizzato

versione beta di Riconoscimento modulo SDK

Questa nuova versione include gli aggiornamenti seguenti:

Novembre 2021

Riconoscimento modulo aggiornamento della versione dell'SDK di anteprima v3.0 (beta.2)

La versione beta.2 degli SDK di Azure Riconoscimento modulo è stata rilasciata. Questa nuova versione beta incorpora correzioni di bug e aggiornamenti di funzionalità secondari.

Versione 4.0.0-beta.2 (2021-11-09)

| Pacchetto (NuGet) | Changelog | Documentazione di riferimento sulle API

Correzione di bug

L'oggetto BuildModelOperation e CopyModelOperation ora popola correttamente la PercentCompleted proprietà e non restituisce più un valore costante pari a 0.

Ottobre 2021

Riconoscimento modulo versione di anteprima v3.0 (beta.1)

Versione 4.0.0-beta.1 (2021-10-07)

Riconoscimento modulo versione di anteprima v3.0 introduce diverse nuove funzionalità e funzionalità:

  • Il modello di documento generale è una nuova API che usa un modello pre-sottoposto a training per estrarre testo, tabelle, strutture, coppie chiave-valore e entità denominate da moduli e documenti.

  • Modello di ricezione hotel aggiunto all'elaborazione delle ricevute predefinite.

  • Campi espansi per il documento ID il modello ID supporta l'approvazione, le restrizioni e l'estrazione della classificazione dei veicoli dalle licenze del conducente degli Stati Uniti.

  • Il campo firma è un nuovo tipo di campo nei moduli personalizzati per rilevare la presenza di una firma in un campo modulo.

  • Espansione del linguaggio Supporto per 122 lingue (stampa) e 7 lingue (scritte a mano). Riconoscimento modulo Layout e Modulo personalizzato espandono le lingue supportate fino a 122 con l'anteprima più recente. L'anteprima include l'estrazione di testo per stampare testo in 49 nuove lingue, tra cui russo, bulgaro e altre lingue ciriliche e più latine. Inoltre, l'estrazione di testo scritto a mano supporta ora sette lingue che includono l'inglese e le nuove anteprime del cinese semplificato, francese, tedesco, italiano, portoghese e spagnolo.

  • Miglioramenti dell'estrazione di testo e tabelle Il layout supporta ora l'estrazione di tabelle a righe singole denominate anche tabelle chiave-valore. I miglioramenti dell'estrazione del testo includono un'elaborazione migliore dei pdf digitali e del testo della zona leggibile (MRZ) nei documenti di identità, oltre alle prestazioni generali.

  • Riconoscimento modulo Studio Per semplificare l'uso del servizio, è ora possibile accedere all'Riconoscimento modulo Studio per testare i diversi modelli predefiniti o etichette e eseguire il training di un modello personalizzato

Introduzione alla nuova API REST, Python o .NET SDK per l'API di anteprima v3.0.

Riconoscimento modulo estrazione dei dati del modello

Modello Estrazione del testo Coppie chiave-valore Contrassegni di selezione Tabelle Entità
Documento generale
Layout
Fattura
Ricevuta
Documento di identità
Biglietto da visita
Personalizzato

Settembre 2021

Menu Monitoraggio

Screenshot che mostra il menu di monitoraggio nel portale di Azure

Grafici

Screenshot che mostra un grafico delle metriche di esempio nella portale di Azure.

  • Aggiornamento del modello di documento ID : nomi specificati, tra cui un suffisso, con o senza un periodo (arresto completo), processo riuscito:

    Testo di input Risultato con aggiornamento
    William Isaac Kirby Jr. FirstName: William Isaac

    LastName: Kirby Jr.
    Henry Caleb Ross Sr FirstName: Henry Caleb

    LastName: Ross Sr

Luglio 2021

Supporto delle identità gestite assegnate dal sistema

È ora possibile abilitare un'identità gestita assegnata dal sistema per concedere Riconoscimento modulo accesso limitato agli account di archiviazione privati, inclusi gli account protetti da una Rete virtuale o da un firewall o un firewall abilitato per bring-your-own-storage (BYOS). Per altre informazioni, vedereCreare e usare l'identità gestita per la risorsa Riconoscimento modulo.

Giugno 2021

Riconoscimento modulo contenitori v2.1 rilasciati in anteprima gated

Riconoscimento modulo funzionalità sono ora supportate da sei contenitori di funzionalità: layout, carta business, documento ID, ricevuta, fattura e personalizzato. Per usarli, è necessario inviare una richiesta online e ricevere l'approvazione.

VedereInstallare ed eseguire contenitori Docker per Riconoscimento modulo eConfigurare contenitori Riconoscimento modulo

Riconoscimento modulo connettore rilasciato in anteprima

Il connettore Riconoscimento modulo si integra con App per la logica di Azure, Microsoft Power Automate e Microsoft Power Apps. Il connettore supporta azioni e trigger del flusso di lavoro per estrarre e analizzare i dati e la struttura dei documenti da moduli personalizzati e predefiniti, fatture, fatture, ricevute, biglietti da visita e documenti ID.

Riconoscimento modulo SDK v3.1.0 patched to v3.1.1 for C#, Java e Python

Le fatture delle patch che non dispongono di campi dell'elemento di sottolinea rilevati, ad esempio un FormField oggetto con Text ma senza BoundingBox informazioni o Page .

Maggio 2021

Riconoscimento modulo versione disponibile a livello generale dell'API 2.1

Introduzione

Passare allo strumento di esempio Riconoscimento modulo e seguire la guida introduttiva

Il layout aggiunge intestazioni di tabella

La funzionalità di tabella DELL'API Layout aggiornata aggiunge il riconoscimento dell'intestazione con intestazioni di colonna che possono estendersi su più righe. Ogni cella della tabella ha un attributo che indica se fa parte di un'intestazione o meno. Questo aggiornamento può essere usato per identificare le righe che costituiscono l'intestazione della tabella.

Aggiornamenti degli SDK

| Documentazione di | riferimento Pacchetto NuGet versione 3.0.1 |

Modifiche che non causano un'interruzione

  • La classe FormRecognizerModelFactory supporta ora gli aggiornamenti a TextAppearance e ReadingOrder e la rimozione dei modelli TextStyle . Vedere Modifiche di rilievo

Modifiche di rilievo (maggio)

  • Il client viene predefinito alla versione del servizio supportata più recente, attualmente v2.1. È possibile specificare la versione 2.0 nella proprietà Version dell'oggetto FormRecognizerClientOptions.

  • StartRecognizeIdentityDocuments. Metodi e parametri di metodo rinominati usando Identity per sostituire la parola chiave Id per tutte le funzionalità api di riconoscimento dei documenti di identità correlate.

  • FormReadingOrder. ReadingOrder rinominato in FormReadingOrder.

  • AsCountryRegion. AsCountryCode rinominato asCountryRegion.

  • TextAppearance include ora proprietà StyleName e StyleConfidence (in precedenza parte dell'oggetto TextStyle ).

  • FieldValueType. Valore Gender rimosso dal modello.

  • Modello TextStyle rimosso.

  • Tipo FieldValueGender rimosso.

Aprile 2021

Aggiornamenti di anteprima dell'SDK per l'API versione 2.1-preview.3

Pacchetto NuGet versione 3.1.0-beta.4

  • Nuovi metodi per analizzare i dati dai documenti di identità:

    StartRecognizeIdDocumentsFromUriAsync

    StartRecognizeIdDocumentsAsync

    Per un elenco di valori di campo, vedereCampi estratti nella documentazione di Riconoscimento modulo.

  • Espanso il set di lingue di documento che possono essere fornite al metodo StartRecognizeContent .

  • Nuova proprietà Pages supportata dalle classi seguenti:

    RecognizeBusinessCardsOptions
    RecognizeCustomFormsOptions
    RecognizeInvoicesOptions
    RecognizeReceiptsOptions

    La Pages proprietà consente di selezionare singoli o un intervallo di pagine per documenti PDF a più pagine e TIFF. Per le singole pagine immettere il numero di pagina, ad esempio 3. Per un intervallo di pagine (ad esempio pagina 2 e pagine 5-7) immettere i numeri di età p e gli intervalli separati da virgole: 2, 5-7.

  • Nuova proprietà ReadingOrder supportata per la classe seguente:

    RecognizeContentOptions

    La ReadingOrder proprietà è un parametro facoltativo che consente di specificare l'algoritmo di lettura dell'ordine dibasic lettura o naturalche deve essere applicato per ordinare l'estrazione di elementi di testo. Se non è specificato, il valore predefinito è basic.

Modifiche di rilievo (aprile)

  • Il client viene predefinito nella versione più recente del servizio supportato, attualmente 2.1-preview.3.

  • Il metodo StartRecognizeCustomForms genera ora un valore RequestFailedException() quando viene passato un file non valido.

Marzo 2021

Riconoscimento modulo versione 2.1 pubblica 3 è ora disponibile. È stata rilasciata la versione 2.1-preview.3, incluse le funzionalità seguenti:

  • Nuovo modello ID predefinito Il nuovo modello ID predefinito consente ai clienti di accettare ID e restituire dati strutturati per automatizzare l'elaborazione. Combina le nostre potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con i modelli di comprensione ID per estrarre le informazioni chiave dai passaporti e dalle licenze di driver statunitensi.

    Altre informazioni sul modello ID predefinito

    Esempio di passaporto

  • Estrazione di elementi line-item per il modello di fattura : il modello fattura predefinita supporta ora l'estrazione degli elementi della riga; estrae ora elementi completi e le relative parti : descrizione, quantità, quantità, ID prodotto, data e altro ancora. Con una semplice chiamata API/SDK, è possibile estrarre dati utili dalle fatture: testo, tabella, coppie chiave-valore e elementi di riga.

    Altre informazioni sul modello di fattura

  • Etichettatura e training delle tabelle con supervisione, etichettatura di valori vuoti: oltre alle funzionalità di estrazione automatica delle tabelle di deep learning di Riconoscimento modulo, ora consente ai clienti di etichettare e eseguire il training sulle tabelle. Questa nuova versione include la possibilità di etichettare e eseguire il training su elementi/tabelle di riga (dinamici e fissi) e eseguire il training di un modello personalizzato per estrarre coppie chiave-valore e elementi di riga. Una volta eseguito il training di un modello, il modello estraerà gli elementi di riga come parte dell'output JSON nella sezione documentResults.

    Etichettatura tabelle

    Oltre alle tabelle di etichettatura, è ora possibile etichettare valori e aree vuote. Se alcuni documenti nel set di training non hanno valori per determinati campi, è possibile etichettarli in modo che il modello sappia estrarre i valori correttamente dai documenti analizzati.

  • Supporto per 66 nuove lingue: l'API layout e i modelli personalizzati per Riconoscimento modulo ora supportano 73 lingue.

    Altre informazioni sul supporto linguistico di Riconoscimento modulo

  • Ordine di lettura naturale, classificazione della grafia e selezione di pagine: con questo aggiornamento è possibile scegliere di ottenere gli output della riga di testo nell'ordine di lettura naturale anziché l'ordinamento predefinito da sinistra a destra e in alto a basso. Usare il nuovo parametro di query readingOrder e impostarlo sul valore "naturale" per un output dell'ordine di lettura più descrittivo. Inoltre, per le lingue latine, Riconoscimento modulo classifica le righe di testo come stile scritto a mano o meno e assegnano un punteggio di attendibilità.

  • Miglioramenti della qualità del modello di ricezione predefiniti Questo aggiornamento include molti miglioramenti qualitativi per il modello di ricevuta predefinito, in particolare per l'estrazione degli elementi di riga.

Novembre 2020

Nuove funzionalità

Riconoscimento modulo anteprima pubblica 2.1 è ora disponibile. È stata rilasciata la versione 2.1-preview.2, incluse le funzionalità seguenti:

  • Nuovo modello di fattura predefinito: il nuovo modello di fattura predefinita consente ai clienti di accettare fatture in vari formati e restituire dati strutturati per automatizzare l'elaborazione della fattura. Combina le nostre potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con i modelli di deep learning per l'analisi delle fatture per estrarre le informazioni chiave dalle fatture in inglese. Estrae testo chiave, tabelle e informazioni come cliente, fornitore, ID fattura, data di scadenza fattura, totale, importo dovuto, importo fiscale, spedizione e fattura.

    Altre informazioni sul modello di fattura predefinito

    esempio di fattura

  • Estrazione avanzata di tabelle: Riconoscimento modulo ora offre un'estrazione avanzata delle tabelle, che combina le potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con un modello di estrazione delle tabelle di Deep Learning. Riconoscimento modulo possibile estrarre dati da tabelle, incluse tabelle complesse con colonne unite, righe, senza bordi e altro ancora.

    Esempi di tabelle

    Altre informazioni sull'estrazione del layout

  • Aggiornamento della libreria client: le versioni più recenti delle librerie client per .NET, Python, Java e JavaScript supportano l'API Riconoscimento modulo 2.1.

  • Nuova lingua supportata: giapponese: sono ora supportate le nuove lingue seguenti: per AnalyzeLayout e AnalyzeCustomForm: giapponese (ja). Lingue supportate

  • Indicazione dello stile della riga di testo (solo lingue latine) (solo lingue latine): Riconoscimento modulo ora restituisce un appearance oggetto che classifica se ogni riga di testo è o meno uno stile scritto a mano, insieme a un punteggio di attendibilità. Questa funzionalità è supportata solo per le lingue latine.

  • Miglioramenti della qualità : miglioramenti dell'estrazione, inclusi miglioramenti all'estrazione a cifra singola.

  • Nuova funzionalità try-it-out nello strumento di esempio e etichettatura Riconoscimento modulo: possibilità di provare modelli predefiniti di fattura, ricevuta e biglietto da visita e API layout usando lo strumento di etichettatura di esempio Riconoscimento modulo. Vedere in che modo i dati verranno estratti senza scrivere codice.

    Provare lo strumento di etichettatura di esempio Riconoscimento modulo

    Screenshot: strumento di etichettatura di esempio.

  • Ciclo di feedback : quando si analizzano i file tramite lo strumento di etichettatura di esempio, è ora possibile aggiungerlo anche al set di training e modificare le etichette, se necessario ed eseguire il training per migliorare il modello.

  • Documenti etichetta automaticamente: etichette aggiunte automaticamente documenti in base ai documenti etichettati in precedenza nel progetto.

Agosto 2020

Nuove funzionalità

Riconoscimento modulo anteprima pubblica v2.1 è ora disponibile. La versione 2.1-preview.1 è stata rilasciata, incluse le funzionalità seguenti:

  • Informazioni di riferimento sulle API REST sono disponibili : visualizzare le informazioni di riferimento sulla versione 2.1-preview.1
  • Nuove lingue supportate Oltre all'inglese, sono ora supportate le lingue seguenti: per Layout e Train Custom Model: inglese (en), cinese (semplificato) (), olandese (nlzh-Hans), francese (fr), tedesco (de), italiano (it), portoghese (pt) e spagnolo (es).
  • Casella di controllo/Rilevamento dei segni di selezione: Riconoscimento modulo supporta il rilevamento e l'estrazione di segni di selezione, ad esempio caselle di controllo e pulsanti di opzione. I contrassegni di selezione vengono estratti e Layout ora è anche possibile etichettare ed eseguire il training in Train Custom Model - Train with Labels (Esegui training con etichette ) per estrarre coppie chiave-valore per i contrassegni di selezione.
  • Model Compose : consente di comporre e chiamare più modelli con un singolo ID modello. Quando si invia un documento da analizzare con un ID modello composto, viene prima eseguito un passaggio di classificazione per instradarlo al modello personalizzato corretto. Model Compose è disponibile per Train Custom Model - Train with labels (Esegui training con etichette).
  • Nome modello : aggiungere un nome descrittivo ai modelli personalizzati per semplificare la gestione e il rilevamento.
  • Nuovo modello predefinito per biglietti da visita per estrarre campi comuni in inglese, biglietti da visita in lingua inglese.
  • Nuove impostazioni locali per ricevute predefinite oltre a EN-US, il supporto è ora disponibile per EN-AU, EN-CA, EN-GB, EN-IN
  • Miglioramenti della qualità per Layout, Train Custom Model - Eseguire il training senza etichette ed eseguire il training con etichette.

La versione 2.0 include l'aggiornamento seguente:

  • Le librerie client per NET, Python, Java e JavaScript hanno immesso la disponibilità generale.

I nuovi esempi sono disponibili in GitHub.

Luglio 2020

Nuove funzionalità

  • Informazioni di riferimento sulla versione 2.0 disponibili : visualizzare le informazioni di riferimento sulle API v2.0 e gli SDK aggiornati per .NET, Python, Java e JavaScript.

  • Miglioramenti delle tabelle e miglioramenti dell'estrazione: include miglioramenti dell'accuratezza e miglioramenti delle estrazione di tabelle, in particolare la possibilità di apprendere le intestazioni e le strutture delle tabelle nel training personalizzato senza etichette.

  • Supporto valuta : rilevamento ed estrazione di simboli di valuta globali.

  • Azure Gov: Riconoscimento modulo è ora disponibile anche in Azure Gov.

  • Funzionalità di sicurezza avanzate:

    • Bring Your Own Key: Riconoscimento modulo crittografa automaticamente i dati quando vengono salvati in modo permanente nel cloud per proteggerli e per soddisfare gli impegni di sicurezza e conformità dell'organizzazione. Per impostazione predefinita, la sottoscrizione usa chiavi di crittografia gestite da Microsoft. È ora anche possibile gestire la sottoscrizione con le proprie chiavi di crittografia. Le chiavi gestite dal cliente, note anche come BYOK (Bring Your Own Key), offrono una maggiore flessibilità per creare, ruotare, disabilitare e revocare i controlli di accesso. È anche possibile controllare le chiavi di crittografia usate per proteggere i dati.
    • Endpoint privati: consente a una rete virtuale di accedere in modo sicuro ai dati tramite un collegamento privato.

Giugno 2020

Nuove funzionalità

Aprile 2020

Nuove funzionalità

  • Supporto SDK per Riconoscimento modulo API v2.0 Anteprima pubblica: questo mese è stato esteso il supporto del servizio per includere un SDK di anteprima per Riconoscimento modulo versione 2.0. Usare i collegamenti seguenti per iniziare a usare la lingua preferita:

    Il nuovo SDK supporta tutte le funzionalità dell'API REST v2.0 per Riconoscimento modulo. È possibile condividere commenti e suggerimenti sugli SDK tramite il modulo Commenti e suggerimenti dell'SDK.

  • Copia modello personalizzato È ora possibile copiare modelli tra aree e sottoscrizioni usando la nuova funzionalità Copia modello personalizzato. Prima di richiamare l'API Copia modello personalizzato, è prima necessario ottenere l'autorizzazione per la copia nella risorsa di destinazione. Questa autorizzazione è protetta chiamando l'operazione copia autorizzazione sull'endpoint della risorsa di destinazione.

Miglioramenti della sicurezza

Marzo 2020

Nuove funzionalità

  • Tipi di valore per l'etichettatura È ora possibile specificare i tipi di valori etichettati con lo strumento di etichettatura di esempio Riconoscimento modulo. Sono attualmente supportati i tipi di valore e le varianti seguenti:

    • string
      • predefinito, no-whitespaces, alphanumeric
    • number
      • predefinito, currency
    • date
      • predefinito, dmy, mdy, ymd
    • time
    • integer

    Per informazioni su come usare questa funzionalità, vedere la guida dello strumento di etichettatura di esempio.

  • Visualizzazione tabella Lo strumento Di etichettatura di esempio visualizza ora le tabelle riconosciute nel documento. Questa funzionalità consente di visualizzare le tabelle riconosciute ed estratte dal documento prima di etichettare e analizzare. Questa funzionalità può essere attivata/disattivata usando l'opzione livelli.

    L'immagine seguente è un esempio di come vengono riconosciute ed estratte le tabelle:

    Visualizzazione tabella con lo strumento di etichettatura di esempio

    Le tabelle estratte sono disponibili nell'output JSON in "pageResults".

    Importante

    Le tabelle di etichettatura non sono supportate. Se le tabelle non vengono riconosciute e aggiuntive automaticamente, è possibile etichettarle solo come coppie chiave/valore. Quando si etichettano le tabelle come coppie chiave/valore, etichettare ogni cella come valore univoco.

Miglioramenti dell'estrazione

Questa versione include miglioramenti di estrazione e miglioramenti dell'accuratezza, in particolare, la capacità di etichettare ed estrarre più coppie chiave/valore nella stessa riga di testo.

Lo strumento di etichettatura di esempio è ora open source

Lo strumento di etichettatura di esempio Riconoscimento modulo è ora disponibile come progetto open source. È possibile integrarlo all'interno delle soluzioni e apportare modifiche specifiche del cliente per soddisfare le proprie esigenze.

Per altre informazioni sullo strumento di etichettatura di esempio Riconoscimento modulo, vedere la documentazione disponibile in GitHub.

Imposizione di TLS 1.2

TLS 1.2 viene ora applicato per tutte le richieste HTTP a questo servizio. Per altre informazioni, vedere Sicurezza di Servizi cognitivi di Azure.

Gennaio 2020

Questa versione introduce l'Riconoscimento modulo 2.0. Nelle sezioni seguenti sono disponibili altre informazioni sulle nuove funzionalità, miglioramenti e modifiche.

Nuove funzionalità

  • Modello personalizzato

    • Eseguire il training con le etichette È ora possibile eseguire il training di un modello personalizzato con dati etichettati manualmente. Questo metodo genera modelli con prestazioni migliori e può produrre modelli che funzionano con forme complesse o moduli contenenti valori senza chiavi.
    • API asincrona È possibile usare chiamate API asincrone per eseguire il training con e analizzare set di dati e file di grandi dimensioni.
    • Supporto file TIFF È ora possibile eseguire il training con ed estrarre dati dai documenti TIFF.
    • Miglioramenti dell'accuratezza dell'estrazione
  • Modello di ricevuta predefinito

    • Quantità di suggerimento È ora possibile estrarre gli importi della punta e altri valori scritti a mano.
    • Estrazione di elementi della riga È possibile estrarre i valori dell'elemento riga dalle ricevute.
    • Valori di attendibilità È possibile visualizzare la attendibilità del modello per ogni valore estratto.
    • Miglioramenti dell'accuratezza dell'estrazione
  • Estrazione layout È ora possibile usare l'API Layout per estrarre dati di testo e dati di tabella dai moduli.

Modifiche dell'API modello personalizzate

Tutte le API per il training e l'uso di modelli personalizzati sono state rinominate e alcuni metodi sincroni sono ora asincroni. Di seguito sono riportate le modifiche principali:

  • Il processo di training di un modello è ora asincrono. Si avvia il training tramite la chiamata API /custom/models . Questa chiamata restituisce un ID operazione, che è possibile passare a custom/models/{modelID} per restituire i risultati del training.
  • L'estrazione chiave/valore è ora avviata dalla chiamata api /custom/models/{modelID}/analizza . Questa chiamata restituisce un ID operazione, che è possibile passare a custom/models/{modelID}/analyzeResults/{resultID} per restituire i risultati dell'estrazione.
  • Gli ID operazione per l'operazione Train sono ora disponibili nell'intestazione Location delle risposte HTTP, non nell'intestazione Operation-Location .

Modifiche all'API di ricezione

Le API per la lettura delle ricevute di vendita sono state rinominate.

  • L'estrazione dei dati di ricezione è ora avviata dalla chiamata api /predefinita/ricevuta/analisi . Questa chiamata restituisce un ID operazione, che è possibile passare a /prebuilt/receipt/analysisResults/{resultID} per restituire i risultati dell'estrazione.

Modifiche al formato di output

Le risposte JSON per tutte le chiamate API hanno nuovi formati. Alcune chiavi e valori sono stati aggiunti, rimossi o rinominati. Per esempi dei formati JSON correnti, vedere le guide introduttive.

Passaggi successivi

Completare una guida introduttiva per iniziare a scrivere un'app per l'elaborazione di moduli con Riconoscimento modulo nel linguaggio di sviluppo preferito.

Vedere anche