Wat is Azure AI Document Intelligence?

Belangrijk

  • Openbare preview-versies van Document Intelligence bieden vroegtijdige toegang tot functies die actief zijn in ontwikkeling.
  • Functies, benaderingen en processen kunnen veranderen, vóór algemene beschikbaarheid (GA), op basis van feedback van gebruikers.
  • De openbare preview-versie van Document Intelligence-clientbibliotheken is standaard ingesteld op REST API-versie 2024-02-29-preview.
  • Openbare preview-versie 2024-02-29-preview is momenteel alleen beschikbaar in de volgende Azure-regio's:
  • VS - oost
  • VS - west 2
  • Europa -west

Deze inhoud is van toepassing op:Vinkjev4.0 (preview) | Vorige versies:blauw-vinkjev3.1 (GA)blauw-vinkjev3.0 (GA)blauw-vinkjev2.1 (GA)

Deze inhoud is van toepassing op:Vinkjev3.1 (GA) | Nieuwste versie:paars vinkjev4.0 (preview) | Vorige versies:blauw-vinkjev3.0blauw-vinkjev2.1

Deze inhoud is van toepassing op:Vinkjev3.0 (GA) | Nieuwste versies:paars vinkjev4.0 (preview)paars vinkjev3.1 | Vorige versie:blauw-vinkjev2.1

Deze inhoud is van toepassing op:Vinkjev2.1 | Nieuwste versie:blauw-vinkjev4.0 (preview)

Notitie

Form Recognizer is nu Azure AI Document Intelligence.

  • Vanaf juli 2023 omvatten Azure AI-services alle eerder bekende cognitive services en Azure-app lied AI Services.
  • Er zijn geen wijzigingen in prijzen.
  • De namen Cognitive Services en Azure-app lied AI blijven worden gebruikt in Azure-facturering, kostenanalyse, prijslijst en prijs-API's.
  • Er zijn geen belangrijke wijzigingen in application programming interfaces (API's) of SDK's voorafgaand aan en inclusief v3.1. Vanaf v4.0 worden API's en SDK's bijgewerkt naar Document Intelligence.
  • Sommige platforms wachten nog steeds op de hernoemingsupdate. Alle vermeldingen van Form Recognizer of Document Intelligence in onze documentatie verwijzen naar dezelfde Azure-service.

Azure AI Document Intelligence is een cloudgebaseerde Azure AI-service waarmee u intelligente oplossingen voor documentverwerking kunt bouwen. Enorme hoeveelheden gegevens, die een groot aantal gegevenstypen omvatten, worden opgeslagen in formulieren en documenten. Met Document Intelligence kunt u de snelheid waarmee gegevens worden verzameld en verwerkt effectief beheren en is essentieel voor verbeterde bewerkingen, geïnformeerde beslissingen op basis van gegevens en verlichte innovatie.

| ✔️ Modellen voor documentanalyse | ✔️ Vooraf samengestelde modellen | ✔️ Aangepaste modellen |

Modellen voor documentanalyse

Documentanalysemodellen maken tekstextractie van formulieren en documenten mogelijk en retourneren gestructureerde zakelijke inhoud die gereed is voor de actie, het gebruik of de voortgang van uw organisatie.


Lezen |
Gedrukte en handgeschreven tekst extraheren.


Indeling | Tekst, tabellen
en documentstructuur extraheren.


Lezen |
Gedrukte en handgeschreven tekst extraheren.


Indeling | Tekst, tabellen
en documentstructuur extraheren.


Algemeen document | Tekst-,
structuur- en sleutel-waardeparen extraheren.

Vooraf samengestelde modellen

Met vooraf samengestelde modellen kunt u intelligente documentverwerking toevoegen aan uw apps en stromen zonder dat u uw eigen modellen hoeft te trainen en te bouwen.


Factuur |
Klant- en leveranciergegevens extraheren.


Ontvangstbewijs | Details van verkooptransacties
extraheren.


Identiteit |
Identificatie- en verificatiegegevens extraheren.


1003 EULA | Hypotheekgegevens extraheren.


Formulier 1008 | Hypotheekgegevens extraheren.


Openbaarmaking sluiten | Hypotheekgegevens extraheren.


Zorgverzekeringskaart |
Zorgverzekeringsgegevens extraheren.


Contract |
Overeenkomst- en partijgegevens extraheren.


Creditcard/debitcard | Gegevens extraheren uit bankkaarten.


Huwelijksakte | Gegevens extraheren uit huwelijkscertificaten.


Us Tax W-2 form | Belastingplichtige
compensatiegegevens extraheren.


Us Tax 1098 form | Extraheer hypotheekrentegegevens.


Us Tax 1098-E form | Extraheer details van de lening voor studenten.


Us Tax 1098-T form | Pak gekwalificeerde collegegeldgegevens uit.


Us Tax 1099 form | Gegevens extraheren uit variaties van het formulier 1099.


Us Tax 1040 form | Gegevens extraheren uit variaties van het formulier 1040.


Factuur |
Klant- en leveranciergegevens extraheren.


Ontvangstbewijs | Details van verkooptransacties
extraheren.


Identiteit |
Identificatie- en verificatiegegevens extraheren.


Zorgverzekeringskaart | Zorgverzekeringsgegevens extraheren.


Visitekaartje | Zakelijke contactgegevens extraheren.


Contract |
Overeenkomst- en partijgegevens extraheren.


Us Tax W-2 form | Belastingplichtige
compensatiegegevens extraheren.


Us Tax 1098 form | Extraheer hypotheekrentegegevens.


Us Tax 1098-E form | Extraheer details van de lening voor studenten.


Us Tax 1098-T form | Pak gekwalificeerde collegegeldgegevens uit.

Aangepaste modellen

  • Aangepaste modellen worden getraind met behulp van uw gelabelde gegevenssets om afzonderlijke gegevens uit formulieren en documenten te extraheren, specifiek voor uw use cases.
  • Zelfstandige aangepaste modellen kunnen worden gecombineerd om samengestelde modellen te maken.
  • Extractiemodellen Aangepaste extractiemodellen
    ✔️ worden getraind om gelabelde velden uit documenten te extraheren.


Aangepaste sjabloon | Gegevens extraheren uit statische indelingen.


Aangepaste neurale | Gegevens extraheren uit documenten met verschillende typen.


Aangepast samengesteld | Gegevens extraheren met behulp van een verzameling modellen.


  • ✔️ Aangepaste classificatiemodellen identificeren documenttypen voordat ze een extractiemodel aanroepen.


Aangepaste classificatie | Identificeer aangewezen documenttypen (klassen)
voordat u een extractiemodel aanroept.

Mogelijkheden voor invoegtoepassingen

Document Intelligence ondersteunt optionele functies die kunnen worden ingeschakeld en uitgeschakeld, afhankelijk van het scenario voor documentextractie. De volgende mogelijkheden voor invoegtoepassingen zijn beschikbaar voor 2023-07-31 (GA) en latere versies:

Document Intelligence ondersteunt optionele functies die kunnen worden ingeschakeld en uitgeschakeld, afhankelijk van het scenario voor documentextractie. De volgende mogelijkheden voor invoegtoepassingen zijn beschikbaar voor2024-02-29-preview, 2023-10-31-previewen latere releases:

Analysefuncties

Model-id Inhoudsextractie Queryvelden Leden Alinearollen Selectiemarkeringen Tabellen Sleutel-waardeparen Talen Barcodes Documentanalyse Formules* Lettertype voor stijl* Hoge resolutie*
vooraf gedefinieerde leesbewerking O O O O O
vooraf gedefinieerde indeling O O O O O
vooraf samengesteld document O O O O O
vooraf samengestelde businessCard
vooraf samengesteld contract O O O O O
prebuilt-healthInsuranceCard.us O O O O O
vooraf samengesteld-idDocument O O O O O
vooraf samengestelde factuur O O O O O O
vooraf samengestelde ontvangstbevestiging O O O O O
prebuilt-marriageCertificate.us O O O O O
vooraf gedefinieerde creditCard O O O O O
vooraf samengestelde hypotheek.us.1003 O O O O O
vooraf samengestelde hypotheek.us.1008 O O O O O
vooraf samengestelde hypotheek.us.closingDisclosure O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(variaties) O O O O O
prebuilt-tax.us.1040(variaties) O O O O O
{ customModelName } O O O O O

✓ - IngeschakeldE
O - Optioneel
* - Premium-functies kosten

Opties voor modellen en ontwikkeling

Notitie

De volgende documentinzichtmodellen en ontwikkelingsopties worden ondersteund door de Document Intelligence-service v3.0.

U kunt Document intelligence gebruiken om de verwerking van documenten in toepassingen en werkstromen te automatiseren, gegevensgestuurde strategieën te verbeteren en mogelijkheden voor documentzoekopdrachten te verrijken. Gebruik de koppelingen in de tabel voor meer informatie over elk model en blader door ontwikkelingsopties.

Read

Schermopname van Modelanalyse lezen met Document Intelligence Studio.

Model-id Beschrijving Automation-gebruiksvoorbeelden Ontwikkelingsopties
vooraf gedefinieerde leesbewerking ● Tekst extraheren uit documenten.
Gegevensextractie
● Digitaliseren van elk document.
● Naleving en controle.
● Handgeschreven notities verwerken voor vertaling.
Document Intelligence Studio
REST API
C# SDK
● Python SDK
Java SDK
JavaScript

Indeling

Schermopname van de indelingsmodelanalyse met Document Intelligence Studio.

Model-id Beschrijving Automation-gebruiksvoorbeelden Ontwikkelingsopties
vooraf gedefinieerde indeling ● Tekst- en indelingsgegevens extraheren uit documenten.
Gegevensextractie
● Document indexeren en ophalen op basis van structuur.
● Analyse van financiële en medische rapporten.
Document Intelligence Studio
REST API
C# SDK
● Python SDK
Java SDK
JavaScript

Algemeen document (afgeschaft in 2023-10-31-preview)

Schermopname van de analyse van het algemene documentmodel met behulp van Document Intelligence Studio.

Model-id Beschrijving Automation-gebruiksvoorbeelden Ontwikkelingsopties
vooraf samengesteld document ● Tekst,indeling en sleutel-waardeparen extraheren uit documenten.
Gegevens- en veldextractie
● Sleutel-waardepaarextractie.
● Formulierverwerking.
● Enquêtegegevensverzameling en -analyse.
Document Intelligence Studio
REST API

Factuur

Schermopname van factuurmodelanalyse met Document Intelligence Studio.

Model-id Beschrijving Automation-gebruiksvoorbeelden Ontwikkelingsopties
vooraf samengestelde factuur ● Sleutelinformatie extraheren uit facturen.
Gegevens- en veldextractie
● Crediteuren verwerking.
● Geautomatiseerde belastingregistratie en rapportage.
Document Intelligence Studio
REST API
C# SDK
● Python SDK
Java SDK
JavaScript

Ontvangstbewijs

Schermopname van de analyse van het ontvangstmodel met Behulp van Document Intelligence Studio.

Model-id Beschrijving Automation-gebruiksvoorbeelden Ontwikkelingsopties
vooraf samengestelde ontvangstbevestiging ● Belangrijke informatie extraheren uit ontvangstbevestigingen.
● Gegevens- en veldextractie
Ontvangstmodel v3.0 ondersteunt verwerking van hotelbevestigingen met één pagina.
● Onkostenbeheer.
● Analyse van gegevens over consumentengedrag.
● Klantenloyaliteitsprogramma.
● Merchandise retourverwerking.
● Geautomatiseerde belastingregistratie en rapportage.
Document Intelligence Studio
REST API
C# SDK
● Python SDK
Java SDK
JavaScript

Identiteit (id)

Schermopname van identiteitsmodelanalyse (ID) met Behulp van Document Intelligence Studio.

Model-id Beschrijving Automation-gebruiksvoorbeelden Ontwikkelingsopties
vooraf samengesteld-idDocument ● Belangrijke informatie extraheren uit paspoorten en id-kaarten.
● Documenttypen
Extraheer goedkeuringen, beperkingen en voertuigclassificaties uit de Amerikaanse rijbewijs.
● Ken uw klant (KYC) compliance van financiële diensten.
● Medisch accountbeheer.
● Identiteitscontrolepunten en gateways.
● Hotelregistratie.
Document Intelligence Studio
REST API
C# SDK
● Python SDK
Java SDK
JavaScript

Ziekteverzekeringskaart

Schermopname van modelanalyse van gezondheidsverzekeringskaarten met Behulp van Document Intelligence Studio.

Model-id Beschrijving Automation-gebruiksvoorbeelden Ontwikkelingsopties
prebuilt-healthInsuranceCard.us ● Pak belangrijke informatie uit amerikaanse gezondheidsverzekeringskaarten.
Gegevens- en veldextractie
● Dekking en geschiktheidsverificatie.
● Voorspellende modellering.
● Analyse op basis van waarde.
Document Intelligence Studio
REST API
C# SDK
● Python SDK
Java SDK
JavaScript

Contractmodel

Schermopname van contractmodelextractie met Document Intelligence Studio.

Model-id Beschrijving Ontwikkelingsopties
vooraf samengesteld contract Contractovereenkomst en partijgegevens extraheren. Document Intelligence Studio
REST API

Us Tax W-2 model

Schermopname van W-2-modelanalyse met Document Intelligence Studio.

Model-id Beschrijving Automation-gebruiksvoorbeelden Ontwikkelingsopties
prebuilt-tax.us.W-2 ● Belangrijke informatie extraheren uit IRS US W2-belastingformulieren (jaar 2018-2021).
Gegevens- en veldextractie
● Geautomatiseerd belastingdocumentbeheer.
● Verwerking van hypotheekleningsaanvraag.
Document Intelligence Studio
REST API
C# SDK
● Python SDK
Java SDK
JavaScript

Amerikaanse belastingformulier 1098

Schermopname van het belastingformulier us 1098 dat is geanalyseerd in Document Intelligence Studio.

Model-id Beschrijving Ontwikkelingsopties
prebuilt-tax.us.1098 Informatie over hypotheekrente en details extraheren. Document Intelligence Studio
REST API

Amerikaanse belasting 1098-E-formulier

Schermopname van het belastingformulier US 1098-E dat is geanalyseerd in Document Intelligence Studio.

Model-id Beschrijving Ontwikkelingsopties
prebuilt-tax.us.1098E Gegevens en details van een studentlening extraheren. Document Intelligence Studio
REST API

Us tax 1098-T form

Schermopname van het belastingformulier US 1098-T dat is geanalyseerd in Document Intelligence Studio.

Model-id Beschrijving Ontwikkelingsopties
prebuilt-tax.us.1098T Extraheer collegegeldinformatie en details. Document Intelligence Studio
REST API

Amerikaanse belastingformulier 1099 (en variaties)

Schermopname van het amerikaanse belastingformulier 1099 dat is geanalyseerd in Document Intelligence Studio.

Model-id Beschrijving Ontwikkelingsopties
prebuilt-tax.us.1099(variaties) Gegevens extraheren uit variaties in 1099-vorm. Document Intelligence Studio
REST API

Visitekaartje

Schermopname van analyse van visitekaartjesmodellen met Document Intelligence Studio.

Model-id Beschrijving Automation-gebruiksvoorbeelden Ontwikkelingsopties
vooraf samengestelde businessCard ● Belangrijke informatie extraheren uit visitekaartjes.
Gegevens- en veldextractie
● Verkoopleider en marketingmanagement. Document Intelligence Studio
REST API
C# SDK
● Python SDK
Java SDK
JavaScript

Overzicht van aangepast model

Schermopname van aangepaste modeltraining met Document Intelligence Studio.

Over Beschrijving Automation-gebruiksvoorbeelden Ontwikkelingsopties
Aangepast model Extraheert informatie uit formulieren en documenten in gestructureerde gegevens op basis van een model dat is gemaakt op basis van een set representatieve trainingsdocumentsets. Extraheer afzonderlijke gegevens uit formulieren en documenten die specifiek zijn voor uw bedrijf en gebruiksvoorbeelden. Document Intelligence Studio
REST API
C# SDK
● Java SDK
Java SDK● JavaScript SDK
Python SDK

Sjabloon Aangepast

Schermopname van analyse van aangepast sjabloonmodel met Document Intelligence Studio.

Notitie

Als u een aangepast sjabloonmodel wilt trainen, stelt u de buildMode eigenschap in op template. Zie Een sjabloonmodel trainen voor meer informatie

Over Beschrijving Automation-gebruiksvoorbeelden Ontwikkelingsopties
Aangepast sjabloonmodel Het aangepaste sjabloonmodel extraheert gelabelde waarden en velden uit gestructureerde en semi-gestructureerde documenten.
Belangrijke gegevens extraheren uit zeer gestructureerde documenten met gedefinieerde visuele sjablonen of algemene visuele indelingen, formulieren. Document Intelligence Studio
REST API
C# SDK
Python SDK
● Java SDK
JavaScript SDK

Aangepaste neurale

Schermopname van aangepaste neurale modelanalyse met Document Intelligence Studio.

Notitie

Als u een aangepast neuraal model wilt trainen, stelt u de buildMode eigenschap in op neural. Zie Een neuraal model trainen voor meer informatie

Over Beschrijving Automation-gebruiksvoorbeelden Ontwikkelingsopties
Aangepast neuraal model Het aangepaste neurale model wordt gebruikt om gelabelde gegevens te extraheren uit gestructureerde (enquêtes, vragenlijsten), semi-gestructureerd (facturen, inkooporders) en ongestructureerde documenten (contracten, brieven). Tekstgegevens, selectievakjes en tabellaire velden extraheren uit gestructureerde en ongestructureerde documenten. Document Intelligence Studio
REST API
C# SDK
Java SDK
● JavaScript SDK
Python SDK

Aangepast samengesteld

Schermopname van de lijst samengestelde aangepaste modellen in Document Intelligence Studio.

Over Beschrijving Automation-gebruiksvoorbeelden Ontwikkelingsopties
Samengestelde aangepaste modellen Er wordt een samengesteld model gemaakt door een verzameling aangepaste modellen te maken en deze toe te wijzen aan één model dat is gebouwd op basis van uw formuliertypen. Handig wanneer u verschillende modellen traint en deze wilt groeperen om vergelijkbare formuliertypen zoals inkooporders te analyseren. Document Intelligence Studio
REST API
C# SDK
● Java SDK
Java SDK● JavaScript SDK
Python SDK

Aangepast classificatiemodel

{alt-text}

Over Beschrijving Automation-gebruiksvoorbeelden Ontwikkelingsopties
Samengesteld classificatiemodel Aangepaste classificatiemodellen combineren indelings- en taalfuncties om documenten in een invoerbestand te detecteren, identificeren en classificeren. ● Een leningsaanvraag verpakt met een aanvraagformulier, een loonbrief en een bankoverzicht.
● Een verzameling gescande facturen.
Document Intelligence Studio
REST API

Azure AI Document Intelligence is een cloudgebaseerde Azure AI-service voor ontwikkelaars om intelligente oplossingen voor documentverwerking te bouwen. Document Intelligence past op machine learning gebaseerde optische tekenherkenning (OCR) en technologieën voor documentbegrip toe om tekst, tabellen, structuur en sleutelwaardeparen uit documenten te extraheren. U kunt ook aangepaste modellen labelen en trainen om gegevensextractie te automatiseren van gestructureerde, semi-gestructureerde en ongestructureerde documenten. Zie de artikelen Concepten voor meer informatie over elk model:

Modeltype Modelnaam
Documentanalysemodel Indelingsanalysemodel
Vooraf gemaakte modellen ● Factuurmodel● Ontvangstmodel

Identiteitsdocumentmodel
(ID) ● Visitekaartjesmodel
Aangepaste modellen ● Aangepast model
Samengesteld model

Deze inhoud is van toepassing op:Vinkjev2.1 | Nieuwste versie:blauw-vinkjev4.0 (preview)

Document Intelligence-modellen en ontwikkelingsopties

Tip

  • Voor een verbeterde ervaring en geavanceerde modelkwaliteit kunt u Document Intelligence v3.0 Studio gebruiken.
  • V3.0 Studio ondersteunt elk model dat is getraind met v2.1 gelabelde gegevens.
  • Raadpleeg de API-migratiehandleiding voor gedetailleerde informatie over het migreren van v2.1 naar v3.0.

Notitie

De volgende modellen en ontwikkelopties worden ondersteund door de Document Intelligence-service v2.1.

Gebruik de koppelingen in de tabel voor meer informatie over elk model en blader door de API-verwijzingen:

Model Beschrijving Ontwikkelingsopties
Indelingsanalyse Extractie en analyse van tekst, selectiemarkeringen, tabellen en begrenzingsvakcoördinaten, uit formulieren en documenten. Hulpprogramma
voor document intelligence labelen● REST API
● Clientbibliotheek SDK
Document Intelligence Docker-container
Aangepast model Extractie en analyse van gegevens uit formulieren en documenten die specifiek zijn voor afzonderlijke zakelijke gegevens en gebruiksvoorbeelden. Hulpprogramma voor labelen
van Document Intelligence● REST API
Voorbeeldhulpprogramma
voor labelen● Document Intelligence Docker-container
Factuurmodel Geautomatiseerde gegevensverwerking en extractie van belangrijke informatie uit verkoopfacturen. Hulpprogramma
voor document intelligence labelen● REST API
● Clientbibliotheek SDK
Document Intelligence Docker-container
Ontvangstbewijsmodel Geautomatiseerde gegevensverwerking en extractie van belangrijke informatie uit verkoopbevestigingen. Hulpprogramma
voor document intelligence labelen● REST API
● Clientbibliotheek SDK
Document Intelligence Docker-container
Identiteitsdocumentmodel (ID) Geautomatiseerde gegevensverwerking en extractie van belangrijke informatie uit amerikaanse rijbewijs's en internationale paspoorten. Hulpprogramma
voor document intelligence labelen● REST API
● Clientbibliotheek SDK
Document Intelligence Docker-container
Visitekaartjesmodel Geautomatiseerde gegevensverwerking en extractie van belangrijke informatie uit visitekaartjes. Hulpprogramma
voor document intelligence labelen● REST API
● Clientbibliotheek SDK
Document Intelligence Docker-container

Gegevensprivacy en -beveiliging

Net als bij alle AI-services moeten ontwikkelaars die de Document Intelligence-service gebruiken zich bewust zijn van het Microsoft-beleid voor klantgegevens. Bekijk onze pagina Gegevens, privacy en beveiliging voor documentinformatie .

Volgende stappen

  • Probeer uw eigen formulieren en documenten te verwerken met het hulpprogramma Document Intelligence Sample Labeling.

  • Voltooi een quickstart voor Document Intelligence en ga aan de slag met het maken van een app voor documentverwerking in de ontwikkeltaal van uw keuze.