Wat is Azure Form Recognizer?

Dit artikel is van toepassing op:Form Recognizer v3.0 vinkjeForm Recognizer v3.0. Eerdere versie:Form Recognizer v2.1

Azure Form Recognizer is een cloudgebaseerde Azure Applied AI-service voor ontwikkelaars om intelligente oplossingen voor documentverwerking te bouwen. Form Recognizer past op machine learning gebaseerde optische tekenherkenning (OCR) en documentbegriptechnologieën toe om afdruk- en handgeschreven tekst, tabellen, structuur en sleutel-waardeparen uit documenten te extraheren. U kunt ook aangepaste modellen labelen en trainen om gegevensextractie uit gestructureerde, semi-gestructureerde en ongestructureerde documenten te automatiseren. Zie de conceptenartikelen voor meer informatie over elk model:

Modeltype Modelnaam
Documentanalysemodellen OCR-model
lezen ● Algemeen documentmodel
Indelingsanalysemodel
Vooraf gemaakte modellen W-2-formuliermodel
Factuurmodel
Bonmodel
Identiteitsdocumentmodel
(ID) ● Visitekaartjesmodel
Aangepaste modellen Aangepast model
Samengesteld model

Welk Form Recognizer model moet ik gebruiken?

In deze sectie kunt u bepalen welk Form Recognizer v3.0-model u voor uw toepassing moet gebruiken:

Type document Gegevens die moeten worden geëxtraheerd Documentindeling Uw beste oplossing
Een algemeen document , zoals een contract of brief. U wilt voornamelijk tekstregels, woorden, locaties en gedetecteerde talen extraheren. Het document is geschreven of afgedrukt in een ondersteunde taal. OCR-model lezen
Een document met structurele informatie , zoals een rapport of studie. Naast tekst moet u structurele informatie extraheren, zoals tabellen, selectiemarkeringen, alinea's, titels, koppen en subkoppen. Het document is geschreven of afgedrukt in een ondersteunde taal Model voor indelingsanalyse
Een gestructureerd of semi-gestructureerd document met inhoud die is opgemaakt als velden en waarden, zoals een kredietaanvraag of enquêteformulier. U wilt velden en waarden extraheren, inclusief velden en waarden die niet worden gedekt door de scenariospecifieke vooraf samengestelde modellen, zonder dat u een aangepast model hoeft te trainen. Het formulier of document is een gestandaardiseerde indeling die vaak wordt gebruikt in uw bedrijf of branche en wordt afgedrukt in een ondersteunde taal. Algemeen documentmodel
U.S. W-2-formulier U wilt belangrijke informatie ophalen, zoals salaris, lonen en belastingen die worden ingehouden in Amerikaanse W2-belastingformulieren. Het W-2-document is in Verenigde Staten Engelse tekst (en-US). W-2-model
Factuur U wilt belangrijke informatie, zoals de naam van de klant, het factuuradres en het verschuldigde bedrag, ophalen uit facturen. Het factuurdocument wordt geschreven of afgedrukt in een ondersteunde taal. Factuurmodel
Ontvangst U wilt belangrijke informatie, zoals de naam van de verkoper, de transactiedatum en het transactietotaal, ophalen uit een verkoop- of hotelontvangst van één pagina. Het ontvangstbewijs wordt geschreven of afgedrukt in een ondersteunde taal. Ontvangstmodel
Identiteitsdocument (id) zoals een paspoort of rijbewijs. U wilt belangrijke informatie, zoals voornaam, achternaam en geboortedatum, ophalen uit Amerikaanse rijbewijzen of internationale paspoorten. Uw id-document is een Amerikaans rijbewijs of de biografische pagina van een internationaal paspoort (geen visum). Model voor identiteitsdocument (ID)
Visitekaartje U wilt belangrijke informatie, zoals voornaam, achternaam, bedrijfsnaam, e-mailadres en telefoonnummer, ophalen uit visitekaartjes. Het visitekaartjesdocument is in engelse of Japanse tekst. Visitekaartjesmodel
Document(en) van gemengd type U wilt sleutel-waardeparen, selectiemarkeringen, tabellen, handtekeningvelden en geselecteerde regio's extraheren die niet zijn geëxtraheerd door vooraf samengestelde of algemene documentmodellen. U hebt verschillende documenten met gestructureerde, semi-gestructureerde en/of ongestructureerde elementen. Aangepast model

Tip

  • Als u nog steeds niet zeker weet welk model u moet gebruiken, probeert u het model Algemeen document om sleutel-waardeparen te extraheren.
  • Het model Algemeen document wordt mogelijk gemaakt door de OCR-engine Lezen om tekstregels, woorden, locaties en talen te detecteren.
  • Met het algemene document worden ook dezelfde gegevens geëxtraheerd als het model voor documentindeling (pagina's, tabellen, stijlen).

Documentverwerkingsmodellen en ontwikkelingsopties

Notitie

De volgende document understanding-modellen en ontwikkelingsopties worden ondersteund door de Form Recognizer-service v3.0.

U kunt Form Recognizer gebruiken om uw documentverwerking in toepassingen en werkstromen te automatiseren, gegevensgestuurde strategieën te verbeteren en de zoekmogelijkheden voor documenten te verrijken. Gebruik de koppelingen in de tabel voor meer informatie over elk model en blader door de API-verwijzingen.

Model Beschrijving Automatiseringsgebruiksvoorbeelden Ontwikkelingsopties
OCR-model lezen Extraheer tekstregels, woorden, gedetecteerde talen en handgeschreven stijl indien gedetecteerd.
  • Contractverwerking.
  • Verwerking van financiële of medische rapporten.
Algemeen documentmodel Extraheer tekst, tabellen, structuur en sleutel-waardeparen.
  • Sleutel-waardepaarextractie.
  • Formulierverwerking.
  • Verzameling en analyse van enquêtegegevens.
Model voor indelingsanalyse Extraheer tekst, selectiemarkeringen en tabelstructuren, samen met de coördinaten van het begrenzingsvak, uit formulieren en documenten.

Lay-out-API is bijgewerkt naar een vooraf samengesteld model.
  • Documentindexering en ophalen per structuur.
  • Voorverwerking voorafgaand aan OCR-analyse.
Aangepast model (bijgewerkt) Extractie en analyse van gegevens uit formulieren en documenten die specifiek zijn voor afzonderlijke bedrijfsgegevens en gebruiksvoorbeelden.

Aangepaste model-API v3.0 ondersteunt handtekeningdetectie voor aangepaste sjabloonmodellen (aangepaste formulieren).

Aangepaste model-API v3.0 ondersteunt nu twee modeltypen:
  • Aangepast sjabloonmodel (aangepast formulier) wordt gebruikt voor het analyseren van gestructureerde en semi-gestructureerde documenten.
  • Aangepast neurale model (aangepast document) wordt gebruikt voor het analyseren van ongestructureerde documenten.
  • Identificatie en compilatie van gegevens, uniek voor uw bedrijf, beïnvloed door een wijziging in de regelgeving of marktgebeurtenis.
  • Identificatie en analyse van eerder over het hoofd geziene unieke gegevens.
Form Recognizer Studio
  • REST API
  • C# SDK
  • Python-SDK
  • Java-SDK
  • JavaScript
  • W-2-formulier Extraheer de informatie die in elk vak is gerapporteerd op een W-2-formulier.
    • Geautomatiseerd beheer van belastingdocumenten.
    • Verwerking van aanvraag voor hypotheeklening.
    Factuurmodel Geautomatiseerde gegevensverwerking en extractie van belangrijke informatie uit verkoopfacturen.
    • Crediteurenverwerking.
    • Automatische belastingregistratie en -rapportage.
    Ontvangstmodel (bijgewerkt) Geautomatiseerde gegevensverwerking en extractie van belangrijke informatie uit verkoopbevestigingen.

    Ontvangstbewijsmodel v3.0 ondersteunt de verwerking van hotelbevestigingen met één pagina.
    • Onkostenbeheer.
    • Analyse van gegevens over consumentengedrag.
    • Klantloyaliteitsprogramma.
    • Verwerking van goederen retourneren.
    • Automatische belastingregistratie en -rapportage.
    Model van identiteitsdocument (id) (bijgewerkt) Geautomatiseerde gegevensverwerking en extractie van belangrijke informatie uit Amerikaanse rijbewijzen en internationale paspoorten.

    Vooraf samengestelde id-document-API ondersteunt het extraheren van goedkeuringen, beperkingen en voertuigclassificaties uit Amerikaanse rijbewijzen.
    • Ken de naleving van de richtlijnen voor financiële services van uw klant (KYC).
    • Beheer van medische accounts.
    • Identiteitscontrolepunten en gateways.
    • Hotelregistratie.
    Visitekaartjesmodel Geautomatiseerde gegevensverwerking en extractie van belangrijke informatie uit visitekaartjes.
    • Verkoopmanager en marketingbeheer.

    Dit artikel is van toepassing op:Form Recognizer v2.1 Form Recognizerv2.1. Latere versie:Form Recognizer v3.0

    Azure Form Recognizer is een cloudgebaseerde Azure Applied AI-service voor ontwikkelaars om intelligente oplossingen voor documentverwerking te bouwen. Form Recognizer past op machine learning gebaseerde optische tekenherkenning (OCR) en documentbegriptechnologieën toe om afdruk- en handgeschreven tekst, tabellen, structuur en sleutel-waardeparen uit documenten te extraheren. U kunt ook aangepaste modellen labelen en trainen om gegevensextractie uit gestructureerde, semi-gestructureerde en ongestructureerde documenten te automatiseren. Zie de Concepten-artikelen voor meer informatie over elk model:

    Modeltype Modelnaam
    Documentanalysemodel Model voor indelingsanalyse
    Vooraf gemaakte modellen Factuurmodel
    Ontvangstmodel
    Identiteitsdocumentmodel (ID)
    Visitekaartjesmodel
    Aangepaste modellen Aangepast model
    Samengesteld model

    Welk documentverwerkingsmodel moet ik gebruiken?

    In deze sectie kunt u bepalen welk Form Recognizer v2.1-model u voor uw toepassing moet gebruiken:

    Type document Gegevens die moeten worden geëxtraheerd Documentindeling Uw beste oplossing
    Een document met structurele informatie , zoals een rapport of studie. Naast tekst moet u structurele informatie extraheren, zoals tabellen en selectiemarkeringen. Het document is geschreven of afgedrukt in een ondersteunde taal Model voor indelingsanalyse
    Factuur U wilt belangrijke informatie, zoals de naam van de klant, het factuuradres en het verschuldigde bedrag, ophalen uit facturen. Het factuurdocument wordt geschreven of afgedrukt in een ondersteunde taal. Factuurmodel
    Ontvangst U wilt belangrijke informatie, zoals de naam van de verkoper, de transactiedatum en het transactietotaal, extraheren uit een verkoop- of hotelbon van één pagina. Het ontvangstbewijs wordt geschreven of afgedrukt in een ondersteunde taal. Ontvangstmodel
    Identiteitsdocument (ID) zoals een paspoort of rijbewijs. U wilt belangrijke informatie, zoals voornaam, achternaam en geboortedatum, ophalen uit Amerikaanse rijbewijzen of internationale paspoorten. Uw id-document is een Amerikaans rijbewijs of de biografische pagina van een internationaal paspoort (geen visum). Id-documentmodel
    Visitekaartje U wilt belangrijke informatie, zoals voornaam, achternaam, bedrijfsnaam, e-mailadres en telefoonnummer, extraheren uit visitekaartjes. Het visitekaartjesdocument is in het Engels of Japans. Visitekaartjesmodel
    Document(en) van gemengd type U wilt sleutel-waardeparen, selectiemarkeringen, tabellen, handtekeningvelden en geselecteerde regio's extraheren die niet zijn geëxtraheerd door vooraf samengestelde of algemene documentmodellen. U hebt verschillende documenten met gestructureerde, semi-gestructureerde en/of ongestructureerde elementen. Aangepast model

    Form Recognizer modellen en ontwikkelopties

    Tip

    • Probeer de Form Recognizer v3.0 Studio voor een verbeterde ervaring en geavanceerde modelkwaliteit.
    • V3.0 Studio ondersteunt elk model dat is getraind met v2.1 gelabelde gegevens.
    • Raadpleeg de API-migratiehandleiding voor gedetailleerde informatie over de migratie van v2.1 naar v3.0.

    Notitie

    De volgende modellen en ontwikkelopties worden ondersteund door de Form Recognizer-service v2.1.

    Gebruik de koppelingen in de tabel voor meer informatie over elk model en blader door de API-verwijzingen:

    Model Beschrijving Ontwikkelingsopties
    Indelingsanalyse Extractie en analyse van tekst, selectiemarkeringen, tabellen en begrenzingsvakcoördinaten uit formulieren en documenten.
    Aangepast model Extractie en analyse van gegevens uit formulieren en documenten die specifiek zijn voor afzonderlijke bedrijfsgegevens en gebruiksvoorbeelden.
    Factuurmodel Geautomatiseerde gegevensverwerking en extractie van belangrijke informatie uit verkoopfacturen.
    Ontvangstmodel Geautomatiseerde gegevensverwerking en extractie van belangrijke informatie uit verkoopbevestigingen.
    Model van identiteitsdocument (id) Geautomatiseerde gegevensverwerking en extractie van belangrijke informatie uit Amerikaanse rijbewijzen en internationale paspoorten.
    Visitekaartjesmodel Geautomatiseerde gegevensverwerking en extractie van belangrijke informatie uit visitekaartjes.

    Gegevensprivacy en -beveiliging

    Net als bij alle AI-services moeten ontwikkelaars die de Form Recognizer-service gebruiken op de hoogte zijn van het Microsoft-beleid voor klantgegevens. Zie onze pagina Gegevens, privacy en beveiliging voor Form Recognizer.

    Volgende stappen