Vad är Azure Formigenkänning?

Den här artikeln gäller för bockmarkeringen:Formigenkänning v3.0Formigenkänning v3.0. Tidigare version:Formigenkänning v2.1

Azure Formigenkänning är en molnbaserad Azure Applied AI-tjänst som utvecklare kan använda för att skapa intelligenta lösningar för dokumentbearbetning. Formigenkänning använder maskininlärningsbaserad optisk teckenläsning (OCR) och dokumenttolkningsteknik för att extrahera utskrift och handskriven text, tabeller, struktur och nyckel/värde-par från dokument. Du kan också märka och träna anpassade modeller för att automatisera dataextrahering från strukturerade, halvstrukturerade och ostrukturerade dokument. Mer information om varje modell finns i begreppsartiklarna:

Modelltyp Modellnamn
Modeller för dokumentanalys Läs OCR-modell
Allmän dokumentmodell
Layoutanalysmodell
Fördefinierade modeller W-2-formulärmodell
Fakturamodell
Kvittomodell
Identitetsdokumentmodell
(ID) ● Visitkortsmodell
Anpassade modeller Anpassad modell
Skapad modell

Vilken Formigenkänning modell ska jag använda?

Det här avsnittet hjälper dig att avgöra vilken Formigenkänning v3.0-modell som stöds för ditt program:

Typ av dokument Data som ska extraheras Dokumentformat Din bästa lösning
Ett allmänt dokument som ett kontrakt eller en bokstav. Du vill extrahera främst textrader, ord, platser och identifierade språk. Dokumentet skrivs eller skrivs ut på ett språk som stöds. Läs OCR-modell
Ett dokument som innehåller strukturell information som en rapport eller studie. Förutom text måste du extrahera strukturell information som tabeller, urvalsmarkeringar, stycken, rubriker, rubriker och underrubriker. Dokumentet skrivs eller skrivs ut på ett språk som stöds Layoutanalysmodell
Ett strukturerat eller halvstrukturerat dokument som innehåller innehåll formaterat som fält och värden, till exempel ett kreditprogram eller undersökningsformulär. Du vill extrahera fält och värden, inklusive värden som inte omfattas av de scenariospecifika fördefinierade modellerna utan att behöva träna en anpassad modell. Formuläret eller dokumentet är ett standardiserat format som ofta används i ditt företag eller din bransch och skrivs ut på ett språk som stöds. Allmän dokumentmodell
U.S. W-2-formulär Du vill extrahera viktig information som lön, löner och skatter som undanhålls från amerikanska W2-skatteformulär. W-2-dokumentet är i USA engelska (en-US) text. W-2-modell
Faktura Du vill extrahera viktig information, till exempel kundnamn, faktureringsadress och belopp som ska betalas från fakturor. Fakturadokumentet skrivs eller skrivs ut på ett språk som stöds. Fakturamodell
Mottagandet Du vill extrahera viktig information, till exempel försäljningsnamn, transaktionsdatum och transaktionssumma från ett försäljnings- eller ensideskvitto på hotell. Kvittot skrivs eller skrivs ut på ett språk som stöds. Kvittomodell
Identitetsdokument (ID) som ett pass eller körkort. Du vill extrahera viktig information som förnamn, efternamn och födelsedatum från amerikanska körkort eller internationella pass. Ditt ID-dokument är ett amerikanskt körkort eller den biografiska sidan från ett internationellt pass (inte ett visum). Modell för identitetsdokument (ID)
Visitkort Du vill extrahera viktig information som förnamn, efternamn, företagsnamn, e-postadress och telefonnummer från visitkort. Visitkortsdokumentet är i engelsk eller japansk text. Visitkortsmodell
Dokument av blandad typ Du vill extrahera nyckel/värde-par, urvalsmarkeringar, tabeller, signaturfält och valda regioner som inte extraheras av fördefinierade eller allmänna dokumentmodeller. Du har olika dokument med strukturerade, halvstrukturerade och/eller ostrukturerade element. Anpassad modell

Tips

  • Om du fortfarande är osäker på vilken modell du ska använda kan du prova den allmänna dokumentmodellen för att extrahera nyckel/värde-par.
  • Den allmänna dokumentmodellen drivs av OCR-motorn Read för att identifiera textrader, ord, platser och språk.
  • Allmänt dokument extraherar också samma data som dokumentlayoutmodellen (sidor, tabeller, format).

Modeller för dokumentbearbetning och utvecklingsalternativ

Anteckning

Följande dokumenttolkningsmodeller och utvecklingsalternativ stöds av Formigenkänning-tjänsten v3.0.

Du kan använda Formigenkänning för att automatisera dokumentbearbetningen i program och arbetsflöden, förbättra datadrivna strategier och utöka funktionerna för dokumentsökning. Använd länkarna i tabellen för att lära dig mer om varje modell och bläddra i API-referenserna.

Modell Description Användningsfall för Automation Utvecklingsalternativ
Läs OCR-modell Extrahera textrader, ord, identifierade språk och handskriven stil om det identifieras.
  • Kontraktsbearbetning.
  • Ekonomisk eller medicinsk rapportbearbetning.
Allmän dokumentmodell Extrahera text, tabeller, struktur och nyckel/värde-par.
  • Extrahering av nyckel/värde-par.
  • Formulärbearbetning.
  • Insamling och analys av undersökningsdata.
Layoutanalysmodell Extrahera text, markeringsmarkeringar och tabellstrukturer, tillsammans med deras koordinater för avgränsningsrutor, från formulär och dokument.

Layout-API:et har uppdaterats till en fördefinierad modell.
  • Dokumentindexering och hämtning efter struktur.
  • Förbearbetning före OCR-analys.
Anpassad modell (uppdaterad) Extrahering och analys av data från formulär och dokument som är specifika för olika affärsdata och användningsfall.

API för anpassad modell v3.0 stöder signaturidentifiering för anpassade mallmodeller (anpassat formulär).

Api för anpassad modell v3.0 stöder nu två modelltyper:
  • Anpassad mallmodell (anpassat formulär) används för att analysera strukturerade och halvstrukturerade dokument.
  • Anpassad neural modell (anpassat dokument) används för att analysera ostrukturerade dokument.
  • Identifiering och sammanställning av data som är unika för ditt företag och som påverkas av en regeländring eller ett marknadsevenemang.
  • Identifiering och analys av tidigare förbisedda unika data.
Formigenkänning Studio
  • REST-API
  • C#-SDK
  • Python SDK
  • Java SDK
  • JavaScript
  • W-2-formulär Extrahera information som rapporteras i varje ruta i ett W-2-formulär.
    • Automatiserad hantering av skattedokument.
    • Behandling av program för hypotekslån.
    Fakturamodell Automatiserad databearbetning och extrahering av viktig information från försäljningsfakturor.
    • Leverantörsreskontrabearbetning.
    • Automatisk skatteregistrering och rapportering.
    Kvittomodell (uppdaterad) Automatiserad databearbetning och extrahering av viktig information från försäljningskvitton.

    Kvittomodell v3.0 stöder bearbetning av hotellkvitton på en sida.
    • Kostnadshantering.
    • Dataanalys för konsumentbeteende.
    • Kundlojalitetsprogram.
    • Returbearbetning av varor.
    • Automatisk skatteregistrering och rapportering.
    Modell för identitetsdokument (ID) (uppdaterad) Automatiserad databehandling och extrahering av viktig information från amerikanska körkort och internationella pass.

    Det fördefinierade ID-dokument-API:et stöder extrahering av godkännanden, begränsningar och fordonsklassificeringar från amerikanska körkort.
    • Känna till kundens (KYC) riktlinjer för finansiella tjänster efterlevnad.
    • Hantering av medicinska konton.
    • Identitetskontroller och gatewayer.
    • Hotellregistrering.
    Visitkortsmodell Automatiserad databehandling och extrahering av viktig information från visitkort.
    • Säljchef och marknadsföringsledning.

    Den här artikeln gäller bockmarkeringen:Formigenkänning v2.1Formigenkänning v2.1. Senare version:Formigenkänning v3.0

    Azure Formigenkänning är en molnbaserad Azure Applied AI-tjänst som utvecklare kan använda för att skapa intelligenta lösningar för dokumentbearbetning. Formigenkänning använder maskininlärningsbaserad optisk teckenläsning (OCR) och dokumenttolkningsteknik för att extrahera utskrift och handskriven text, tabeller, struktur och nyckel/värde-par från dokument. Du kan också märka och träna anpassade modeller för att automatisera dataextrahering från strukturerade, halvstrukturerade och ostrukturerade dokument. Mer information om varje modell finns i begreppsartiklarna:

    Modelltyp Modellnamn
    Modell för dokumentanalys Layoutanalysmodell
    Fördefinierade modeller Fakturamodell
    Kvittomodell
    ID-modell (identitetsdokument)Visitkortsmodell

    Anpassade modeller Anpassad modell
    Skapad modell

    Vilken modell för dokumentbearbetning ska jag använda?

    Det här avsnittet hjälper dig att avgöra vilken Formigenkänning v2.1-modell som stöds för ditt program:

    Typ av dokument Data som ska extraheras Dokumentformat Din bästa lösning
    Ett dokument som innehåller strukturell information som en rapport eller studie. Förutom text måste du extrahera strukturell information som tabeller och markeringsmarkeringar. Dokumentet skrivs eller skrivs ut på ett språk som stöds Layoutanalysmodell
    Faktura Du vill extrahera viktig information, till exempel kundnamn, faktureringsadress och belopp som ska betalas från fakturor. Fakturadokumentet skrivs eller skrivs ut på ett språk som stöds. Fakturamodell
    Mottagandet Du vill extrahera viktig information, till exempel försäljningsnamn, transaktionsdatum och transaktionssumma från ett försäljnings- eller ensideskvitto på hotell. Kvittot skrivs eller skrivs ut på ett språk som stöds. Kvittomodell
    Identitetsdokument (ID) som ett pass eller körkort. Du vill extrahera viktig information som förnamn, efternamn och födelsedatum från amerikanska körkort eller internationella pass. Ditt ID-dokument är ett amerikanskt körkort eller den biografiska sidan från ett internationellt pass (inte ett visum). ID-dokumentmodell
    Visitkort Du vill extrahera nyckelinformation som förnamn, efternamn, företagsnamn, e-postadress och telefonnummer från visitkort. Visitkortsdokumentet är i engelsk eller japansk text. Visitkortsmodell
    Dokument av blandad typ Du vill extrahera nyckel/värde-par, urvalsmarkeringar, tabeller, signaturfält och valda regioner som inte extraheras av fördefinierade eller allmänna dokumentmodeller. Du har olika dokument med strukturerade, halvstrukturerade och/eller ostrukturerade element. Anpassad modell

    Formigenkänning modeller och utvecklingsalternativ

    Tips

    • Prova Formigenkänning v3.0 Studio för en förbättrad upplevelse och avancerad modellkvalitet.
    • v3.0 Studio stöder alla modeller som tränats med v2.1-märkta data.
    • Du kan läsa api-migreringsguiden för detaljerad information om migrering från v2.1 till v3.0.

    Anteckning

    Följande modeller och utvecklingsalternativ stöds av Formigenkänning-tjänsten v2.1.

    Använd länkarna i tabellen för att lära dig mer om varje modell och bläddra i API-referenserna:

    Modell Description Utvecklingsalternativ
    Layoutanalys Extrahering och analys av text, urvalsmarkeringar, tabeller och koordinater för avgränsningsrutor, från formulär och dokument.
    Anpassad modell Extrahering och analys av data från formulär och dokument som är specifika för distinkta affärsdata och användningsfall.
    Fakturamodell Automatiserad databearbetning och extrahering av viktig information från försäljningsfakturor.
    Kvittomodell Automatiserad databearbetning och extrahering av viktig information från försäljningskvitton.
    ID-modell (ID) Automatiserad databehandling och extrahering av viktig information från amerikanska körkort och internationella pass.
    Visitkortsmodell Automatiserad databehandling och extrahering av viktig information från visitkort.

    Datasekretess och säkerhet

    Precis som med alla AI-tjänster bör utvecklare som använder Formigenkänning-tjänsten vara medvetna om Microsofts principer för kunddata. Se sidan Data, sekretess och säkerhet för Formigenkänning.

    Nästa steg