Vad är Azure Formigenkänning?
Den här artikeln gäller för bockmarkeringen:Formigenkänning v3.0. Tidigare version:Formigenkänning v2.1
Azure Formigenkänning är en molnbaserad Azure Applied AI-tjänst som utvecklare kan använda för att skapa intelligenta lösningar för dokumentbearbetning. Formigenkänning använder maskininlärningsbaserad optisk teckenläsning (OCR) och dokumenttolkningsteknik för att extrahera text, tabeller, struktur och nyckel/värde-par från dokument. Du kan också märka och träna anpassade modeller för att automatisera dataextrahering från strukturerade, halvstrukturerade och ostrukturerade dokument. Mer information om varje modell finns i begreppsartiklarna:
Modelltyp | Modellnamn |
---|---|
Modeller för dokumentanalys | ● Läs OCR-modell ● Allmän dokumentmodell ● Layoutanalysmodell |
Fördefinierade modeller | ● W-2-formulärmodell ● Fakturamodell ● Kvittomodell ● Identitetsdokumentmodell (ID) ● Visitkortsmodell |
Anpassade modeller | ● Anpassad modell ● Skapad modell |
Video: Formigenkänning modeller
Följande video introducerar Formigenkänning modeller och deras associerade utdata för att hjälpa dig att välja den bästa modellen för att uppfylla dina behov av dokumentscenario.
Vilken Formigenkänning modell ska jag använda?
Det här avsnittet hjälper dig att avgöra vilken Formigenkänning v3.0-modell som stöds för ditt program:
Typ av dokument | Data som ska extraheras | Dokumentformat | Din bästa lösning |
---|---|---|---|
Ett allmänt dokument som ett kontrakt eller en bokstav. | Du vill extrahera främst textrader, ord, platser och identifierade språk. | Dokumentet skrivs eller skrivs ut på ett språk som stöds. | Läs OCR-modell |
Ett dokument som innehåller strukturell information som en rapport eller studie. | Förutom text måste du extrahera strukturell information som tabeller, urvalsmarkeringar, stycken, rubriker, rubriker och underrubriker. | Dokumentet skrivs eller skrivs ut på ett språk som stöds | Layoutanalysmodell |
Ett strukturerat eller halvstrukturerat dokument som innehåller innehåll formaterat som fält och värden, till exempel ett kreditprogram eller undersökningsformulär. | Du vill extrahera fält och värden, inklusive värden som inte omfattas av de scenariospecifika fördefinierade modellerna utan att behöva träna en anpassad modell. | Formuläret eller dokumentet är ett standardiserat format som ofta används i ditt företag eller din bransch och skrivs ut på ett språk som stöds. | Allmän dokumentmodell |
U.S. W-2-formulär | Du vill extrahera viktig information som lön, löner och skatter som undanhålls från amerikanska W2-skatteformulär. | W-2-dokumentet är i USA engelska (en-US) text. | W-2-modell |
Faktura | Du vill extrahera viktig information, till exempel kundnamn, faktureringsadress och belopp som ska betalas från fakturor. | Fakturadokumentet skrivs eller skrivs ut på ett språk som stöds. | Fakturamodell |
Mottagandet | Du vill extrahera viktig information, till exempel försäljningsnamn, transaktionsdatum och transaktionssumma från ett försäljnings- eller ensideskvitto på hotell. | Kvittot skrivs eller skrivs ut på ett språk som stöds. | Kvittomodell |
Identitetsdokument (ID) som ett pass eller körkort. | Du vill extrahera viktig information som förnamn, efternamn och födelsedatum från amerikanska körkort eller internationella pass. | Ditt ID-dokument är ett amerikanskt körkort eller den biografiska sidan från ett internationellt pass (inte ett visum). | Modell för identitetsdokument (ID) |
Visitkort | Du vill extrahera viktig information som förnamn, efternamn, företagsnamn, e-postadress och telefonnummer från visitkort. | Visitkortsdokumentet är i engelsk eller japansk text. | Visitkortsmodell |
Dokument av blandad typ | Du vill extrahera nyckel/värde-par, urvalsmarkeringar, tabeller, signaturfält och valda regioner som inte extraheras av fördefinierade eller allmänna dokumentmodeller. | Du har olika dokument med strukturerade, halvstrukturerade och/eller ostrukturerade element. | Anpassad modell |
Tips
- Om du fortfarande är osäker på vilken modell du ska använda kan du prova den allmänna dokumentmodellen för att extrahera nyckel/värde-par.
- Den allmänna dokumentmodellen drivs av OCR-motorn Read för att identifiera textrader, ord, platser och språk.
- Allmänt dokument extraherar också samma data som dokumentlayoutmodellen (sidor, tabeller, format).
Modeller för dokumentbearbetning och utvecklingsalternativ
Anteckning
Följande dokumenttolkningsmodeller och utvecklingsalternativ stöds av Formigenkänning-tjänsten v3.0.
Du kan använda Formigenkänning för att automatisera dokumentbearbetningen i program och arbetsflöden, förbättra datadrivna strategier och utöka funktionerna för dokumentsökning. Använd länkarna i tabellen för att lära dig mer om varje modell och bläddra i API-referenserna.
Modell | Description | Användningsfall för Automation | Utvecklingsalternativ |
---|---|---|---|
Läs OCR-modell | Extrahera textrader, ord, identifierade språk och handskriven stil om det identifieras. |
|
|
Allmän dokumentmodell | Extrahera text, tabeller, struktur och nyckel/värde-par. |
|
|
Layoutanalysmodell | Extrahera text, markeringsmarkeringar och tabellstrukturer, tillsammans med deras koordinater för avgränsningsrutor, från formulär och dokument. Layout-API:et har uppdaterats till en fördefinierad modell. |
|
|
Anpassad modell (uppdaterad) | Extrahering och analys av data från formulär och dokument som är specifika för olika affärsdata och användningsfall. API för anpassad modell v3.0 stöder signaturidentifiering för anpassade mallmodeller (anpassat formulär). Api för anpassad modell v3.0 stöder nu två modelltyper:
|
|
Formigenkänning Studio |
W-2-formulär | Extrahera information som rapporteras i varje ruta i ett W-2-formulär. |
|
|
Fakturamodell | Automatiserad databearbetning och extrahering av viktig information från försäljningsfakturor. |
|
|
Kvittomodell (uppdaterad) | Automatiserad databearbetning och extrahering av viktig information från försäljningskvitton. Kvittomodell v3.0 stöder bearbetning av hotellkvitton på en sida. |
|
|
Modell för identitetsdokument (ID) (uppdaterad) | Automatiserad databehandling och extrahering av viktig information från amerikanska körkort och internationella pass. Det fördefinierade ID-dokument-API:et stöder extrahering av godkännanden, begränsningar och fordonsklassificeringar från amerikanska körkort. |
|
|
Visitkortsmodell | Automatiserad databehandling och extrahering av viktig information från visitkort. |
|
Den här artikeln gäller bockmarkeringen:Formigenkänning v2.1. Senare version:Formigenkänning v3.0
Azure Formigenkänning är en molnbaserad Azure Applied AI-tjänst som utvecklare kan använda för att skapa intelligenta lösningar för dokumentbearbetning. Formigenkänning använder maskininlärningsbaserad optisk teckenläsning (OCR) och dokumenttolkningsteknik för att extrahera text, tabeller, struktur och nyckel/värde-par från dokument. Du kan också märka och träna anpassade modeller för att automatisera dataextrahering från strukturerade, halvstrukturerade och ostrukturerade dokument. Mer information om varje modell finns i begreppsartiklarna:
Modelltyp | Modellnamn |
---|---|
Modell för dokumentanalys | ● Layoutanalysmodell |
Fördefinierade modeller | ● Fakturamodell ● Kvittomodell ● ID-modell (identitetsdokument) ● Visitkortsmodell |
Anpassade modeller | ● Anpassad modell ● Skapad modell |
Vilken modell för dokumentbearbetning ska jag använda?
Det här avsnittet hjälper dig att avgöra vilken Formigenkänning v2.1-modell som stöds för ditt program:
Typ av dokument | Data som ska extraheras | Dokumentformat | Din bästa lösning |
---|---|---|---|
Ett dokument som innehåller strukturell information som en rapport eller studie. | Förutom text måste du extrahera strukturell information som tabeller och markeringsmarkeringar. | Dokumentet skrivs eller skrivs ut på ett språk som stöds | Layoutanalysmodell |
Faktura | Du vill extrahera viktig information, till exempel kundnamn, faktureringsadress och belopp som ska betalas från fakturor. | Fakturadokumentet skrivs eller skrivs ut på ett språk som stöds. | Fakturamodell |
Mottagandet | Du vill extrahera viktig information, till exempel försäljningsnamn, transaktionsdatum och transaktionssumma från ett försäljnings- eller ensideskvitto på hotell. | Kvittot skrivs eller skrivs ut på ett språk som stöds. | Kvittomodell |
Identitetsdokument (ID) som ett pass eller körkort. | Du vill extrahera viktig information som förnamn, efternamn och födelsedatum från amerikanska körkort eller internationella pass. | Ditt ID-dokument är ett amerikanskt körkort eller den biografiska sidan från ett internationellt pass (inte ett visum). | ID-dokumentmodell |
Visitkort | Du vill extrahera viktig information som förnamn, efternamn, företagsnamn, e-postadress och telefonnummer från visitkort. | Visitkortsdokumentet är i engelsk eller japansk text. | Visitkortsmodell |
Dokument av blandad typ | Du vill extrahera nyckel/värde-par, urvalsmarkeringar, tabeller, signaturfält och valda regioner som inte extraheras av fördefinierade eller allmänna dokumentmodeller. | Du har olika dokument med strukturerade, halvstrukturerade och/eller ostrukturerade element. | Anpassad modell |
Formigenkänning modeller och utvecklingsalternativ
Tips
- Prova Formigenkänning v3.0 Studio för en bättre upplevelse och avancerad modellkvalitet.
- v3.0 Studio stöder alla modeller som tränats med v2.1-märkta data.
- I API-migreringsguiden finns detaljerad information om migrering från v2.1 till v3.0.
Anteckning
Följande modeller och utvecklingsalternativ stöds av Formigenkänning-tjänsten v2.1.
Använd länkarna i tabellen för att lära dig mer om varje modell och bläddra i API-referenserna:
Modell | Description | Utvecklingsalternativ |
---|---|---|
Layoutanalys | Extrahering och analys av text, urvalsmarkeringar, tabeller och koordinater för avgränsningsrutor från formulär och dokument. | |
Anpassad modell | Extrahering och analys av data från formulär och dokument som är specifika för olika affärsdata och användningsfall. | |
Fakturamodell | Automatiserad databearbetning och extrahering av viktig information från försäljningsfakturor. | |
Kvittomodell | Automatiserad databearbetning och extrahering av viktig information från försäljningskvitton. | |
Modell för identitetsdokument (ID) | Automatiserad databehandling och extrahering av viktig information från amerikanska körkort och internationella pass. | |
Visitkortsmodell | Automatiserad databehandling och extrahering av viktig information från visitkort. |
Datasekretess och säkerhet
Som med alla AI-tjänster bör utvecklare som använder Formigenkänning-tjänsten vara medvetna om Microsofts principer för kunddata. Se sidan Data, sekretess och säkerhet för Formigenkänning.
Nästa steg
Prova att bearbeta dina egna formulär och dokument med Formigenkänning Studio
Slutför en Formigenkänning snabbstart och kom igång med att skapa en app för dokumentbearbetning på det utvecklingsspråk som du väljer.
Prova att bearbeta dina egna formulär och dokument med Formigenkänning exempeletikettverktyget
Slutför en Formigenkänning snabbstart och kom igång med att skapa en app för dokumentbearbetning på det utvecklingsspråk som du väljer.