Vad är Azure AI dokumentintelligens?

Viktigt!

  • Versioner av den offentliga förhandsversionen av Document Intelligence ger tidig åtkomst till funktioner som är i aktiv utveckling.
  • Funktioner, metoder och processer kan ändras, före allmän tillgänglighet (GA), baserat på användarfeedback.
  • Den offentliga förhandsversionen av Dokumentinformationsklientbiblioteken är som standard REST API version 2024-02-29-preview.
  • Förhandsversion 2024-02-29-preview är för närvarande endast tillgänglig i följande Azure-regioner:
  • USA, östra
  • USA, västra 2
  • Europa, västra

Det här innehållet gäller för:Bockmarkeringv4.0 (förhandsversion) | Tidigare versioner:blå bockmarkeringv3.1 (GA)blå bockmarkeringv3.0 (GA)blå bockmarkeringv2.1 (GA)

Det här innehållet gäller för:Bockmarkeringv3.1 (GA) | Senaste version:lila bockmarkeringv4.0 (förhandsversion) | Tidigare versioner:blå bockmarkeringv3.0blå bockmarkeringv2.1

Det här innehållet gäller för:Bockmarkeringv3.0 (GA) | Senaste versionerna:lila bockmarkeringv4.0 (förhandsversion)lila bockmarkeringv3.1 | Tidigare version:blå bockmarkeringv2.1

Det här innehållet gäller för:Bockmarkeringv2.1 | Senaste version:blå bockmarkeringv4.0 (förhandsversion)

Kommentar

Formigenkänning är nu Azure AI Document Intelligence!

  • Från och med juli 2023 omfattar Azure AI-tjänster alla vad som tidigare kallades Cognitive Services och Azure Applied AI Services.
  • Det finns inga ändringar i prissättningen.
  • Namnen Cognitive Services och Azure Applied AI fortsätter att användas i Azure-fakturering, kostnadsanalys, prislista och pris-API:er.
  • Det finns inga icke-bakåtkompatibla ändringar i programprogrammeringsgränssnitt (API:er) eller SDK:er före och inklusive v3.1. Från och med v4.0 uppdateras API:er och SDK:er till Dokumentinformation.
  • Vissa plattformar väntar fortfarande på uppdatering av namnbytet. Alla omnämnanden av Formigenkänning eller dokumentinformation i vår dokumentation avser samma Azure-tjänst.

Azure AI Document Intelligence är en molnbaserad Azure AI-tjänst som gör att du kan skapa intelligenta lösningar för dokumentbearbetning. Enorma mängder data, som omfattar en mängd olika datatyper, lagras i formulär och dokument. Med Dokumentinformation kan du effektivt hantera den hastighet med vilken data samlas in och bearbetas och är nyckeln till förbättrade åtgärder, välgrundade datadrivna beslut och upplyst innovation.

| ✔️ Modeller för dokumentanalys | ✔️ Fördefinierade modeller | ✔️ Anpassade modeller |

Modeller för dokumentanalys

Dokumentanalysmodeller möjliggör textextrahering från formulär och dokument och returnerar strukturerat affärsklart innehåll som är redo för organisationens åtgärd, användning eller förlopp.


Läs | Extrahera tryckt
och handskriven text.


Layout | Extrahera text,
tabeller och dokumentstruktur.


Läs | Extrahera tryckt
och handskriven text.


Layout | Extrahera text,
tabeller och dokumentstruktur.


Allmänt dokument | Extrahera text-,
struktur- och nyckel/värde-par.

Inbyggda modeller

Med fördefinierade modeller kan du lägga till intelligent dokumentbearbetning i dina appar och flöden utan att behöva träna och skapa egna modeller.


Faktura | Extrahera kund-
och leverantörsinformation.


Kvitto | Extrahera information om försäljningstransaktioner
.


Identitet | Extrahera identifierings-
och verifieringsinformation.


1003 EULA | Extrahera inteckningsinformation.


Formulär 1008 | Extrahera inteckningsinformation.


Utlysning | Extrahera inteckningsinformation.


Sjukförsäkringskort | Extrahera sjukförsäkringsinformation
.


Kontrakt | Extrahera avtals-
och partinformation.


Kredit-/debetkort | Extrahera information från bankkort.


Äktenskapscertifikat | Extrahera information från äktenskapscertifikat.


Formulär för US Tax W-2 | Extrahera information om beskattningsbar
kompensation.


Formulär för US Tax 1098 | Extrahera information om bolåneräntor.


Formulär för US Tax 1098-E | Extrahera ränteinformation för studielån.


Formulär för US Tax 1098-T | Extrahera kvalificerad undervisningsinformation.


Formulär för US Tax 1099 | Extrahera information från varianter av 1099-formuläret.


Formulär för US Tax 1040 | Extrahera information från varianter av 1040-formuläret.


Faktura | Extrahera kund-
och leverantörsinformation.


Kvitto | Extrahera information om försäljningstransaktioner
.


Identitet | Extrahera identifierings-
och verifieringsinformation.


Sjukförsäkringskort | Extrahera sjukförsäkringsinformation.


Visitkort | Extrahera kontaktuppgifter för företag.


Kontrakt | Extrahera avtals-
och partinformation.


Formulär för US Tax W-2 | Extrahera information om beskattningsbar
kompensation.


Formulär för US Tax 1098 | Extrahera information om bolåneräntor.


Formulär för US Tax 1098-E | Extrahera ränteinformation för studielån.


Formulär för US Tax 1098-T | Extrahera kvalificerad undervisningsinformation.

Anpassade modeller

  • Anpassade modeller tränas med dina märkta datauppsättningar för att extrahera distinkta data från formulär och dokument, specifika för dina användningsfall.
  • Fristående anpassade modeller kan kombineras för att skapa sammansatta modeller.
  • Extraheringsmodeller
    ✔️ Anpassade extraheringsmodeller tränas att extrahera märkta fält från dokument.


Anpassad mall | Extrahera data från statiska layouter.


Anpassad neural | Extrahera data från dokument av blandad typ.


Anpassad sammansatt | Extrahera data med hjälp av en samling modeller.

  • Klassificeringsmodell
    ✔️ Anpassade klassificerare identifierar dokumenttyper innan de anropar en extraheringsmodell.


Anpassad klassificerare | Identifiera avsedda dokumenttyper (klasser)
innan du anropar en extraheringsmodell.

Tilläggsfunktioner

Dokumentinformation stöder valfria funktioner som kan aktiveras och inaktiveras beroende på scenariot för dokumentextrahering. Följande tilläggsfunktioner är tillgängliga för 2023-07-31 (GA) och senare versioner:

Dokumentinformation stöder valfria funktioner som kan aktiveras och inaktiveras beroende på scenariot för dokumentextrahering. Följande tilläggsfunktioner är tillgängliga för2024-02-29-preview, 2023-10-31-previewoch senare versioner:

Analysfunktioner

Model ID Extrahering av innehåll Frågefält Punkterna Styckeroller Markeringsmarkeringar Tabeller Nyckel/värde-par Språk Streckkoder Dokumentanalys Formler* Formatmallsteckensnitt* Högupplöst*
prebuilt-read O O O O O
fördefinierad layout O O O O O
prebuilt-document O O O O O
prebuilt-businessCard
prebuilt-contract O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
fördefinierad faktura O O O O O O
fördefinierad kvitto O O O O O
prebuilt-marriageCertificate.us O O O O O
prebuilt-creditCard O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(variationer) O O O O O
prebuilt-tax.us.1040(variations) O O O O O
{ customModelName } O O O O O

√ - Aktiverad
O - Valfritt
* - Premium-funktioner medför extra kostnader

Modeller och utvecklingsalternativ

Kommentar

Följande dokumenttolkningsmodeller och utvecklingsalternativ stöds av Document Intelligence Service v3.0.

Du kan använda Dokumentinformation för att automatisera dokumentbearbetning i program och arbetsflöden, förbättra datadrivna strategier och utöka funktionerna för dokumentsökning. Använd länkarna i tabellen för att lära dig mer om varje modell och bläddra bland utvecklingsalternativ.

Läsa

Skärmbild av Läs modellanalys med Document Intelligence Studio.

Model ID beskrivning Användningsfall för Automation Utvecklingsalternativ
prebuilt-read ● Extrahera text från dokument.
Extrahering av data
● Digitalisera alla dokument.
● Efterlevnad och granskning.
● Bearbeta handskrivna anteckningar före översättning.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Layout

Skärmbild av layoutmodellanalysen med Document Intelligence Studio.

Model ID beskrivning Användningsfall för Automation Utvecklingsalternativ
fördefinierad layout ● Extrahera text- och layoutinformation från dokument.
Extrahering av data
● Dokumentera indexering och hämtning efter struktur.
● Analys av finansiella och medicinska rapporter.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Allmänt dokument (inaktuellt 2023-10-31-preview)

Skärmbild av analys av allmän dokumentmodell med hjälp av Document Intelligence Studio.

Model ID beskrivning Användningsfall för Automation Utvecklingsalternativ
prebuilt-document ● Extrahera text,layout och nyckel/värde-par från dokument.
Extrahering av data och fält
● Extrahering av nyckel/värde-par.
● Formulärbearbetning.
● Undersökningsdatainsamling och analys.
Document Intelligence Studio
REST API

Faktura

Skärmbild av fakturamodellanalys med Document Intelligence Studio.

Model ID beskrivning Användningsfall för Automation Utvecklingsalternativ
fördefinierad faktura ● Extrahera viktig information från fakturor.
Extrahering av data och fält
● Leverantörsreskontrabearbetning.
● Automatisk skatteregistrering och rapportering.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Kvitto

Skärmbild av kvittomodellanalys med Document Intelligence Studio.

Model ID beskrivning Användningsfall för Automation Utvecklingsalternativ
fördefinierad kvitto ● Extrahera nyckelinformation från kvitton.
Data och fältextrahering
● Kvittomodell v3.0 stöder bearbetning av hotellkvitton på en sida.
● Kostnadshantering.
● Dataanalys av konsumentbeteende.
● Kundlojalitetsprogram.
● Returbearbetning av varor.
● Automatisk skatteregistrering och rapportering.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Identitet (ID)

Skärmbild av ID-dokumentmodellanalys (ID) med Document Intelligence Studio.

Model ID beskrivning Användningsfall för Automation Utvecklingsalternativ
prebuilt-idDocument ● Extrahera nyckelinformation från pass och ID-kort.
Dokumenttyper
● Extrahera godkännanden, begränsningar och fordonsklassificeringar från amerikanska körkort.
● Känna till kundens (KYC) riktlinjer för finansiella tjänster efterlevnad.
● Hantering av medicinska konton.
● Identitetskontroller och gatewayer.
● Hotellregistrering.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Sjukförsäkringskortet

Skärmbild av modellanalys av sjukförsäkringskort med hjälp av Document Intelligence Studio.

Model ID beskrivning Användningsfall för Automation Utvecklingsalternativ
prebuilt-healthInsuranceCard.us ● Extrahera viktig information från amerikanska sjukförsäkringskort.
Extrahering av data och fält
● Verifiering av täckning och berättigande.
● Förutsägande modellering.
● Värdebaserad analys.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Kontraktsmodell

Skärmbild av extrahering av kontraktsmodell med hjälp av Document Intelligence Studio.

Model ID beskrivning Utvecklingsalternativ
prebuilt-contract Extrahera avtals- och partinformation. Document Intelligence Studio
REST API

Us Tax W-2-modell

Skärmbild av W-2-modellanalys med Document Intelligence Studio.

Model ID beskrivning Användningsfall för Automation Utvecklingsalternativ
prebuilt-tax.us.W-2 ● Extrahera viktig information från IRS US W2 skatteformulär (år 2018-2021).
Extrahering av data och fält
● Automatiserad hantering av skattedokument.
● Behandling av inteckningslån.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Formulär för amerikansk skatt 1098

Skärmbild av skatteformuläret US 1098 som analyserats i Document Intelligence Studio.

Model ID beskrivning Utvecklingsalternativ
prebuilt-tax.us.1098 Extrahera information och information om inteckningsränta. Document Intelligence Studio
REST API

Formulär för amerikansk skatt 1098-E

Skärmbild av skatteformuläret US 1098-E som analyserats i Document Intelligence Studio.

Model ID beskrivning Utvecklingsalternativ
prebuilt-tax.us.1098E Extrahera studielånsinformation och information. Document Intelligence Studio
REST API

Us tax 1098-T-formulär

Skärmbild av skatteformuläret US 1098-T som analyserats i Document Intelligence Studio.

Model ID beskrivning Utvecklingsalternativ
prebuilt-tax.us.1098T Extrahera undervisningsinformation och information. Document Intelligence Studio
REST API

Formulär för AMERIKANSK skatt 1099 (och varianter)

Skärmbild av skatteformuläret US 1099 som analyserats i Document Intelligence Studio.

Model ID beskrivning Utvecklingsalternativ
prebuilt-tax.us.1099(Variationer) Extrahera information från 1099-formulärvariationer. Document Intelligence Studio
REST API

Visitkort

Skärmbild av analys av visitkortsmodeller med Document Intelligence Studio.

Model ID beskrivning Användningsfall för Automation Utvecklingsalternativ
prebuilt-businessCard ● Extrahera viktig information från visitkort.
Extrahering av data och fält
● Säljledning och marknadsföringsledning. Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Översikt över anpassad modell

Skärmbild av anpassad modellträning med Document Intelligence Studio.

Om beskrivning Användningsfall för Automation Utvecklingsalternativ
Anpassad modell Extraherar information från formulär och dokument till strukturerade data baserat på en modell som skapats från en uppsättning representativa utbildningsdokumentuppsättningar. Extrahera distinkta data från formulär och dokument som är specifika för ditt företag och användningsfall. Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Anpassad mall

Skärmbild av modellanalys för anpassade mallar med Document Intelligence Studio.

Kommentar

Om du vill träna en anpassad mallmodell anger du egenskapen buildMode till template. Mer information finns iTräna en mallmodell

Om beskrivning Användningsfall för Automation Utvecklingsalternativ
Anpassad mallmodell Den anpassade mallmodellen extraherar märkta värden och fält från strukturerade och halvstrukturerade dokument.
Extrahera viktiga data från mycket strukturerade dokument med definierade visuella mallar eller vanliga visuella layouter, formulär. Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK

Anpassad neural

Skärmbild av anpassad analys av neurala modeller med hjälp av Document Intelligence Studio.

Kommentar

Om du vill träna en anpassad neural modell anger du egenskapen buildMode till neural. Mer information finns iTräna en neural modell

Om beskrivning Användningsfall för Automation Utvecklingsalternativ
Anpassad neural modell Den anpassade neurala modellen används för att extrahera märkta data från strukturerade (undersökningar, enkäter), halvstrukturerade (fakturor, inköpsorder) och ostrukturerade dokument (kontrakt, bokstäver). Extrahera textdata, kryssrutor och tabellfält från strukturerade och ostrukturerade dokument. Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Anpassad sammansatt

Skärmbild av listan Över sammansatta anpassade modeller i Document Intelligence Studio.

Om beskrivning Användningsfall för Automation Utvecklingsalternativ
Sammansatta anpassade modeller En sammansatt modell skapas genom att ta en samling anpassade modeller och tilldela dem till en enda modell som skapats från dina formulärtyper. Användbart när du tränar flera modeller och vill gruppera dem för att analysera liknande formulärtyper som inköpsorder. Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Anpassad klassificeringsmodell

{alt-text}

Om beskrivning Användningsfall för Automation Utvecklingsalternativ
Sammansatt klassificeringsmodell Anpassade klassificeringsmodeller kombinerar layout- och språkfunktioner för att identifiera, identifiera och klassificera dokument i en indatafil. ● En låneansökan paketerad med ansökningsformulär, lönebesked och bankutdrag.
● En samling skannade fakturor.
Document Intelligence Studio
REST API

Azure AI Document Intelligence är en molnbaserad Azure AI-tjänst som utvecklare kan använda för att skapa intelligenta lösningar för dokumentbearbetning. Dokumentinformation tillämpar maskininlärningsbaserad optisk teckenigenkänning (OCR) och tekniker för dokumenttolkning för att extrahera text, tabeller, struktur och nyckel/värde-par från dokument. Du kan också märka och träna anpassade modeller för att automatisera dataextrahering från strukturerade, halvstrukturerade och ostrukturerade dokument. Mer information om varje modell finns i artiklarna Begrepp:

Modelltyp Modellnamn
Modell för dokumentanalys Layoutanalysmodell
Fördefinierade modeller Fakturamodell
Kvittomodell
Identitetsdokumentmodell
(ID) ● Visitkortsmodell
Anpassade modeller Anpassad modell
Sammansatt modell

Det här innehållet gäller för:Bockmarkeringv2.1 | Senaste version:blå bockmarkeringv4.0 (förhandsversion)

Modeller och utvecklingsalternativ för dokumentinformation

Dricks

  • För en förbättrad upplevelse och avancerad modellkvalitet kan du prova Document Intelligence v3.0 Studio.
  • v3.0 Studio stöder alla modeller som tränats med v2.1-märkta data.
  • Du kan läsa api-migreringsguiden för detaljerad information om migrering från v2.1 till v3.0.

Kommentar

Följande modeller och utvecklingsalternativ stöds av Document Intelligence Service v2.1.

Använd länkarna i tabellen för att lära dig mer om varje modell och bläddra i API-referenserna:

Modell beskrivning Utvecklingsalternativ
Layoutanalys Extrahering och analys av text, markeringsmarkeringar, tabeller och koordinater för avgränsningsrutor från formulär och dokument. Etikettverktyg
för dokumentinformation● REST API
SDK
för klientbiblioteket● Docker-container för dokumentinformation
Anpassad modell Extrahering och analys av data från formulär och dokument som är specifika för distinkta affärsdata och användningsfall. Etikettverktyg
för dokumentinformation● REST API
Exempeletikettverktyg
Docker-container för dokumentinformation
Fakturamodell Automatiserad databearbetning och extrahering av viktig information från försäljningsfakturor. Etikettverktyg
för dokumentinformation● REST API
SDK
för klientbiblioteket● Docker-container för dokumentinformation
Kvittomodell Automatiserad databehandling och extrahering av viktig information från försäljningskvitton. Etikettverktyg
för dokumentinformation● REST API
SDK
för klientbiblioteket● Docker-container för dokumentinformation
Modell för identitetsdokument (ID) Automatiserad databehandling och extrahering av viktig information från amerikanska körkort och internationella pass. Etikettverktyg
för dokumentinformation● REST API
SDK
för klientbiblioteket● Docker-container för dokumentinformation
Visitkortsmodell Automatiserad databehandling och extrahering av viktig information från visitkort. Etikettverktyg
för dokumentinformation● REST API
SDK
för klientbiblioteket● Docker-container för dokumentinformation

Datasekretess och säkerhet

Precis som med alla AI-tjänster bör utvecklare som använder document intelligence-tjänsten vara medvetna om Microsofts principer för kunddata. Se sidan Data, sekretess och säkerhet för Dokumentinformation .

Nästa steg

  • Prova att bearbeta dina egna formulär och dokument med verktyget Exempeletiketter för dokumentinformation.

  • Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.