Kvittomodell för dokumentinformation

Viktigt!

  • Versioner av den offentliga förhandsversionen av Document Intelligence ger tidig åtkomst till funktioner som är i aktiv utveckling.
  • Funktioner, metoder och processer kan ändras, före allmän tillgänglighet (GA), baserat på användarfeedback.
  • Den offentliga förhandsversionen av Dokumentinformationsklientbiblioteken är som standard REST API version 2024-02-29-preview.
  • Förhandsversion 2024-02-29-preview är för närvarande endast tillgänglig i följande Azure-regioner:
  • USA, östra
  • USA, västra 2
  • Europa, västra

Det här innehållet gäller för:Bockmarkeringv4.0 (förhandsversion) | Tidigare versioner:blå bockmarkeringv3.1 (GA)blå bockmarkeringv3.0 (GA)blå bockmarkeringv2.1 (GA)

Det här innehållet gäller för:Bockmarkeringv3.1 (GA) | Senaste version:lila bockmarkeringv4.0 (förhandsversion) | Tidigare versioner:blå bockmarkeringv3.0blå bockmarkeringv2.1

Det här innehållet gäller för:Bockmarkeringv3.0 (GA) | Senaste versionerna:lila bockmarkeringv4.0 (förhandsversion)lila bockmarkeringv3.1 | Tidigare version:blå bockmarkeringv2.1

Det här innehållet gäller för:Bockmarkeringv2.1 | Senaste version:blå bockmarkeringv4.0 (förhandsversion)

Kvittomodellen för dokumentinformation kombinerar kraftfulla OCR-funktioner (Optisk teckenigenkänning) med djupinlärningsmodeller för att analysera och extrahera viktig information från försäljningskvitton. Kvitton kan vara av olika format och kvalitet, inklusive tryckta och handskrivna kvitton. API:et extraherar viktig information som handelsnamn, handelstelefonnummer, transaktionsdatum, skatt och transaktionssumma och returnerar strukturerade JSON-data.

Kvittotyper som stöds:

  • Termisk
  • Kreditkort
  • Bensin
  • Parkering
  • Hotell
  • Transport
  • Kommunikation
  • Underhållning
  • Flyg
  • Utbildning
  • Apotek/Medicinsk

Extrahering av kvittodata

Kvitto digitalisering omfattar omvandlingen av olika typer av kvitton, inklusive skannade, fotograferade och tryckta kopior, till ett digitalt format för strömlinjeformad nedströmsbearbetning. Exempel är kostnadshantering, analys av konsumentbeteende, skatteautomation osv. Med hjälp av teknik för dokumentinformation med OCR (optisk teckenigenkänning) kan du extrahera och tolka data från dessa olika kvittoformat. Dokumentinformationsbearbetning förenklar konverteringsprocessen men minskar också avsevärt den tid och det arbete som krävs, vilket underlättar effektiv datahantering och hämtning.

Exempelkvitto som bearbetas med Document Intelligence Studio:

Skärmbild av ett exempelkvitto som bearbetas i Document Intelligence Studio.

Exempelkvitto som bearbetas med exempeletikettverktyget för dokumentinformation:

Skärmbild av ett exempelkvitto som bearbetats med verktyget Formulärexempeletiketter.

Utvecklingsalternativ

Document Intelligence v4.0 (2024-02-29-preview, 2023-10-31-preview) stöder följande verktyg, program och bibliotek:

Funktion Resurser Model ID
Kvittomodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
fördefinierad kvitto

Document Intelligence v3.1 stöder följande verktyg, program och bibliotek:

Funktion Resurser Model ID
Kvittomodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
fördefinierad kvitto

Document Intelligence v3.0 stöder följande verktyg, program och bibliotek:

Funktion Resurser Model ID
Kvittomodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
fördefinierad kvitto

Document Intelligence v2.1 stöder följande verktyg, program och bibliotek:

Funktion Resurser
Kvittomodell Etikettverktyg
för dokumentinformation• REST API
Klientbiblioteks-SDK
Docker-container för dokumentinformation

Indatakrav

  • För bästa resultat anger du ett tydligt foto eller en genomsökning av hög kvalitet per dokument.

  • Filformat som stöds:

    Modell PDF Bild:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) och HTML
    Läsa
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Allmänt dokument
    Inbyggda
    Anpassad extrahering
    Anpassad klassificering ✔ (2024-02-29-preview)
  • För PDF och TIFF kan upp till 2 000 sidor bearbetas (med en kostnadsfri nivåprenumeration bearbetas endast de två första sidorna).

  • Filstorleken för att analysera dokument är 500 MB för den betalda nivån (S0) och 4 MB för den kostnadsfria nivån (F0).

  • Bilddimensionerna måste vara mellan 50 x 50 bildpunkter och 10 000 px x 10 000 bildpunkter.

  • Om dina PDF-filer är låsta med lösenord måste du ta bort låset innan du skickar filerna.

  • Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar ungefär 8-punkttext vid 150 punkter per tum (DPI).

  • För anpassad modellträning är det maximala antalet sidor för träningsdata 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.

    • För anpassad extraheringsmodellträning är den totala storleken på träningsdata 50 MB för mallmodellen och 1G-MB för den neurala modellen.

    • För anpassad klassificeringsmodellträning är 1GB den totala storleken på träningsdata med högst 10 000 sidor.

  • Filformat som stöds: JPEG, PNG, PDF och TIFF.
  • Sidtillägg som stöds för PDF och TIFF: Dokumentinformation kan bearbeta upp till 2 000 sidor för standardprenumeranter eller endast de två första sidorna för kostnadsfria prenumeranter.
  • Filstorlek som stöds: mindre än 50 MB; minsta bildpunkter 50 x 50 px; maximalt antal bildpunkter 10 000 x 10 000 px.

Extrahering av kvittomodelldata

Se hur Dokumentinformation extraherar data, inklusive tid och datum för transaktioner, handelsinformation och beloppssummor från kvitton. Du behöver följande resurser:

  • En Azure-prenumeration – du kan skapa en kostnadsfritt.

  • En instans av dokumentinformation i Azure-portalen. Du kan använda den kostnadsfria prisnivån (F0) för att prova tjänsten. När resursen har distribuerats väljer du Gå till resurs för att hämta din nyckel och slutpunkt.

Skärmbild av nycklar och slutpunktsplats i Azure-portalen.

Kommentar

Document Intelligence Studio är tillgängligt med v3.1- och v3.0-API:er och senare versioner.

  1. På startsidan för Document Intelligence Studio väljer du Kvitton.

  2. Du kan analysera exempelkvittot eller ladda upp dina egna filer.

  3. Välj knappen Kör analys och konfigurera vid behov alternativen Analysera:

    Skärmbild av knapparna Kör analys och Analysera alternativ i Document Intelligence Studio.

Exempeletikettverktyg för dokumentinformation

  1. Gå till exempelverktyget för dokumentinformation.

  2. På exempelverktygets startsida väljer du panelen Använd fördefinierad modell för att hämta data .

    Skärmbild av layoutmodellen analyserar resultatprocessen.

  3. Välj den formulärtyp som ska analyseras från den nedrullningsbara menyn.

  4. Välj en URL för filen som du vill analysera från alternativen nedan:

  5. I fältet Källa väljer du URL på den nedrullningsbara menyn, klistrar in den valda URL:en och väljer knappen Hämta .

    Skärmbild av listrutan källplats.

  6. I fältet För dokumentinformationstjänstens slutpunkt klistrar du in slutpunkten som du fick med din Document Intelligence-prenumeration.

  7. I nyckelfältet klistrar du in den nyckel som du fick från dokumentinformationsresursen.

    Skärmbild av listrutan select-form-type.

  8. Välj Kör analys. Verktyget Exempeletiketter för dokumentinformation anropar API:et Analysera fördefinierat och analyserar dokumentet.

  9. Visa resultaten – se nyckel/värde-par extraherade, radobjekt, markerad text som extraherats och tabeller har identifierats.

    Skärmbild av layoutmodellen analyserar resultatåtgärden.

Kommentar

Verktyget Exempeletiketter stöder inte BMP-filformatet. Det här är en begränsning för verktyget, inte dokumentunderrättelsetjänsten.

Språk och nationella inställningar som stöds

Se sidan Språkstöd – fördefinierade modeller för en fullständig lista över språk som stöds.

Fältextrahering

Namn Type Beskrivning Standardiserade utdata
ReceiptType String Typ av försäljningskvitto Specificerad
MerchantName String Namnet på den handlare som utfärdar kvittot
Merchant Telefon Number phoneNumber Listat telefonnummer för säljare +1 xxx xxx xxxx
MerchantAddress String Angiven adress till handlaren
TransactionDate Datum Datum då kvittot utfärdades åååå-mm-dd
TransactionTime Tid Tid då kvittot utfärdades hh-mm-ss (24-timmars)
Totalt Nummer (USD) Fullständig transaktionssumma för kvitto Flyttal med två decimaler
Delsumma Nummer (USD) Delsumma av kvittot, ofta innan skatter tillämpas Flyttal med två decimaler
Moms Nummer (USD) Total skatt vid kvitto (ofta moms eller motsvarande). Har bytt namn till "TotalTax" i 2022-06-30-versionen. Flyttal med två decimaler
Dricks Nummer (USD) Tips som ingår av köparen Flyttal med två decimaler
Artiklar Objektmatris Extraherade radobjekt med namn, kvantitet, enhetspris och totalt pris extraherat
Name String Objektbeskrivning. Har bytt namn till "Description" i 2022-06-30-versionen.
Kvantitet Antal Kvantitet för varje objekt Flyttal med två decimaler
Pris Antal Individuellt pris för varje artikelenhet Flyttal med två decimaler
TotalPrice Antal Totalt pris för radartikel Flyttal med två decimaler

Dokumentinformation v3.0 och senare versioner introducerar flera nya funktioner. Förutom termiska kvitton stöder kvittomodellen bearbetning av hotellkvitton på en sida och extrahering av skatteinformation för alla kvittotyper.

Dokumentinformation v4.0 och senare versioner introducerar stöd för valuta för alla prisrelaterade fält för termiska och hotellkvitton.

Kvitto

Fält Type Beskrivning Exempel
MerchantName string Namnet på den handlare som utfärdar kvittot Contoso
MerchantPhoneNumber phoneNumber Listat telefonnummer för säljare 987-654-3210
MerchantAddress address Angiven adress till handlaren 123 Main St. Redmond, Washington 98052
Total number Fullständig transaktionssumma för kvitto $14.34
TransactionDate date Datum då kvittot utfärdades den 6 juni 2019
TransactionTime time Tid då kvittot utfärdades 16:49
Subtotal number Delsumma av kvittot, ofta innan skatter tillämpas $12.34
TotalTax number Skatt vid kvitto, ofta moms eller motsvarande $2,00
Tip number Tips som ingår av köparen 1,00 USD
Items array
Items.* object Extraherat radobjekt 1
Surface Pro 6
999,00 USD
999,00 USD
Items.*.TotalPrice number Totalt pris för radartikel 999,00 USD
Items.*.Description string Artikelbeskrivning Surface Pro 6
Items.*.Quantity number Kvantitet för varje objekt 1
Items.*.Price number Individuellt pris för varje artikelenhet 999,00 USD
Items.*.ProductCode string Produktkod, produktnummer eller SKU som är associerad med det specifika radobjektet A123
Items.*.QuantityUnit string Kvantitetsenhet för varje objekt
TaxDetails array
TaxDetails.* object Extraherat radobjekt 1
Surface Pro 6
999,00 USD
999,00 USD
TaxDetails.*.Amount currency Skatteinformationens belopp 999,00 USD

receipt.retailMeal

Fält Type Beskrivning Exempel
MerchantName string Namnet på den handlare som utfärdar kvittot Contoso
MerchantPhoneNumber phoneNumber Listat telefonnummer för säljare 987-654-3210
MerchantAddress address Angiven adress till handlaren 123 Main St. Redmond, Washington 98052
Total number Fullständig transaktionssumma för kvitto $14.34
TransactionDate date Datum då kvittot utfärdades den 6 juni 2019
TransactionTime time Tid då kvittot utfärdades 16:49
Subtotal number Delsumma av kvittot, ofta innan skatter tillämpas $12.34
TotalTax number Skatt vid kvitto, ofta moms eller motsvarande $2,00
Tip number Tips som ingår av köparen 1,00 USD
Items array
Items.* object Extraherat radobjekt 1
Surface Pro 6
999,00 USD
999,00 USD
Items.*.TotalPrice number Totalt pris för radartikel 999,00 USD
Items.*.Description string Artikelbeskrivning Surface Pro 6
Items.*.Quantity number Kvantitet för varje objekt 1
Items.*.Price number Individuellt pris för varje artikelenhet 999,00 USD
Items.*.ProductCode string Produktkod, produktnummer eller SKU som är associerad med det specifika radobjektet A123
Items.*.QuantityUnit string Kvantitetsenhet för varje objekt
TaxDetails array
TaxDetails.* object Extraherat radobjekt 1
Surface Pro 6
999,00 USD
999,00 USD
TaxDetails.*.Amount currency Skatteinformationens belopp 999,00 USD

receipt.creditCard

Fält Type Beskrivning Exempel
MerchantName string Namnet på den handlare som utfärdar kvittot Contoso
MerchantPhoneNumber phoneNumber Listat telefonnummer för säljare 987-654-3210
MerchantAddress address Angiven adress till handlaren 123 Main St. Redmond, Washington 98052
Total number Fullständig transaktionssumma för kvitto $14.34
TransactionDate date Datum då kvittot utfärdades den 6 juni 2019
TransactionTime time Tid då kvittot utfärdades 16:49
Subtotal number Delsumma av kvittot, ofta innan skatter tillämpas $12.34
TotalTax number Skatt vid kvitto, ofta moms eller motsvarande $2,00
Tip number Tips som ingår av köparen 1,00 USD
Items array
Items.* object Extraherat radobjekt 1
Surface Pro 6
999,00 USD
999,00 USD
Items.*.TotalPrice number Totalt pris för radartikel 999,00 USD
Items.*.Description string Artikelbeskrivning Surface Pro 6
Items.*.Quantity number Kvantitet för varje objekt 1
Items.*.Price number Individuellt pris för varje artikelenhet 999,00 USD
Items.*.ProductCode string Produktkod, produktnummer eller SKU som är associerad med det specifika radobjektet A123
Items.*.QuantityUnit string Kvantitetsenhet för varje objekt
TaxDetails array
TaxDetails.* object Extraherat radobjekt 1
Surface Pro 6
999,00 USD
999,00 USD
TaxDetails.*.Amount currency Skatteinformationens belopp 999,00 USD

receipt.gas

Fält Type Beskrivning Exempel
MerchantName string Namnet på den handlare som utfärdar kvittot Contoso
MerchantPhoneNumber phoneNumber Listat telefonnummer för säljare 987-654-3210
MerchantAddress address Angiven adress till handlaren 123 Main St. Redmond, Washington 98052
Total number Fullständig transaktionssumma för kvitto $14.34
TransactionDate date Datum då kvittot utfärdades den 6 juni 2019
TransactionTime time Tid då kvittot utfärdades 16:49
Subtotal number Delsumma av kvittot, ofta innan skatter tillämpas $12.34
TotalTax number Skatt vid kvitto, ofta moms eller motsvarande $2,00
Tip number Tips som ingår av köparen 1,00 USD
Items array
Items.* object Extraherat radobjekt 1
Surface Pro 6
999,00 USD
999,00 USD
Items.*.TotalPrice number Totalt pris för radartikel 999,00 USD
Items.*.Description string Artikelbeskrivning Surface Pro 6
Items.*.Quantity number Kvantitet för varje objekt 1
Items.*.Price number Individuellt pris för varje artikelenhet 999,00 USD
Items.*.ProductCode string Produktkod, produktnummer eller SKU som är associerad med det specifika radobjektet A123
Items.*.QuantityUnit string Kvantitetsenhet för varje objekt
TaxDetails array
TaxDetails.* object Extraherat radobjekt 1
Surface Pro 6
999,00 USD
999,00 USD
TaxDetails.*.Amount currency Skatteinformationens belopp 999,00 USD

receipt.parking

Fält Type Beskrivning Exempel
MerchantName string Namnet på den handlare som utfärdar kvittot Contoso
MerchantPhoneNumber phoneNumber Listat telefonnummer för säljare 987-654-3210
MerchantAddress address Angiven adress till handlaren 123 Main St. Redmond, Washington 98052
Total number Fullständig transaktionssumma för kvitto $14.34
TransactionDate date Datum då kvittot utfärdades den 6 juni 2019
TransactionTime time Tid då kvittot utfärdades 16:49
Subtotal number Delsumma av kvittot, ofta innan skatter tillämpas $12.34
TotalTax number Skatt vid kvitto, ofta moms eller motsvarande $2,00
Tip number Tips som ingår av köparen 1,00 USD
Items array
Items.* object Extraherat radobjekt 1
Surface Pro 6
999,00 USD
999,00 USD
Items.*.TotalPrice number Totalt pris för radartikel 999,00 USD
Items.*.Description string Artikelbeskrivning Surface Pro 6
Items.*.Quantity number Kvantitet för varje objekt 1
Items.*.Price number Individuellt pris för varje artikelenhet 999,00 USD
Items.*.ProductCode string Produktkod, produktnummer eller SKU som är associerad med det specifika radobjektet A123
Items.*.QuantityUnit string Kvantitetsenhet för varje objekt
TaxDetails array
TaxDetails.* object Extraherat radobjekt 1
Surface Pro 6
999,00 USD
999,00 USD
TaxDetails.*.Amount currency Skatteinformationens belopp 999,00 USD

receipt.hotel

Fält Type Beskrivning Exempel
MerchantName string Namnet på den handlare som utfärdar kvittot Contoso
MerchantPhoneNumber phoneNumber Listat telefonnummer för säljare 987-654-310
MerchantAddress address Angiven adress till handlaren 123 Main St. Redmond, Washington 98052
Total number Fullständig transaktionssumma för kvitto $14.34
ArrivalDate date Ankomstdatum 27Mar21
DepartureDate date Avresedatum 28Mar21
Currency string Valutaenhet för mottagande belopp (ISO 4217) eller "MIXED" om flera värden hittas USD
MerchantAliases array
MerchantAliases.* string Alternativt namn på handlaren Contoso (R)
Items array
Items.* object Extraherat radobjekt 1
Surface Pro 6
999,00 USD
999,00 USD
Items.*.TotalPrice number Totalt pris för radartikel 999,00 USD
Items.*.Description string Artikelbeskrivning Rumsavgift
Items.*.Date date Objektdatum 27Mar21
Items.*.Category string Objektkategori Rum

Migreringsguide och REST API v3.1

  • Följ migreringsguiden för Document Intelligence v3.1 för att lära dig hur du använder v3.1-versionen i dina program och arbetsflöden.

Nästa steg

  • Prova att bearbeta dina egna formulär och dokument med Document Intelligence Studio.

  • Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.

  • Prova att bearbeta dina egna formulär och dokument med verktyget Exempeletiketter för dokumentinformation.

  • Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.